Do Kinect ao InnerEye - Como a Microsoft está sobrecarregando a tecnologia de jogos com inteligência artificial para ajudar a diagnosticar o câncer
NotíciaNenhuma tecnologia única existe no vácuo. O Kinect da Microsoft pode ter sofrido um deslize ignóbil na obscuridade após o emparceiramento problemático com o Xbox One. Mas seus princípios subjacentes, a tecnologia e a pesquisa que entrou em desenvolvimento agora tem um papel muito mais importante do que medir seu bêbado “Apenas dance” desempenho.
Está salvando vidas.
Falando no AI Summit em Londres, o professor da Microsoft Christopher Bishop (diretor de laboratório da Microsoft Research) e Antonio Criminisi, principal pesquisador do InnerEye Assistive AI for Cancer, discutiram como a principal tecnologia de jogos de raiz, em conjunto com os princípios de aprendizado de máquina, está sendo usado para ajudar a diagnosticar cânceres.
Transformando horas em segundos
O InnerEye Assistive AI for Cancer é um projeto de pesquisa habilitado pela Microsoft que utiliza análise de imagens e ferramentas para reduzir drasticamente o tempo necessário para identificar e diagnosticar células cancerígenas em um paciente.
Uma das principais aplicações da tecnologia é examinar os dados produzidos a partir de uma tomografia computadorizada (TC). As tomografias computadorizadas parecem corretas através do tecido do corpo e da matéria óssea, resultando em imagens que oferecem muitas camadas ou fatias de visão diferentes em todo o corpo do paciente. Juntos, eles constroem uma imagem completa do funcionamento interno de um paciente - mas identificar cada órgão através de cada camada minimamente diferente e ser capaz de identificar anomalias nesses dados, pode levar até mesmo o oncologista mais experiente muitas horas. Eles usam tecnologia de modelagem 3D para destacar e identificar órgãos saudáveis, separando-os de quaisquer aberrações, mas devem construir essa imagem pixel por pixel, ou voxel por voxel, antes de decidir sobre um plano de tratamento..
Mas o que leva horas a um oncologista para fazer à mão, a InnerEye pode conseguir (com um pouco de ajuda humana) em apenas 30 segundos. Como tal, muito mais tempo pode ser dado ao plano de tratamento para cada paciente, com dados sólidos (no caso de radioterapia) sobre quais áreas saudáveis do corpo evitar bater.
“Para treinar o software, temos centenas de imagens de tomografias de pacientes, todas anonimizadas e consentidas”, explica Criminisi.
“Eles vêm de diferentes regiões do globo, não apenas do Reino Unido, o que é importante para capturar a variabilidade da etnia, da forma do corpo e do estado da doença. Cada imagem é confirmada por um oncologista para ter, por exemplo, sinais de câncer de próstata, e nós a refinamos através da segmentação.”
O desempenho do InnerEye não é desprovido de entrada de um médico no entanto. Na verdade, é melhorado por isso. Enquanto InnerEye é incrivelmente capaz de identificar diferentes zonas do corpo, sua margem de erro não é perfeita. Um oncologista pode ajustar o relatório resultante, e os dados alimentados de volta à nuvem podem ser usados para refinar os algoritmos da InnerEye onde quer que estejam em uso, em qualquer prática em qualquer parte do mundo..
“Não é 'aprendizado por reforço', é um tipo diferente de aprendizado de máquina chamado 'aprendizado supervisionado',” disse Criminisi. É um tipo de aprendizado mais tradicional, pois é refinado por meio de contribuições profissionais, neste caso de um médico..
“Nós nunca vamos substituir médicos,” diz Criminisi. “Mas esta é uma ferramenta para ajudá-los a realizar seus trabalhos de maneira mais eficiente e eficaz..”
Do jogo à medicina
Para qualquer paciente com interesse em jogos, eles podem se surpreender ao ouvir as raízes do software sendo usado agora em sua jornada para a recuperação..
“Está usando a mesma tecnologia que foi desenvolvida inicialmente para jogar com Xbox,” explica Criminisi.
“O que estamos fazendo usa o Random Forest, um tipo muito especial de algoritmo de aprendizado de máquina, que curiosamente saiu do laboratório de Cambridge da Microsoft há muitos anos e levou à invenção do Kinect..
“Essa tecnologia estava olhando para um usuário, não um paciente, de fora para dentro, e era capaz de reconhecer movimentos. Então pensamos, vamos transformá-lo em sua cabeça e usá-lo em imagens onde você olha para um paciente de dentro para fora. É a mesma tecnologia que evolui ao longo do tempo.”
Não é apenas a história da tecnologia de escaneamento no Kinect que liga as ambições da IA da Microsoft ao jogo, mas o hardware de chip subjacente também executa as tarefas computacionais. Sua arquitetura de silício FPGA (Field Programmable Gate Array) é fundada no trabalho feito em GPUs de jogos.
“Uma CPU é um processador genérico,” explica Bispo.
“Tem a vantagem de ser muito flexível e programável em software, mas a arquitetura atual é fixa. Depois, há uma arquitetura mais especializada, como unidades de processamento gráfico ou GPUs. Eles são projetados para gráficos rápidos, principalmente para a indústria de games. Mas acontece que eles estão muito bem adaptados para um tipo muito específico de aprendizado de máquina chamado de 'rede neural profunda', que realmente é a coisa que sustenta toda a excitação em torno da IA..
“As GPUs são uma arquitetura fixa muito específica, muito boa em fazer muitas das mesmas coisas em paralelo. Mas eles não têm flexibilidade. Um FPGA é um pouco diferente - você pode pensar nele como um conjunto de portas LEGO que pode ser configurado no software para ser uma arquitetura muito específica. Não será tão eficiente quanto um chip de propósito específico em um algoritmo específico, mas você pode configurá-lo rapidamente para trabalhar em qualquer um dos vários algoritmos diferentes, ou se um novo algoritmo aparecer.
“Isto é o que está alimentando a revolução da IA, juntamente com uma enorme quantidade de pesquisas em torno de novas técnicas de aprendizado de máquina. A flexibilidade significa que, quando um algoritmo novo e melhorado aparecer, podemos apenas reconfigurar o supercomputador FPGA para lidar com ele. Nós não precisamos mais desenvolver um novo chip sob medida. ”
Progresso vs privacidade
Como exemplo, Bishop afirma que fichas FPGA poderiam ser usadas para traduzir a totalidade do romance épico 'Guerra e Paz' do russo para o inglês no tempo que você levaria para retirá-lo da sua estante de livros..
“Imagine um futuro onde implantamos essa ferramenta em hospitais, como já estamos fazendo,” diz Criminisi.
“Quando um oncologista corrige alguns erros, ou faz escolhas estilísticas, esses dados voltam para o Microsoft Cloud, o Azure, e nós o usamos para treinar novamente o algoritmo. Há aprendizado contínuo. No dia seguinte, quando o médico volta para a cirurgia, o desempenho foi melhorado. É aí que queremos ir a seguir.”
Mas chegar a esta próxima fase no diagnóstico diário irá apresentar desafios removidos do silício, admite Criminisi..
“Uma coisa é falar sobre a tecnologia, a outra é falar sobre os obstáculos legais e os obstáculos à privacidade. Habilitar um mecanismo no qual você possa fazer aprendizado contínuo será, do ponto de vista de governança, muito mais complicado do que o que estamos fazendo agora.”
Pode não ser uma ressurreição para o Kinect, mas na prevenção de uma morte potencialmente prematura em pacientes, talvez a tecnologia, através desta evolução, tenha finalmente encontrado sua verdadeira vocação..
- O Kinect da Microsoft poderia renascer como um controlador de realidade virtual??