O aprendizado de máquina está melhorando tudo, desde o reconhecimento de imagem e fala até a previsão de quando o maquinário irá falhar. É o que faz de Cortana inteligente o suficiente para fazer piadas e prever partidas esportivas, além de lhe dizer quando sair mais cedo para a reunião porque o trânsito está ruim. Mas ainda há um longo caminho para assistentes digitais antes que possamos realmente confiar neles.

Ainda estamos testando sistemas de computador que tentam nos ajudar, não em fatos, mas em quão bem eles se comunicam, afirma o diretor de buscas do Bing, Stefan Weiz, em seu recente livro, 'Search'.

"Em sistemas como Siri ou Cortana, 30 a 40% de todas as interações que as pessoas iniciam são questões sociais ou tolas que investigam a realidade do 'assistente' em vez de perguntas que o sistema pretendia responder. Queremos (e precisamos) acreditar estamos nos envolvendo com alguém que entende não apenas matemática, mas também nossa humanidade. "

Chit conversar com Cortana

É por isso que a Microsoft construiu o sistema 'bate papo' na Cortana, que permite que ela cante músicas e faça imitações. "O humor tem sido o foco principal da MSR em nossa parceria com a equipe da Cortana", disse Peter Lee, diretor de pesquisa da Microsoft. "Chit chat é um sistema de aprendizado de máquina leve e podemos continuar aumentando o número de domínios que a Cortana é capaz de conversar com você."

O problema é a rapidez com que a Cortana consegue acompanhar o que está acontecendo quando se trata de notícias de última hora, em vez do humor sazonal que a equipe do Bing acrescenta, como acompanhar o Papai Noel ou brincar sobre os Seattle Seahawks..

"Na Cortana ou em qualquer assistente digital, há o frescor do que a Cortana conhece", Lee explicou para nós. "Cortana está continuamente aprendendo. Você pode ter uma conversa de bate papo sobre quem vai ganhar o jogo dos Seahawks no próximo domingo. Mas na noite em que as coisas estão em erupção em Ferguson Missouri, nem sempre é óbvio que Cortana terá a frescor de conhecimento para interagir ".

É por isso que, embora a Microsoft esteja obtendo muito sucesso com os populares sistemas de aprendizagem profunda para serviços como o Skype Translator e o novo reconhecimento de imagem no OneDrive (onde suas fotos agora recebem automaticamente tags como 'flower' e 'beach'), não é colocando todos os ovos nessa cesta. "Estamos ficando muito mais inteligentes em perceber quando usar redes neurais profundas ou modelos probabilísticos versus outras técnicas de aprendizado", explica Lee, e o próximo passo é sistemas de aprendizado de máquina mais dinâmicos que se mantêm atualizados.

"Com os modelos tradicionais de aprendizado de máquina, você gasta esse enorme esforço para obter um enorme corpus de dados e treinar o sistema offline e implantá-lo. Mas, em cada vez mais situações, esse modelo não é bom o suficiente. e parte mais integrante de tudo que tocamos e interagimos, acho que as questões de manutenção dessa inteligência e o frescor dessa inteligência se tornarão cada vez mais importantes ", adverte Lee. O problema é algo que ele chama de 'ML rot'.

"Atualmente, os sistemas de aprendizado de máquina são estáticos e sua eficácia às vezes se degrada com o tempo. Embora o trabalho em aprendizado de máquina esteja sempre avançando, um sistema específico de aprendizado de máquina não. Em algum momento você precisa reunir um grupo de especialistas e passar por grandes esforços para treiná-lo e começar de novo. Isso não é escalável. Você precisa de um processo em que os não especialistas sejam capazes de manter e avançar sistemas de aprendizado de máquina e onde os sistemas de aprendizado de máquina sejam mais receptivos ao aprendizado contínuo. "

O sistema Bing Predicts está por trás do conhecimento esportivo e habilidades preditivas da Cortana

Rankings de Halo

A Cortana não é o único sistema da Microsoft que está fazendo mais desse aprendizado dinâmico contínuo. "No Halo, o sistema de ranking TrueSkill usa um modelo probabilístico que é muito mais dinâmico", ele nos disse. Sua classificação é como Halo sugere que outros jogadores joguem contra. O TrueSkill rastreia o quão bom o sistema acha que cada jogador é, e o quão certo é que a classificação da habilidade está correta. Quanto mais você joga, mais certo fica o sistema quanto a sua classificação, e tem que fazer isso em apenas alguns jogos, mesmo que haja milhões de pessoas jogando.

As mesmas ferramentas podem ser úteis no trabalho também. O TrueSkill é construído com o Infer.NET, o mesmo sistema que o Clutter usa para descobrir quais mensagens de e-mail você quer ver, usando descrições que são fáceis de escrever - e para atualizar quando você quer melhorar o sistema..

A desordem aprende com o seu comportamento e, no momento, leva um dia para mudar a forma como trata as mensagens que você arrastou de volta para a caixa de entrada quando, por engano, pensou que elas não eram interessantes. O Delve, um serviço do Office 365 que tenta priorizar os documentos e anexos que as pessoas compartilharam com você, pode levar alguns dias para identificar novos documentos que você precisa saber sobre.

Se vamos confiar nesses sistemas, eles precisam ficar mais rápidos. Afinal, esperamos que os mecanismos de pesquisa saibam sobre notícias assim que isso acontecer. "Cada vez mais as empresas chegam ao ponto em que querem que os agentes inteligentes estejam cientes dos mais recentes pensamentos, declarações, e-mails e documentos de todos os seus colegas, o tempo todo", prevê Peter Lee. "Mesmo um sistema de aprendizado de máquina que recua uma vez por dia será muito lento e pouco inteligente."

  • Aprendizado de máquina na nuvem: além do Kinect e da Cortana