Para alguns o filme de Spike Jonze que ela era excruciante, para outros foi um vislumbre do futuro, mas imagine se a assistente pessoal do filme, Samantha, tivesse dito de repente a Theodore: "Desculpe, eu não entendi isso?" Teria matado o romance morto.

Os estilos conversacionais do Siri e do Google Now não estão nem perto dos de Samantha, mas seu desenvolvimento é parte de um movimento que ameaça eclipsar a palavra escrita. Nossa caligrafia nunca foi tão ruim, digitar em um teclado está começando a parecer arcaico e até mesmo a necessidade constante de digitar mensagens de texto e termos de busca na Web pode causar cãibras nos dedos e dores nas mãos.

Com dispositivos iOS agora permitindo o envio de mensagens de voz e previsões para carros autônomos e portas ativadas por voz, luzes e elevadores (cue a internet das coisas), é claro que o futuro será falado, não escrito.

A tecnologia por trás dessa mudança na forma como interagimos com o ambiente ao nosso redor é o processamento de linguagem natural, uma tecnologia que permite que os computadores entendam o significado de nossas palavras e reconheçam os hábitos de nossa fala..

Rovi está fazendo com que a programação da TV seja pesquisável

Onde vamos ver o processamento da linguagem natural primeiro??

Além do Siri e do Google Now, você pode já ter usado o Xbox One e o Samsung UE65HU8500

mas até agora o reconhecimento de voz girou em torno de uma lista muito pequena de frases e palavras. Uma conversa adequada, isso não é. "Palavras mágicas fizeram com que essas tecnologias dependessem de sistemas de menus estruturados nos quais o comando de voz simplesmente substitui os insumos tradicionais", diz Charles Dawes, diretor global de contas estratégicas da Rovi. "Eles não proporcionam uma experiência satisfatória, forçando os usuários a aprender como falar com o dispositivo e fazer com que a fala fique empolada e não natural".

Os sistemas de reconhecimento automático de fala nas TVs têm confiado até agora em microfones embutidos que podem ser do espectador, embora a maioria esteja migrando para aplicativos. "A prevalência de smartphones e tablets oferece aos operadores a oportunidade de contornar esse problema, permitindo pesquisas e recomendações para a TV através da segunda tela", diz Dawes. "O desenvolvimento desses dispositivos tem crescido, e a capacidade de processamento oferecida pela maioria no mercado fornece uma ampla base sobre a qual se podem construir capacidades de conversação".

Mas há muitos outros lugares em que já estamos vendo mecanismos de linguagem natural usados. O Barclays Wealth usa-o para verificar se um titular de conta, a companhia aérea JetBlue está usando publicidade inteligente de voz, e a Ford está usando linguagem natural para os motoristas controlarem sistemas automotivos como telefone, música, temperatura, navegação e atualizações de tráfego.

Como funciona o processamento de linguagem natural??

Uma vez que é reconhecido o que alguém disse, então é tudo sobre contexto e desambiguação de termos semelhantes. "Um telespectador poderia dizer 'a que horas é o jogo da cidade hoje à noite?', E a tecnologia de voz teria de tomar uma decisão sobre o contexto - futebol - e a preferência do usuário com base em sua história. Eles apóiam a cidade de Norwich? Cidade?" diz Dawes. "A tecnologia também deve ser capaz de lidar com mudanças repentinas. Por exemplo, ela deve reconhecer que, se o mesmo espectador perguntar" há algum suspense nesta noite? " eles estão procurando fora do contexto dos esportes ".

Siri, Google Now e Cortana usam o processamento de linguagem natural