Alfred Spector do Google em pesquisa por voz, inteligência híbrida e além
NotíciaO Google sempre deixou de boca fechada os produtos que ainda não foram lançados. Não é segredo, no entanto, que graças à cultura bottom-up da empresa, seus engenheiros estão trabalhando em toneladas de novos projetos ao mesmo tempo..
Seguindo o mantra de "lançar cedo, liberar com frequência", a velocidade com que o gigante dos mecanismos de busca produz ferramentas é impressionante. No centro de tudo isso está Alfred Spector, Vice-Presidente de Pesquisa e Iniciativas Especiais do Google.
Uma das áreas em que o Google está fazendo avanços significativos é a pesquisa por voz. Spector fica impressionado com a rapidez com que vem junto.
O Google Mobile App apresenta recursos de 'pesquisa por voz' disponíveis para iPhone, BlackBerry, Windows Mobile e Android. Todas as versões entendem inglês (incluindo os acentos dos EUA, Reino Unido, Austrália e Índia-Inglês), mas a mais recente adição, para telefones Nokia S60, introduz o reconhecimento de voz mandarim, que - por causa de seus diversos acentos e características tonais - representa um enorme desafio de engenharia.
É a língua mais falada no mundo, mas como não é exatamente compatível com o teclado, a busca por voz pode se tornar imensamente popular na China..
Desafio tecnológico
"A voz é um desses grandes desafios tecnológicos da ciência da computação", explica Spector. "Um computador pode entender a voz humana? Ele tem sido trabalhado por muitas décadas e o que percebemos nos últimos anos é que a pesquisa, particularmente em dispositivos portáteis, é passível de voz como um mecanismo de importação..
"É muito valioso poder usar voz. Todos nós sabemos que não importa o quão bom seja o teclado, é difícil digitar exatamente a coisa certa em uma barra de pesquisa, enquanto segura sua mochila e tudo o mais."
Conseguir que um computador leve em consideração sua voz não é tarefa fácil, é claro. "Uma idéia é pegar todas as vozes que o sistema ouve ao longo do tempo em um enorme modelo de voz pan-humana. Então, por um lado, temos uma voz mais alta e com um sotaque inglês e, por outro lado, minha voz , que é mais profundo e com um sotaque americano. Ambos entram em um modelo, ou apenas se tornam personalizados para o indivíduo; os cientistas de voz não estão muito claros sobre qual é a melhor abordagem. "
Maquina de tradução
O departamento de pesquisa também está progredindo na tradução automática. O Google Tradutor já possui 51 idiomas, incluindo suaíli e iídiche. A versão mais recente introduz a tradução instantânea em tempo real, a entrada fonética e o suporte para conversão de texto em fala (em inglês).
"Somos capazes de ir de qualquer idioma para qualquer um dos outros, e existem 51 vezes 50, então 2.550 possibilidades", explica Spector..
"Estamos nos concentrando no aumento do número de idiomas porque gostaríamos de lidar até mesmo com os idiomas em que não há um enorme volume de uso. Isso tornará a web muito mais valiosa para mais pessoas se elas puderem acessar o idioma inglês ou chinês". linguagem web, por exemplo.
"Mas também continuamos a nos concentrar na qualidade, porque quase sempre as traduções são valiosas, mas imperfeitas. Às vezes, vem da formação do nosso sistema de tradução em mais dados brutos, por isso temos documentos da UE em inglês e francês e podemos compará-los e aprender regras para a tradução.A outra abordagem é trazer mais conhecimento para a tradução.
"Por exemplo, estamos usando mais conhecimento sintático hoje e fazendo análises automatizadas com a linguagem. Esse tem sido um grande desafio do campo desde o final dos anos 1950. Agora ele finalmente alcançou o uso em massa."
A equipe, liderada pelo cientista Franz Josef Och, coleciona dados para mais de 100 idiomas, e o Google Translator Toolkit, que faz uso da "sabedoria das multidões", agora suporta até 345 idiomas, muitos dos quais são línguas minoritárias..
O editor permite que os usuários traduzam texto, corrijam a tradução automática e a publiquem. Spector acha que essa abordagem é o futuro. À medida que os computadores se tornam ainda mais rápidos, manipulando cada vez mais dados - muito disso na nuvem - as máquinas aprendem com os usuários e, assim, ficam mais inteligentes. Ele chama esse conceito de "inteligência híbrida".
"É muito difícil resolver esses problemas tecnológicos sem a contribuição humana", diz ele. "É difícil criar um robô tão inteligente, inteligente e conhecedor do mundo quanto nós humanos. Mas não é tão difícil construir um sistema computacional como o Google, que amplia o que fazemos muito e gradualmente aprende algo sobre o mundo conosco , mas isso requer a nossa interpretação para torná-lo realmente bem sucedido.
"Precisamos ter computadores e pessoas se comunicando nas duas direções, para que o computador aprenda com o humano e torne o ser humano mais eficiente."