A realidade aumentada está sendo saudada como a próxima grande novidade em dispositivos móveis, de tudo, desde jogos a preços de casas; Aponte um smartphone com Yelp em uma rua da cidade e o recurso Monóculo oferece análises e classificações para as empresas.

O Google Goggles pode fazer a mesma coisa, mas Shailesh Nalawadi, gerente de produtos do Goggles, não está interessada em RA: "Não nos vemos realmente trabalhando em realidade aumentada; estamos trabalhando em pesquisa visual".

É assim que os humanos funcionam, ele aponta, então só faz sentido que a busca trabalhe visualmente. "80% da informação é consumida visualmente, e não através de qualquer um dos outros sentidos. Por que você tem que traduzir e transcrever o que você vê em palavras?"

Embora Nalawadi seja realista sobre o que você pode fazer com uma câmera de telefone hoje ("O reconhecimento de imagens é realmente difícil, embora não haja escassez de filmes de Hollywood que mostrem isso como já foi alcançado!"), Ele não acha que precisamos de óculos ou as lentes de contato digitais devem estar à venda até 2020; como o nome Goggle sugere, o telefone é o visualizador.

"Você tem esses computadores realmente rápidos que carregamos em nossos bolsos, com recursos que você não teria em desktops há apenas cinco ou dez anos", diz ele..

"É claro que, não importa o quão poderosos sejam esses dispositivos, a visão computacional tem um jeito de ocupar todos os ciclos de CPU que você tem, então o Goggles cuida do trabalho pesado na nuvem."

Isso só funciona por causa das conexões de banda larga móvel e enquanto Nalawadi chama o tempo de reconhecimento de três a oito segundos que o Goggles geralmente considera "fenomenal" ele admite "nós também percebemos que não é suficiente porque a atenção das pessoas é muito curta".

Longe de terminar

O Goggles é fruto de três a cinco anos de pesquisa e está longe de terminar, diz ele.

"Nós lutamos e construímos essa coisa onde você pode mover sua câmera, apontá-la para um objeto e fazer com que ela volte e lhe diga o que está sendo visto. A realidade é que estamos realmente longe desse estado."

O que Nalawadi quer fazer é muito mais ambicioso do que apenas colocar em camadas informações sobre onde você está na tela; ele quer uma busca visual que possa lidar com o mundo inteiro.

"Primeiramente, ele explica," trata-se de estender as capacidades de reconhecimento de nossos computadores. Neste momento, temos um conjunto muito restrito de dezenas de milhões de objetos que reconhecemos, mas o mundo é muito maior do que dezenas de milhões de objetos e é um esforço fenomenal para tentar obter essa informação em nosso banco de dados e reconhecê-la ”.

VER E PESQUISA: O Goggles trata marcos como logotipos e códigos de barras; ele informa o que você está vendo e exibe os resultados da pesquisa

Com o passar do tempo, o Goggles reconhecerá plantas e jogos de xadrez, e em breve traduzirá textos sobre coisas que você vê.

Fazendo o banco de dados de imagens Goggles pode corresponder maior é apenas o começo. Há o problema básico de pesquisa: "Estamos gastando muito tempo na qualidade da pesquisa; quando há uma correspondência bem-sucedida, quais são os resultados relevantes que precisam ser recuperados?"

Um problema mais amplo

Mas Nalawadi também quer atacar o problema muito mais amplo. "Atualmente existe essa noção de que a realidade aumentada é toda sobre a exibição de geodados curados. Acredito que há muito mais informações nessa cena e você realmente precisa de reconhecimento de imagem sobreposta a isso para fornecer mais informações sobre o que está acontecendo ao seu redor. "

Ele também acha que o reconhecimento de imagens tornará a experiência de realidade aumentada melhor do que a posição aproximada que os smartphones de hoje podem calcular.