Há cerca de dez anos, imaginávamos que o futuro seria tudo sobre hologramas, realidade virtual e controle de voz, mas agora, em 2011, ainda não atingimos essas elevadas expectativas..

Embora a TV 3D esteja lentamente se infiltrando no mercado de massa e a realidade aumentada tenha começado a substituir os fones de ouvido robustos vistos nos gameshows dos anos 90, o controle de voz realmente não deixou a marca que esperávamos. Então, o que é sobre o reconhecimento de voz que nos deixou digitando mais do que falando??

Reconhecimento de voz em poucas palavras

A fim de compreender plenamente os meandros do reconhecimento de voz, precisamos olhar para os seus principais usos, dos quais existem três categorias distintas. O primeiro é o controle de voz; comandos falados simples que podem fazer qualquer coisa a partir da verificação de novos e-mails para alternar entre aplicativos.

O controle de voz no Mac OS X é uma tecnologia de assistência, mas pode ser usado como uma maneira rápida de lidar com tarefas comuns. A mesma tecnologia é usada para o Controle por Voz no iOS para alternar faixas, bem como para estéreos no carro para controlar a reprodução, as ligações telefônicas e o SatNav.

Ditar o processo

Depois há o ditado, que requer um trabalho de reconhecimento de fala mais impressionante. Isso é feito por aplicativos da Nuance, como o Dragon Dictate, que usa algoritmos para aprender sua voz e entender o que você diz.

Para esses aplicativos mais avançados, você precisará de um microfone ou headset de qualidade decente e um perfil precisará ser criado para que seus padrões de voz exclusivos sejam entendidos com precisão. Isso também se aplica a aplicativos como o Scribe da Mac Speech, que aprende sua voz a partir de arquivos de áudio e pode transcrever anotações de áudio feitas em documentos de texto.

A categoria final viu um aumento na conscientização e funcionalidade com a ascensão dos aparelhos iPhone e Android. A Apple recentemente adquiriu uma empresa chamada Siri, especializada em pesquisa por voz, e o Google já tem uma pesquisa por voz incluída como parte de seus aplicativos do Google..

A pesquisa por voz, embora não seja tecnologicamente avançada como os aplicativos de ditado, seleciona palavras-chave de suas solicitações e as aciona com base em seu entendimento, por exemplo, procurando restaurantes nas proximidades. Esta categoria se sobrepõe ligeiramente ao controle de voz, mas com os avanços feitos pelo Google especialmente, ela merece uma categoria própria por sua natureza sensível à localização.

Você pode não saber, mas o seu Mac realmente tem tecnologia de reconhecimento de voz instalada por padrão. Experimente você mesmo.

Vá para Preferências do Sistema e clique no botão Fala. A partir daqui, você pode não apenas nomear seu Mac para dar a ele comandos ("Computador, verificar meu e-mail" e assim por diante), mas também pode dizer que esteja constantemente ouvindo seus comandos, portanto, se precisar trocar de aplicativo e não tem uma mão livre, você pode apenas dizer em voz alta.

Entre os muitos comandos falados que um Mac entenderá, você pode até pedir que ele conte uma piada. Basta dizer "Conte-me uma piada", e seu Mac responderá "Knock-knock", ao qual você deve responder "Quem está aí?", E assim por diante.

Para truques mais avançados, vá para a guia Comando em Fala no painel Preferências do Sistema e clique na pasta Abrir Itens Seguros. Aqui você encontrará scripts para ações individuais e aplicativos específicos que você pode editar e renomear para se adequar a você.

Para criar seus próprios atalhos, você pode simplesmente alterar o nome de um script que já existe ou duplicar um script e editar o conteúdo usando o AppleScript. Se você quiser alterar o que precisa dizer para invocar um atalho, basta alterar o nome do arquivo do item que pode ser lido para qualquer coisa que deseje usar.