Captcha se você puder como você tem treinado AI por anos sem perceber / Notícia

Parabéns estão em ordem. Você, sim, querido leitor, fez parte de algo incrível. Graças ao seu trabalho duro, milhões de livros contendo praticamente a soma total do conhecimento humano foram digitalizados com sucesso, salvando seus textos para as gerações futuras. Tudo por sua causa.

Não, seriamente.

Você sabe como, ocasionalmente, você será solicitado com um “CAPTCHA” ao preencher um formulário na internet, para provar que você é totalmente humano? Nos bastidores de um dos sistemas Captcha mais populares - Recaptcha do Google - seus cliques humanóides têm ajudado a descobrir coisas que a computação tradicional simplesmente não consegue gerenciar e, no processo, você está ajudando a treinar a inteligência artificial do Google para ser ainda mais inteligente.

E você pensou que estava apenas entrando em algum site ou outro.

Origens

Recaptcha (ou “reCATCHA” se preferir) começou como uma colaboração de vários cientistas da computação na Universidade Carnegie Mellon em Pittsburgh, lançada em 2007 - e foi rapidamente dominada pelo Google em 2009. A premissa foi descrita acima: casando-se com usuários que precisam provar que são humanos para dados que precisam ser transcritos, ambos os lados tiram algo disso.

Então, em vez de digitalizar livros fazendo uma pessoa executar a tarefa muito chata de digitar ou verificar um livro inteiro manualmente, em vez disso, milhões de pessoas podem colaborar sem saber para alcançar o mesmo objetivo. Lembre-se como sempre costumava ser duas palavras que você tinha que entrar? Concebivelmente, apenas um era o “real” teste, e o outro era uma nova palavra que ainda estava para ser transcrita - mas como o usuário você não saberia qual era qual, então você teria que tentar fazer as duas coisas com precisão..

O aplicativo do Google Livros no Android.

O Recaptcha pode até verificar seu próprio trabalho. Ao mostrar as mesmas palavras para vários usuários, ele pode verificar automaticamente se uma palavra foi transcrita corretamente, comparando várias tentativas de vários usuários em todo o mundo.

Surpreendentemente, graças às caixas Recaptcha que aparecem em milhares de websites e recebem dezenas de milhões de conclusões por dia, até o ano de 2011 a Recaptcha terminou de digitalizar todo o arquivo do Google Livros - além de 13 milhões de artigos do catálogo do New York Times. para 1851.

Então, o que o Google fez a seguir, sem livros para digitalizar? No que foi talvez uma feliz coincidência, isso coincidiu com o crescimento da inteligência artificial e aprendizado de máquina.

Montagem de treinamento

Em 2012, o Google começou a incluir não apenas palavras, mas também trechos de fotos do Google Street View - fazendo com que os usuários transcrevessem números de porta e outras sinalizações. E em 2014, o sistema se tornou tudo sobre treinar AI.

Essencialmente, o modo como o aprendizado de máquina funciona é que você entrega à máquina um monte de dados que já estão ordenados - digamos, um monte de imagens de gatos que você marcou como gatos, e então usa essas informações para construir uma rede neural que permite para pegar os gatos de outras imagens. Quanto mais fotos de gatos você alimenta, mais precisa a IA se torna em escolher gatos de outras imagens.

Um gato. Apenas no caso de você não ter certeza.

O Google tem inúmeras razões para treinar a inteligência artificial para reconhecer objetos em imagens: melhores resultados da Pesquisa de imagens do Google, resultados mais precisos do Google Maps e a possibilidade de pesquisar na biblioteca do Google Fotos por todas as fotos tiradas de um objeto ou local específico . Ah, e a pequena questão de garantir que o seu carro sem motorista não acerte nada. Você sabe quando Recaptcha lhe pede para identificar sinais de rua? Essencialmente você está jogando um papel muito pequeno em pilotar um carro sem motorista em algum lugar, em algum momento no futuro.

Por isso, é extremamente conveniente que o Google disponha de centenas de milhões de usuários da Internet para trabalhar: usando o Recaptcha para resolver esses problemas, o Google pode usar nossa necessidade de provar que somos humanos para nos forçar a usar nosso próprio ser humano. intuições para construir seu banco de dados.

Sistema de carro sem motorista Waymo do Google.

É por isso que, atualmente, em vez de simplesmente lançar algum texto, o Recaptcha está oferecendo aos usuários mais tarefas relacionadas à imagem: “Clique em todas as imagens de gatos”, “Clique em todas as caixas na grade sobrepondo uma imagem que contenha um gato”, e assim por diante. Para milhares de objetos diferentes.

Esse é um recurso particularmente útil para o Google, pois concorre com outros gigantes da Internet para ampliar seus conjuntos de dados e algoritmos de aprendizado de máquina: quanto mais dados puder analisar, melhores serão os resultados - dando a seus produtos atuais e futuros uma vantagem competitiva.

Usando AI para vencer a IA

Curiosamente, há apenas um problema com o uso de captchas para treinar algoritmos de aprendizado de máquina. O que deve parar, por exemplo, pessoas que querem contornar captchas de usar aprendizado de máquina contra captchas?

No ano passado, o desenvolvedor Francis Kim construiu uma prova de conceito para vencer o Recaptcha usando as habilidades de aprendizado de máquina do Google contra ele. Em apenas 40 linhas de Javascript, ele foi capaz de construir um sistema que usa a API de reconhecimento de imagem rival Clarifai para ver as imagens que o Recaptcha do Google gera e identificar os objetos que o captcha requer. Então, se o Recaptcha exigir que o usuário selecione imagens de vitrines para provar sua humanidade, o Clarifai é capaz de selecioná-las.

Concebivelmente, esse tipo de coisa também seria possível usando a tecnologia do próprio Google. Como o Google quer vender sua tecnologia inteligente a outras empresas, ele abre o TensorFlow para os desenvolvedores por meio de uma API própria. Isso significa que você poderia usar o TensorFlow para enganar o Captcha que treina o TensorFlow. Isso não funcionaria 100% do tempo - mas uma vez que uma IA esteja suficientemente bem treinada, ela deve ser capaz de fazer o truque em um grande número de casos..

O que está claro no Recaptcha não é apenas que é uma ideia engenhosa, mas também que, graças ao nosso trabalho árduo, está ficando cada vez mais difícil separar os seres humanos das máquinas..

TechRadar Semana AI é trazido a você em associação com a Honra.