A equipe DeepMind do Google, especializada em aprendizado de máquina e inteligência artificial, criou uma IA chamada AlphaGo Zero, que é capaz de ensinar a si mesmo o jogo de estratégia chinês Go. Não só isso, ele pode se ensinar de forma tão eficaz que é capaz de superar a iteração anterior do AlphaGo que derrotou com sucesso os melhores jogadores humanos do mundo..

O AlphaGo anterior foi ensinado a jogar inserindo os dados de como os melhores jogadores humanos do mundo jogaram certos movimentos, efetivamente criando um compêndio dos melhores jogadores do mundo..

O AlphaGo Zero, no entanto, de acordo com o Guardian, aprendeu de forma completamente diferente, recebendo as regras para o Go, e sendo deixado para seus próprios dispositivos. Obviamente, começou fazendo alguns movimentos bem tolos e imprudentes, mas rapidamente aprendeu quais movimentos tinham maior probabilidade de levar à vitória, e quais falhas.

Cenoura ou o pau?

Chamado de aprendizado de reforço, soa bastante semelhante ao modo como aprendemos como humanos, mas apenas com um poder computacional enorme. E é isso que faz toda a diferença. AlphaGo Zero foi capaz de ir de amador completo a grande mestre em questão de dias.

O que é ainda mais interessante é que remover os humanos da equação foi potencialmente benéfico para o processo de aprendizagem. O AlphaGo Zero estava usando movimentos mais complexos antes dos mais simples, e até começou a gerar movimentos que não foram vistos antes do terceiro dia.

Você pode ver o professor David Silver, pesquisador-chefe do AlphaGo, explicando como o aprendizado do AlphaGo Zero é empolgante tábua rasa está abaixo:

Escrevendo na revista científica Nature, o CEO da DeepMind, Demis Hassabis, disse: “Ele descobre algumas das melhores jogadas, [movimentos chamados] josekis, e depois vai além dessas jogadas e encontra algo ainda melhor. Você pode ver isso redescobrindo milhares de anos de conhecimento humano.”

Quando comparado com a versão 2015 do AlphaGo, o AlphaGo Zero ganhou 100 dos 100 jogos. Mas para Hassabis e a equipe, ficar muito bom no Go não é o objetivo final: “Para nós, o AlphaGo não estava apenas prestes a ganhar o jogo do Go, mas também foi um grande passo para a construção desses algoritmos de propósito geral..”

E isso significa um algoritmo que pode realmente ajudar em vários aplicativos do mundo real. A equipe prevê um mundo em um futuro não muito distante, onde a AlphaGo (ou seu equivalente) poderá trabalhar como assistente médico. Na verdade, o AlphaGo Zero está agora trabalhando para descobrir como as proteínas se dobram, um dos principais desafios científicos do nosso tempo.

  • Black Friday está ao virar da esquina. Certifique-se de obter as melhores ofertas com as nossas ofertas da Black Friday.
  • Se você precisa de um novo laptop agora, dê uma olhada na nossa página de ofertas de laptops.