O programa de inteligência artificial AlphaZero do DeepMind agora está mostrando sinais de intuição e criatividade semelhantes às humanas, naquilo que os desenvolvedores consideraram como 'ponto de virada' na história.
O sistema de computador surpreendeu o mundo no ano passado quando dominou o jogo de xadrez do zero em apenas quatro horas, apesar de não ter sido programado como vencer.
Mas agora, depois de um ano de testes e análises dos mestres do xadrez, a máquina desenvolveu um novo estilo de jogo, como nunca antes visto, sugerindo que o programa agora está improvisando como um humano.
Ao contrário da melhor máquina de xadrez do mundo - Stockfish - que calcula milhões de resultados possíveis enquanto joga, AlphaZero aprende com seus sucessos e fracassos anteriores, fazendo seus movimentos com base em uma 'sensação nebulosa de que tudo vai funcionar no longo prazo , 'de acordo com especialistas da DeepMind.
Quando o AlphaZero foi confrontado com o Stockfish nos jogos 1,000, perdeu apenas seis, vencendo de forma convincente no 155 e empatando as demais lutas.
No entanto, foi o jeito que jogou que surpreendeu os desenvolvedores. Enquanto os computadores de xadrez predominantemente gostam de segurar suas peças, o AlphaZero sacrificou prontamente seus soldados por uma posição melhor na escaramuça.
Em entrevista ao The Telegraph, o professor David Silver, que lidera o grupo de pesquisa de aprendizado por reforço da DeepMind, disse: “Ele tem uma sensação muito sutil de intuição que ajuda a equilibrar todos os diferentes fatores.
“Ele tem uma rede neural com milhões de parâmetros ajustáveis diferentes, cada um aprendendo suas próprias regras do que é bom no xadrez, e quando você os coloca todos juntos, você tem algo que expressa, de uma forma bastante parecida com o cérebro, nossa capacidade humana de olhar para uma posição e dizer 'ah ha, isso é a coisa certa a fazer'.
“Minha crença pessoal é que vimos algo do momento em que começamos a entender que muitas habilidades, como intuição e criatividade, que antes pensávamos pertencer apenas à mente humana, são realmente acessíveis à inteligência da máquina também. E acho que é um momento realmente emocionante na história. ”
O AlphaZero começou como um 'tabula rasa' ou sistema de ardósia em branco, programado apenas com as regras básicas do xadrez e aprendeu a vencer jogando milhões de jogos contra si mesmo em um processo de tentativa e erro conhecido como aprendizado por reforço.
É da mesma maneira que o cérebro humano aprende, ajustando as táticas com base em uma vitória ou perda anterior, o que permite pesquisar apenas 60 mil posições por segundo, em comparação com os aproximadamente 60 milhões de Stockfish.
Em poucas horas, o programa havia descoberto e jogado de maneira independente aberturas e estratégias humanas comuns, antes de avançar para desenvolver suas próprias idéias, como enxamear rapidamente o rei do oponente e colocar muito menos valor em peças individuais.
O novo estilo de jogo foi analisado pelo Grão-Mestre do Xadrez Matthew Sadler e pela Mestra Internacional da Mulher Natasha Regan, que dizem isso diferente de qualquer mecanismo tradicional de xadrez.
"É como descobrir os cadernos secretos de um grande jogador do passado", disse Sadler.
Regan acrescentou: “Foi fascinante ver como a análise do AlphaZero diferia daquela dos melhores motores de xadrez e até mesmo do melhor jogo do Grande Mestre. AlphaZero pode ser uma ferramenta de ensino poderosa para toda a comunidade. ”
Garry Kasparov, ex-campeão mundial de xadrez, que perdeu a máquina de xadrez Deep Blue no 1997, disse: “Em vez de processar instruções e conhecimentos humanos a uma velocidade tremenda, como todas as máquinas de xadrez anteriores, o AlphaZero gera seu próprio conhecimento.
“Ele joga com um estilo muito dinâmico, muito parecido com o meu. As implicações vão muito além do meu amado tabuleiro de xadrez.”