Por Allison Linn //
A Microsoft lançou um conjunto de 100.000 perguntas e respostas que os pesquisadores de inteligência artificial podem usar em sua busca para criar sistemas que possam ler e responder a perguntas como um ser humano.
O conjunto de dados chama-se MS MARCO, que significa Microsoft MAchine Reading COmprehension (Compreensão de Leitura de Máquina Microsoft), e a equipe por trás dele afirma que é o conjunto de dados mais útil desse tipo porque baseia-se em dados anônimos do mundo real. Ao torná-lo disponível gratuitamente para os pesquisadores, a equipe espera estimular descobertas em leitura de máquina que já estão acontecendo em imagem e reconhecimento de fala.
Eles também esperam facilitar o tipo de avanço que pode levar ao objetivo de longo prazo da “inteligência artificial geral” ou máquinas que possam pensar como seres humanos.
“A fim de avançar para a inteligência artificial geral, precisamos dar um passo para sermos capazes de ler um documento e entendê-lo da mesma forma que uma pessoa”, disse Rangan Majumder, gerente do programa do grupo de parceiros com a divisão do mecanismo de busca Microsoft Bing, que está liderando o esforço. “Este é um passo nessa direção.”
Agora, na avaliação de Majumder, os sistemas para responder a perguntas sofisticadas ainda estão em sua infância. Mecanismos de busca como o Bing e assistentes virtuais como a Cortana podem responder a perguntas básicas, como “Que dia começa o Hanukkah?” ou “Quanto é 2.000 vezes 43?”.
Mas, em muitos casos, Majumder diz que os mecanismos de busca e as assistentes virtuais apontarão para um conjunto de resultados do buscador. Os usuários ainda podem obter as informações desejadas, mas é preciso escolher os resultados e encontrar a resposta na página da web.
Para melhorar os sistemas automatizados de perguntas e respostas, os pesquisadores precisam de uma fonte robusta do que chamamos de “dados de treinamento”. Esses conjuntos de dados podem ser usados para ensinar sistemas de inteligência artificial a reconhecer perguntas e formular respostas e, eventualmente, criar sistemas que possam vir com suas próprias respostas baseadas em perguntas exclusivas que nunca viram antes.
Majumder e sua equipe – que inclui pesquisadores da Microsoft e pessoas que trabalham em produtos Microsoft – dizem que o conjunto de dados MS MARCO é particularmente útil porque as perguntas são baseadas em consultas reais e anônimas do buscador Bing e da assistente virtual Cortana. A equipe escolheu as perguntas anônimas com base nas consultas que eles achavam que seriam mais interessantes para os pesquisadores. Além disso, as respostas foram escritas por humanos, referenciadas em páginas da web reais, e verificadas para ter precisão.
Ao fornecer perguntas e respostas realistas, os pesquisadores dizem que podem treinar sistemas para lidar melhor com as nuances e complexidades das perguntas que as pessoas comuns realmente fazem – incluindo aquelas perguntas que não têm resposta clara ou múltiplas respostas possíveis.
Por exemplo, o conjunto de dados contém a pergunta: “Que alimentos os gregos antigos comiam?”. Para responder à pergunta corretamente, eles selecionaram trechos de informações de vários documentos ou pedaços de texto para chegar a alimentos como grãos, bolo, leite, azeitonas, peixe, alho e repolho.
Li Deng, gerente de pesquisa parceiro do Centro de Tecnologia de Aprendizado Profundo da Microsoft, disse que os conjuntos de dados anteriores foram projetados com certas limitações ou restrições. Isso tornou mais fácil para os pesquisadores criar soluções que poderiam ser formuladas, como o que os pesquisadores de aprendizagem de máquina chamam de “problemas de classificação”, em vez de procurar entender o texto real da questão.
Ele disse que o MS MARCO foi projetado para os pesquisadores poderem experimentar com os mais avançados modelos de aprendizagem profunda, criados para levar a investigação de inteligência artificial mais adiante.
“Nosso conjunto de dados foi elaborado não só usando dados do mundo real, mas também removendo restrições, de modo que a nova geração de modelos de aprendizagem profunda possa compreender os dados antes de responder a perguntas”, disse Deng.
Para Majumder, a habilidade dos sistemas de responder a perguntas complexas pode aumentar as habilidades humanas por ajudar as pessoas a conseguir informação mais eficientemente.
Suponha que uma estudante canadense quer saber se ela se qualifica para um determinado programa de empréstimo. Um mecanismo de busca pode direcionar essa usuária para um conjunto de sites, nos quais ela teria que ler os dados e chegar a uma resposta por conta própria. Com ferramentas melhores, um assistente virtual poderia digitalizar essas informações para ela e fornecer rapidamente uma resposta mais matizada e talvez até personalizada.
“Dado que grande parte do conhecimento do mundo é encontrado em um formato escrito, se conseguirmos máquinas para ler e entender documentos como os humanos, poderemos desbloquear todos esses tipos de cenário”, disse Majumder.
Objetivo de longo prazo: “inteligência artificial geral”
Por enquanto, pelo menos, os pesquisadores ainda estão longe de criar sistemas que possam realmente compreender o que os seres humanos estão dizendo, vendo ou escrevendo – o que muitos chamam de “inteligência artificial geral”.
Mas nos últimos anos, a aprendizagem de máquina e os pesquisadores de inteligência artificial da Microsoft e de outros lugares fizeram grandes avanços na criação de sistemas capazes de reconhecer as palavras em uma conversa e identificar corretamente os elementos de uma imagem.
“A Microsoft liderou o caminho no reconhecimento de voz e no reconhecimento de imagem, e agora queremos liderar o caminho na compreensão de leitura”, disse Majumder.
Mas, ele observou, este não é um problema que qualquer empresa possa resolver sozinha. Majumder disse que uma razão pela qual sua equipe lançou o conjunto de dados é o desejo de trabalhar com outras pessoas nesse campo.
MS MARCO foi modelado em conjuntos de treinamento semelhantes, criados para ajudar a impulsionar avanços em outras áreas de aprendizagem de máquina e inteligência artificial. Isso inclui o banco de dados ImageNet, considerado o primeiro conjunto de dados para testar avanços no reconhecimento de imagens. Uma equipe da Microsoft usou o ImageNet para testar suas primeiras redes residuais profundas, gerando grandes saltos na precisão do reconhecimento de imagens.
A equipe do MS MARCO também planeja seguir o exemplo da ImageNet criando um quadro de líderes que mostre quais equipes de pesquisadores estão obtendo os melhores resultados. Eventualmente, pode criar uma competição mais formal ao longo dos desafios anuais da ImageNet.
O conjunto de dados MS MARCO está disponível gratuitamente para qualquer pesquisador que queira baixá-lo e usá-lo em aplicações não-comerciais.
Foto do alto: Rangan Majumder, gerente do programa do grupo de parceiros com a divisão do buscador Microsoft Bing
Allison Linn é redatora sênior na Microsoft.
Fonte: Microsoft
Você pode conferir todas as novidades através do link: