Home Ecoverde Programa de computador descobre a história da evolução das Palavras

Programa de computador descobre a história da evolução das Palavras

por Plantão da Redação
Software executa feitos de lingüística histórica.
Línguas são difíceis, leva um ouvido treinado para trazer à tona não apenas palavreado, mas as expressões idiomáticas, o tom, as tendências regionais e insultos sempre mutáveis ​​que fazem uma pessoa verdadeiramente fluente. Esta é uma razão pela qual mesmo os melhores aplicativos e o Google Translate simplesmente não pode ser considerado 100% eficiente. Da mesma forma, é preciso um linguista treinado para saber como estas palavras, todos brotou de uma raiz, ainda crescer em formas infinitas todos significando a mesma coisa. Um computador astúciamente pode resolver este problema, bem como um lingüista inteligente pode? A resposta, neste caso, pode ser um sim .Um algoritmo de aprendizado de máquina nova pode usar regras de som para as mudanças mais prováveis dos ​​fonéticos em uma linguagem. Todas as palavras mudam com o tempo e lugar, mas certas vogais e pronúncias vão mudar mais do que outros – você diz tomate, eu digo tomahtoe, canadenses dizem “aboot”, e assim por diante. Alexandre Bouchard-Côté e seus colegas da Universidade de British Columbia, em Vancouver desenvolveram um sistema que pode sugerir como as palavras podem ter soado no passado, e quais foram os mais propensos a mudar. Em seguida, eles compararam os resultados com a análise por especialistas humanos, e encontrou a 85 por cento das sugestões do computador estavam dentro de um único personagem das palavras corretas.
Rosetta_Stone

Eles olharam para 637 línguas distintas austronésias, que abrangem o Pacífico das Filipinas para o Havaí. Eles iriam começar, por exemplo, com a palavra “estrela”. Em Fiji, a palavra é kalokalo. Em Pazeh, uma língua indígena de Taiwan, é mintol. As pessoas que falam a língua Bornean de Melanau chamá-lo biten, e aqueles que falam o dialeto filipino chamado Inabaknon conhecem como bitu’on. A palavra de raiz, a partir do qual todas essas linguagens evoluído, é bituquen. O computador deduzido que corretamente.

O problema é que há um monte de front-end de trabalho antes de o computador poder fazer a sua análise. Linguistas têm de entrada uma lista de palavras em uma dada língua, além de seus significados, e gerar uma espécie de “árvore da vida” para a língua – um mapa filogenética mostrando como cada palavra está relacionada com os outros. (Assemelha-se em forma e função do mapa filogenética usada por botânicos e biólogos para mostrar como a vida está relacionada.) Mas quando se começa a trabalhar, o algoritmo é eficiente. Ele pode reconhecer cognatos, que são palavras com a mesma raiz, dentro de idiomas, e em seguida, descobrir a raiz provável.

Os pesquisadores reconhecem que ainda há mais trabalho avançado para ser feito, mas espero que seja uma bênção para os linguistas históricos da forma como a informação genética mudou de biologia. Em vez de mudança morfológica – olhando para uma coisa e ver como ele muda ou se compara a outras coisas – é muito mais simples do que olhar para os genes. Este algoritmo pode funcionar de uma forma semelhante, computacionalmente estudar as raízes de palavras e línguas, em vez de utilizar uma orelha especialmente treinado.

O artigo será publicado esta semana no Proceedings, da Academia Nacional de Ciências .

Você também pode gostar

Deixe um Comentário