Programa de computador descobre a história da evolução das Palavras

por Plantão da Redação 20 de fevereiro de 2013

Software executa feitos de lingüística histórica.

Línguas são difíceis, leva um ouvido treinado para trazer à tona não apenas palavreado, mas as expressões idiomáticas, o tom, as tendências regionais e insultos sempre mutáveis que fazem uma pessoa verdadeiramente fluente. Esta é uma razão pela qual mesmo os melhores aplicativos e o Google Translate simplesmente não pode ser considerado 100% eficiente. Da mesma forma, é preciso um linguista treinado para saber como estas palavras, todos brotou de uma raiz, ainda crescer em formas infinitas todos significando a mesma coisa. Um computador astúciamente pode resolver este problema, bem como um lingüista inteligente pode? A resposta, neste caso, pode ser um sim .Um algoritmo de aprendizado de máquina nova pode usar regras de som para as mudanças mais prováveis dos fonéticos em uma linguagem. Todas as palavras mudam com o tempo e lugar, mas certas vogais e pronúncias vão mudar mais do que outros – você diz tomate, eu digo tomahtoe, canadenses dizem “aboot”, e assim por diante. Alexandre Bouchard-Côté e seus colegas da Universidade de British Columbia, em Vancouver desenvolveram um sistema que pode sugerir como as palavras podem ter soado no passado, e quais foram os mais propensos a mudar. Em seguida, eles compararam os resultados com a análise por especialistas humanos, e encontrou a 85 por cento das sugestões do computador estavam dentro de um único personagem das palavras corretas.

Eles olharam para 637 línguas distintas austronésias, que abrangem o Pacífico das Filipinas para o Havaí. Eles iriam começar, por exemplo, com a palavra “estrela”. Em Fiji, a palavra é kalokalo. Em Pazeh, uma língua indígena de Taiwan, é mintol. As pessoas que falam a língua Bornean de Melanau chamá-lo biten, e aqueles que falam o dialeto filipino chamado Inabaknon conhecem como bitu’on. A palavra de raiz, a partir do qual todas essas linguagens evoluído, é bituquen. O computador deduzido que corretamente.

O problema é que há um monte de front-end de trabalho antes de o computador poder fazer a sua análise. Linguistas têm de entrada uma lista de palavras em uma dada língua, além de seus significados, e gerar uma espécie de “árvore da vida” para a língua – um mapa filogenética mostrando como cada palavra está relacionada com os outros. (Assemelha-se em forma e função do mapa filogenética usada por botânicos e biólogos para mostrar como a vida está relacionada.) Mas quando se começa a trabalhar, o algoritmo é eficiente. Ele pode reconhecer cognatos, que são palavras com a mesma raiz, dentro de idiomas, e em seguida, descobrir a raiz provável.

Os pesquisadores reconhecem que ainda há mais trabalho avançado para ser feito, mas espero que seja uma bênção para os linguistas históricos da forma como a informação genética mudou de biologia. Em vez de mudança morfológica – olhando para uma coisa e ver como ele muda ou se compara a outras coisas – é muito mais simples do que olhar para os genes. Este algoritmo pode funcionar de uma forma semelhante, computacionalmente estudar as raízes de palavras e línguas, em vez de utilizar uma orelha especialmente treinado.

O artigo será publicado esta semana no Proceedings, da Academia Nacional de Ciências .

Post Anterior

Implante de olho biônico é autorizado nos EUA para pacientes cegos

Próximo Post

Programa de computador descobre a história da evolução das Palavras

Implante de olho biônico é autorizado nos EUA para pacientes cegos

Jogador corre risco de ser processado e multado em US$ 50 mil por criar mapa CS perfeito

Você também pode gostar

Deixe um Comentário Cancelar Resposta