Pesquisadores da Universidade Federal de São João Del-Rei criam algoritmo capaz de interpretar, instantaneamente, a percepção de um grupo de internautas sobre temas variados
A cada segundo, milhões de pessoas em todo o mundo expressam o que pensam nas redes sociais.
Como a internet virou um espaço democrático para divulgar opiniões sobre os mais variados temas, por que não aproveitar as informações para descobrir instantanemente qual é a percepção de um conjunto de internautas sobre fatos, produtos, marcas, pessoas ou empresas? Com o apoio de cinco alunos de iniciação científica, o professor do Departamento de Ciência da Computação da Universidade Federal de São João del-Rei (UFSJ) Leonardo Chaves Dutra da Rocha desenvolveu uma ferramenta capaz de interpretar automaticamente textos postados na web, em tempo real. A invenção pode ser útil neste ano eleitoral para avaliar, por exemplo, o desempenho dos candidatos nos debates televisivos.
Considerando o dinamismo da internet, o volume de dados e o tamanho dos textos (geralmente curtos), o pesquisador resolveu criar há dois anos um novo algoritmo, que é um conjunto de instruções repassadas ao computador. “Quando se fala em web, tudo muda. Os outros algoritmos não dão conta da quantidade de dados e da mudança rápida de sentimento. A web é muito dinâmica”, justifica Rocha. Batizada de Análise de Sentimento por Inspeção Coletiva (em inglês, Sentiment Analysis by Collective Inspection, ou Saci, sigla em homenagem ao escritor Monteiro Lobato), a ferramenta está disponível para Twitter. No mês que vem, devem entrar no ar as versões para Facebook, Google+ e Instagram.Sem precisar ler os comentários, Rocha consegue avaliar qual é a percepção dos internautas em relação a determinado assunto. Definido o alvo da análise, o pesquisador cria um ranking com as palavras que mais aparecem e repassa para o computador, que fará a coleta automática dos posts nas redes sociais. Em seguida, classificam-se as palavras como positivas, negativas ou neutras, de acordo com o contexto. “Divertido é um comentário positivo para uma série de televisão, mas no cenário de eleições pode ter conotação negativa”, destaca. Os sinônimos seguem a mesma lógica e os antônimos se encaixam na lista do sentimento inverso. Gráficos gerados automaticamente permitem avaliação rápida e eficiente.
Idioma
A nova ferramenta de análise de sentimento está em teste há oito meses na língua inglesa. No dia em que a televisão veiculou o último capítulo da série norte-americana Dexter, o Saci conseguiu captar automaticamente e em tempo real a opinião dos espectadores a partir dos comentários no Twitter. O professor da UFSJ conta que visitou vários sites especializados e confirmou por meio de comentários e enquetes que a maioria dos fãs do programa não havia gostado do fim, como apontou o algoritmo.
A final da liga de futebol americano dos Estados Unidos, chamada de Super Bowl, deu a prova de que a ferramenta era mesmo eficiente. Para se ter uma ideia, durante o evento esportivo mais assistido pelos norte-americanos chegavam mais de 3 mil posts por minuto. “Percebemos que os torcedores de ambos os times estavam bem confiantes antes da partida porque o sentimento negativo era muito baixo. Estava com o computador do lado e com dois segundos de jogo teve uma roubada de bola. De repente, começaram a subir os comentários negativos do time que estava perdendo”, relata. Rocha ressalta que o Saci conseguiu identificar o sentimento da torcida, que era coerente com o que ocorria na partida, em tempo real. A ferramenta consegue avaliar até 10 mil posts por segundo.
O desafio agora é adaptar o Saci para a língua portuguesa, muito mais complexa que o inglês. Em fase de teste, a ferramenta em português está interpretando o sentimento dos internautas em relação a um reality show, o que representa bem a dinâmica da web, pois as opiniões mudam a todo instante. Rocha adianta que a próxima versão da novidade será em espanhol.
Alta capacidade de análise
Coordenador do Observatório da Web, projeto da Universidade Federal de Minas Gerais (UFMG), o professor de ciência da computação Wagner Meira Júnior destaca que não é fácil lidar de forma eficiente com a linguagem, o dinamismo e o volume de dados na internet. Em cinco anos, a equipe mineira já desenvolveu pelo menos quatro soluções para lidar com os desafios da análise de sentimento. Uma delas resultou na criação do Observatório da Dengue, sistema que prevê, a partir de comentários publicados no Twitter, em quais cidades está ocorrendo surto da doença. A ferramenta é usada há dois anos pelo Ministério da Saúde para vigilância epidemiológica. A taxa de acerto chega a 97%.
Aproveitando a capacidade de coletar, analisar e apresentar dados da internet, o Observatório da Web se prepara para tornar as informações mais acessíveis para quem quiser ter autonomia para fazer sua própria análise. “A tendência não é apenas observar, mas ter a capacidade de propor e realizar as análises. Já existe o protótipo de um sistema capaz de especificar itens que serão analisados. A ideia é que o usuário não precise da ajuda de especialista”, esclarece o professor da UFMG, que também é coordenador de pesquisa do Instituto Nacional de Ciência e Tecnologia para a Web (InWeb). Meira entende que a internet é um reflexo claro e acessível da sociedade, pois registra com fidelidade o que se passa na cabeça dos internautas. A capacidade de análise, porém, ainda é muito pequena considerando o acúmulo de dados.
O que as pessoas pensam na web? As ferramentas que conseguem analisar a percepção dos internautas podem ter diferentes usos. O professor da Universidade Federal de São João del-Rei (UFSJ) Leonardo Chaves Dutra da Rocha defende que o Saci terá utilidade nas eleições presidenciais. “É possível ter noção do sentimento das pessoas em relação aos candidatos. Como faz análise em tempo real, o algoritmo pode apontar quem ganhou um debate.” Na visão do pesquisador, a ferramenta pode descobrir a percepção das pessoas em relação a aeroportos e estádios durante a Copa do Mundo e a opinião de um novo programa lançado por uma emissora de TV. O algoritmo ainda serve de termômetro para uma campanha de marketing, que pode ser alterada imediatamente diante de uma reação negativa dos internautas. Rocha analisa se haverá patente. Três empresas nas áreas de gestão de riscos, moda e investimentos estão interessadas nos sistemas de análise de sentimento desenvolvidos pelo Observatório da Web da UFMG.