A Samsung Research na Índia participa da série “A Curva de Aprendizagem”, que fala sobre as pessoas e as inovações por trás da democratização da IA móvel
À medida que a Samsung segue inovando em experiências móveis premium de Inteligência Artificial, visitamos os centros de pesquisa da Samsung em todo o mundo para saber como o Galaxy AI1 está ajudando mais pessoas a maximizar seu potencial.
O Galaxy AI oferece atualmente suporte a 16 idiomas, para que mais pessoas possam expandir seus recursos linguísticos, mesmo off-line, graças à tradução no dispositivo em recursos como Tradução Simultânea2, Intérprete, Notas Inteligentes3 e Assistente de Navegação.
Mas o que está envolvido no desenvolvimento da linguagem de Inteligência Artificial? Na terceira parte desta série, visitamos o Brasil para saber como as equipes trabalham entre as diferentes culturas e fronteiras para levar o Galaxy AI para mais pessoas. Desta vez, estamos na Índia para conhecer o valor da cooperação com parceiros locais.
Escondido dentro do Vellore Institute of Technology em Chennai, na Índia, há um laboratório repleto de equipamentos futurísticos de áudio. É possível encontrar manequins – conhecidos no setor como simuladores de cabeça e tronco -, bem como microfones binaurais e aparelhos auditivos. Eles ficam guardados em câmaras especiais tratadas com um avançado sistema de absorção de som, tornando esse laboratório o primeiro do gênero na Índia. Imagine que uma instalação como essa é usada para desenvolver os mais novos equipamentos de alta fidelidade (Hi-Fi) de última geração.
É lá que o Vellore Institute of Technology colabora com a Samsung para produzir e desenvolver dados e ideias que alimentam os mais recentes modelos de Inteligência Artificial para os recursos de linguagem do Galaxy AI.
A unidade foi desenvolvida como parte do Samsung SEED (Students Ecosystem for Engineered Data) Labs – uma iniciativa que permite que equipes universitárias, estudantes e estagiários na Índia trabalhem em projetos encomendados pela Samsung desde 2021. Esse é apenas um dos vários programas universitários financiados pela Samsung, em que os alunos têm a oportunidade de trabalhar em projetos com especialistas técnicos da empresa.
“Como estudante, adoro poder trabalhar em vários projetos com uma empresa conhecida e respeitada como a Samsung”, diz Yashika Ilanchezhiyan, estudante do Samsung SEED. “Ganhei confiança para aprender novas habilidades de forma prática e sinto que estou fazendo uma diferença real nos produtos atuais e futuros”.
“Esse tipo de colaboração é benéfica para todos”, diz Giridhar Jakki, Diretor de IA voltada para Idiomas do Instituto de P&D da Samsung na Índia – Bangalore (SRI-B). “Graças aos nossos projetos com universidades, podemos acessar conhecimentos adicionais e conjuntos de dados customizados. Em troca, as universidades parceiras recebem investimentos, incentivos financeiros e orientação especializada da Samsung”.
Diminuindo as barreiras linguísticas
O SRI-B tem colaborado com equipes de todo o mundo para desenvolver modelos de Inteligência Artificial para os idiomas inglês britânico, indiano e australiano, bem como tailandês, vietnamita e indonésio.
Recentemente, os principais engenheiros de outros centros de pesquisa da Samsung visitaram Bangalore, na Índia, onde a equipe do SRI-B ajudou a desenvolver a tecnologia para trazer o vietnamita, o tailandês e o indonésio para o Galaxy AI. Assim, o SRI-B ficou numa posição ideal para desenvolver o idioma hindi para o Galaxy AI.
Segundo Jakki, “Todo idioma tem seus desafios. Mas quando pensamos no objetivo final de dar às pessoas a capacidade de se comunicar em outros idiomas, todo o esforço vale a pena. Estávamos ansiosos para trazer o hindi para a Galaxy AI”.
Não foi fácil desenvolver o modelo de Inteligência Artificial em hindi. A equipe precisou garantir que mais de 20 dialetos regionais, inflexões vocais, pontuação e coloquialismos fossem contemplados. Além disso, os falantes de hindi costumam misturar palavras em inglês em suas conversas. Isso exigiu que a equipe realizasse diversas sessões de treinamento de modelos de Inteligência Artificial com uma combinação de dados traduzidos e transliterados.
“O hindi tem uma estrutura fonética complexa que inclui sons retroflexos – sons feitos enrolando a língua na boca – que não existem em muitos outros idiomas”, diz Jakki. “Para desenvolver o elemento de síntese de fala da solução de Inteligência Artificial, analisamos cuidadosamente os dados com linguistas nativos para entender todos os sons exclusivos e criamos um conjunto especial de fonemas para dar suporte a dialetos específicos do idioma”.
Os esforços de colaboração entre a Samsung e os parceiros do setor acadêmico foram fundamentais para o desenvolvimento do modelo de linguagem de Inteligência Artificial que refletisse as nuances culturais das regiões da Índia.
O Vellore Institute of Technology ajudou a obter quase um milhão de linhas de dados de áudio segmentados e organizados sobre fala, palavras e comandos de conversação. Os dados foram um componente fundamental para uma tarefa tão crítica como a de incorporar o idioma ao Galaxy AI. O trabalho com universidades garantiu à Samsung o uso de dados da mais alta qualidade.
Conexões globais geram grandes impactos
Este projeto resume perfeitamente a filosofia de colaboração aberta da Samsung e a crença da empresa de que compartilhar conhecimentos e perspectivas garante uma inovação significativa. No caso do SRI-B, isso não envolve apenas o trabalho com o meio acadêmico, mas também o compartilhamento de ideias e práticas recomendadas com outros centros de pesquisa da Samsung em todo o mundo.
“Tenho muito orgulho do que conquistamos com a ajuda de nossos parceiros”, diz Jakki. “A inovação em IA por meio da colaboração é uma grande parte do que fazemos. Continuaremos a entender, coletar e analisar melhor os dados linguísticos para que mais pessoas possam ter acesso às ferramentas de IA no futuro”.