Google Tradutor expande catálogo para 243 Idiomas

A atualização, possibilitada pela AI PaLM 2, abrange idiomas falados por 614 milhões de pessoas.

Adnews

27.06.2024

Google Tradutor expande catálogo para 243 Idiomas

O Google Tradutor, serviço de tradução da gigante tecnológica, acaba de passar pela maior expansão de sua história, adicionando 110 novos idiomas ao seu catálogo. Antes desta atualização, o serviço suportava 133 idiomas, o que significa que o número de idiomas quase dobrou, chegando agora a um total de 243.

Essa expansão significativa foi viabilizada pelo modelo de linguagem AI PaLM 2, antecessor do Gemini, que desempenhou um papel crucial na aprendizagem desses novos idiomas. O engenheiro de software do Google, Isaac Caswell, destacou que o modelo foi particularmente eficaz em aprender idiomas relacionados entre si, como os próximos ao hindi (Awadhi e Marwadi) e os crioulos franceses (crioulo seichelense e crioulo mauriciano).

Entre os novos idiomas suportados, destaca-se o Cantonês, um dos idiomas mais solicitados pelos usuários do Google Tradutor. Caswell explicou que o Cantonês apresenta desafios únicos devido à sua sobreposição com o Mandarim na escrita, dificultando a obtenção de dados e o treinamento de modelos de linguagem.

A inclusão desses 110 novos idiomas amplia significativamente o alcance do Google Tradutor, abrangendo idiomas falados por mais de 614 milhões de pessoas, o que corresponde a cerca de 8% da população mundial. Essa expansão inclui tanto idiomas com milhões de falantes quanto línguas de pequenas comunidades indígenas e idiomas em processo de revitalização.

Entre os novos idiomas, destaca-se o Afar, falado em Djibouti, Eritreia e Etiópia, que contou com a maior contribuição voluntária da comunidade para sua inclusão. Outro destaque é o Manx, um idioma celta da Ilha de Man, que quase foi extinto em 1974, mas está sendo revitalizado com milhares de novos falantes. O N’Ko, uma forma padronizada das línguas mandingas da África Ocidental, com um alfabeto único inventado em 1949, também foi incluído. Além desses, há o Punjabi (Shahmukhi), variação do Punjabi escrito no script Perso-Árabe, sendo o idioma mais falado no Paquistão, e o Tamazight (Amazigh), um idioma berbere falado em toda a África do Norte, escrito nos alfabetos latino e Tifinagh. O Tok Pisin, um crioulo baseado no inglês e a língua franca da Papua Nova Guiné, completa a lista dos idiomas destacados.

 

*Com informações do Olhar Digital

Acompanhe o ADNews no Instagram e LinkedIn.

#ADDSomethingNew #ADNewsOficial #ADGroupBR

logo

INBOX

Aprenda algo novo todos os dias.
Assine gratuitamente as newsletters da Adnews.

Digite o seu melhor email
Brasil amplia presença no júri do New York Festivals 2026 | Adnews 25 Anos: O Portal que Narra a Revolução da Publicidade Brasileira | Produka Filmes anuncia chegada da dupla de diretores Murphys ao seu casting | Adobe lança recurso Turntable para revolucionar o design no Illustrator | TikTok Shop comprime jornada de compra e desafia segurança digital no Brasil | Fábrica de Casamentos estreia nova temporada com parceria entre SBT e Disney+ | Campanhas Publicitárias da Copa do Mundo: Estratégias e Impacto no Engajamento Global | KFC Brasil transforma Craque Neto em “Coroneto Sanders” para reinar nas reclamações da Copa 2026 | Cimed investe R$ 200 milhões para transformar a Copa do Mundo em potência de marca e vendas