in

Meta lança modelo de IA para tradução de fala entre dezenas de idiomas

Meta lança modelo de IA para tradução de fala entre dezenas de idiomas

Nesta terça-feira, dia 22, a empresa Meta divulgou um novo modelo de inteligência artificial (IA) que tem a capacidade de traduzir e transcrever discursos em vários idiomas.

Esse avanço representa um possível fundamento para a criação de ferramentas que permitam a comunicação instantânea, superando as barreiras linguísticas.

A companhia anunciou por meio de um comunicado que o seu modelo chamado SeamlessM4T é capaz de realizar traduções entre texto e fala em quase 100 idiomas, bem como tradução integral de discurso para discurso em 35 idiomas.

Isso é conseguido ao combinar tecnologias que anteriormente estavam disponíveis apenas em modelos separados.

Mark Zuckerberg, CEO da Meta, expressou a sua visão de como essas ferramentas poderiam facilitar as interações entre os utilizadores de todo o mundo no metaverso.

O metaverso consiste num conjunto de mundos virtuais interligados, nos quais a empresa tem apostado como o futuro.

A Meta está oferecendo o acesso público e não comercial ao modelo, de acordo com o comunicado oficial.

Este ano, a maior empresa de mídia social do mundo lançou diversos modelos de IA, muitos deles gratuitos. Entre eles, destaca-se o grande modelo linguístico denominado Llama.

Esta iniciativa representa uma concorrência significativa aos modelos proprietários comercializados pela OpenAI, apoiada pela Microsoft, e pela Alphabet, empresa mãe da Google.

Zuckerberg defende que um ecossistema de IA aberto beneficia a Meta, já que a empresa tem mais a ganhar ao externalizar a criação de ferramentas direcionadas ao consumidor para as suas plataformas sociais, em comparação com a opção de cobrar pelo acesso aos modelos.

No entanto, assim como o restante da indústria, a Meta enfrenta questões legais em relação aos dados de treinamento utilizados para desenvolver os seus modelos.

Nesse caso do modelo SeamlessM4T, os investigadores da Meta explicaram num artigo de pesquisa que os dados de treinamento de áudio foram obtidos a partir de 4 milhões de horas de “áudio bruto originado de um repositório publicamente acessível de dados rastreados da web”.

No entanto, o repositório específico não foi detalhado.

Até mesmo a origem dos dados de texto foi mencionada no artigo de pesquisa. Estes dados foram provenientes de conjuntos de informações compilados no ano anterior, contendo conteúdo extraído da Wikipedia e de websites relacionados.

5 Receitas de Enroladinho de Salsicha: fácil de fazer

5 Receitas de Enroladinho de Salsicha: fácil de fazer

Saiba qual ingrediente falta nas dietas veganas, segundo cientistas

Saiba qual ingrediente falta nas dietas veganas, segundo cientistas