banner

blog

Jul 10, 2023

Conheça Meta SeamlessM4T: tradutor multilíngue

Meta acaba de lançar uma nova ferramenta impressionante chamada SeamlessM4T. Este elegante modelo de IA pode transcrever e traduzir quase 100 idiomas e é um grande passo em frente para tornar as barreiras linguísticas uma coisa do passado.

A empresa afirma que SeamlessM4T, tradução automática massivamente multilíngue e multimodal, pode converter voz em texto e texto em fala em quase 100 idiomas. Ele identifica 100 idiomas de entrada e os transforma em 35 idiomas de saída para funções de fala para fala e de texto para fala.

Por ser distribuído sob a licença Creative Commons CC BY-NC 4.0, os pesquisadores são livres para melhorá-lo. As informações do SeamlessAlign, parte do conjunto de dados de tradução aberta do Meta, também foram disponibilizadas em conjunto com o SeamlessM4T. Ao contrário dos grandes modelos de tradução existentes que dividem a tradução entre vários sistemas, o SeamlessM4T completa o trabalho completo de tradução em uma única operação, de acordo com Meta, tornando-o “um avanço significativo”.

Se o SeamlessM4T funcionar como pretendido, um de seus aspectos intrigantes é sua suposta capacidade de detectar troca de código ou transição entre dois ou mais idiomas dentro de uma única frase. Por exemplo, Meta mostrou em um vídeo como o modelo pode distinguir imediatamente entre Hindi, Telugu e Inglês.

Ele possui o potencial de discernir instantaneamente quando um falante atravessa idiomas, conforme demonstrado em um vídeo cativante onde distingue facilmente entre Hindi, Telugu e Inglês. Esta capacidade poderá revolucionar a comunicação intercultural, promovendo um mundo onde a língua já não seja uma barreira.

"Mantendo nossa abordagem à ciência aberta, estamos lançando publicamente o SeamlessM4T sob uma licença de pesquisa para permitir que pesquisadores e desenvolvedores desenvolvam esse trabalho. Também estamos lançando os metadados do SeamlessAlign, o maior conjunto de dados de tradução multimodal aberto até o momento, totalizando 270 mil horas de fala minada e alinhamentos de texto", diz Meta.

O que é Lhama2: IA do Meta explicada

Para produzir modelos mais leves e gerenciar mais informações, a Meta afirmou ter modificado sua caixa de ferramentas de modelagem de sequência Fairseq para gerar SeamlessM4T.

Segundo Meta, criou um sistema que pode reconhecer frases prejudiciais ou delicadas ao criar o SeamlessM4T. Segundo a definição dada por Meta, palavras tóxicas são aquelas cuja “tradução pode incitar ao ódio, à violência, aos palavrões ou ao abuso”. O objetivo é ser capaz de identificar casos em que a toxicidade introduzida pela tradução de saída não existia anteriormente no conteúdo de origem.

O que é Lhama2
COMPARTILHAR