Pós-edição de tradução automática
O pós-edição é uma técnica de tradução, por meio da qual o tradutor recebe sugestões geradas por computador para aumentar a qualidade e produtividade.
Mediante um custo inicial para a licença ou o treinamento do sistema de tradução, Translated garante uma poupança de 5 % a 20 % sobre as tarifas de tradução.
Desde 2002, já traduzimos mais de 5 milhões de palavras em pós-edição para clientes como a Comissão Européia, a IBM e Google, mas também para muitas outras pequenas empresas empreendedoras.
Quando é conveniente?
Quem traduz mais de 500.000 palavras ao ano por idioma e já acumulou memórias de tradução para 1.00.000 de palavras, terá um retorno sobre o investimento no primeiro ano. Antes desse prazo, se os volumes forem superiores.
Por seu lado, o custo de uma formação varia de € 1.000 a € 5.000 em função do tempo em que os dados estão prontos para tratamento. O desconto sobre as tarifas será da ordem de 0.01 euro por palavra.
Utilizamos a tradução automática, tanto para oferecer traduções de qualidade, quanto para os serviços de gisting em que, por um custo muito mais reduzido relativamente à tradução tradicional, se corrigem apenas os erros mais grosseiros.
Ok, gostei, o que tenho de fazer?
Caso 1: Tem uma memória com mais de 1 milhão de palavras
- Visite o site http://mymemory.translated.net.
- Faça o login, criando uma nova conta, se for necessário.
- Faça o upload da sua memória em formato TMX para permitir o primeiro treinamento gratuito.
- Entre em contato conosco no e-mail info@translated.net indicando o seu nome de usuário. Simultaneamente, mande-nos um texto a traduzir até 1.000 palavras.
- No prazo de 2 semanas, lhe enviaremos:
- o documento traduzido automaticamente com um sistema estatístico aplicado aos seus textos (statistical machine translation)
- a versão correta do tradutor (pós-edição) que poderá utilizar para avaliar a qualidade do produto final
- uma oferta para o treinamento de outros idiomas e uma oferta para o pós-edição.
Caso 2: Não tem uma memória com mais de 1 milhão de palavras
Observa-se o mesmo processo, embora a partir do ponto 4. Utilizaremos inicialmente um sistema genérico como ponto de partida. Custo zero de partida e pequenas poupanças iniciais.
A nossa experiência no pós-edição
- Em parceria com a Systran, foi adjudicada à Translated um projeto da Comissão Européia para experimentar novos modelos para a integração da tradução automática nos processos de tradução humana.
- Translated começou a desenvolver o Semantix, um aplicativo NLP que contém um motor de tradução estatística baseado na teoria de Brown e de Della Pietra e integrado por um modelo de aprendizado baseado na teoria dos mesmos.
- A Translated começou a oferecer serviços de tradução automática SaaS que podem ser acessados através de um API. Desenvolveu o seu primeiro motor baseado em Giza++ e Pharaoz.
- A Translated deu início ao projeto MyMemory: organizar a informação linguística mundial para disponibilizá-la de forma gratuita, na forma de memórias de tradução e de traduções automáticas.
- MyMemory é utilizado internamente para pesquisar nas diferentes memórias.
- O MyMemory atingiu a faixa de 300 milhões de palavras que são disponibilizadas gratuitamente online.
- O MyMemory superou os 5 bilhões de palavras. O projeto foi apresentado por Marco Trombetti com um discurso de apresentação na Cúpula sobre Tradução Automática [Machine Translation Summit] em Ottawa, no Canadá. A IBM entrega à Translated o primeiro seu projeto de pós-edição com tecnologia estatística própria. A Comissão Européia segue o mesmo exemplo. Google desenvolveu o Google Translator Toolkit, uma ferramenta assistida por computador baseada na Internet para a pós-edição e entrega à Translated o primeiro projeto de pós-edição interna: localizar o Toolkit usando o próprio Toolkit.
- O MyMemory espera atingir 50 bilhões de palavras e ser integrado diretamente nas maiores ferramentas de tradução assistida por computador [CAT] e sistemas de gerenciamento de tradução. A nossa missão é: nenhuma frase no mundo inteiro será doravante traduzida duas vezes.