Bienvenida

BIENVENID@S a nuestro blog sobre la traducción automática

lunes, 10 de enero de 2011

TIPOS DE TRADUCCIÓN AUTOMÁTICA


En general, todos tenemos una idea de lo que es la traducción automática, pero, ¿Sabemos los diferentes tipos que existen?


Nuestro objetivo en esta sección es explicaros los diferentes tipos, en qué consisten y las principales diferencias entre unos y otros.

Para ello comenzaremos distinguiendo los 3 tipos principales de Traducción automática:

-  Traducción automática basada en reglas.
-  Traducción automática basada en corpus.
-  Traducción automática basada en el contexto.


La traducción automática basada en reglas

La traducción automática basada en reglas, se basa en incontables reglas lingüísticas integradas así como en millones de diccionarios bilingües para cada par de idiomas. 

Consiste en realizar transformaciones a partir del original, reemplazando las palabras de la LO por su equivalente más apropiado en la LM.

En general, en una primera fase se analizará un texto, normalmente creando una representación simbólica interna. Dependiendo de la abstracción de esta representación, también podemos encontrar diferentes grados: desde los directos, que básicamente hacen traducciones palabra por palabra, hasta interlingua, que utiliza una representación intermedia completa. De manera que podemos encontrar diferentes subtipos dentro de este tipo de traducción:


Mediante...

Transferencia: el análisis del original juega un papel más importante y da paso a una representación interna  que es la que se utiliza como enlace para traducir entre idiomas distintos.
Con este acercamiento es posible obtener traducciones de cierta calidad, pudiendo llegar a fiabilidades por encima del 90%. Es por esto que los sistemas de transferencia han dominado el mundo de la traducción automática durante las últimas décadas.

Lenguaje intermedio:  El lenguaje original, por ejemplo un texto que debe ser traducido, es transformado a un lenguaje intermedio, cuya estructura es independiente a la del lenguaje original y a la del lenguaje final. El texto en el lenguaje final se obtiene a partir de la representación del texto en el lenguaje intermedio. En general a esta lengua intermedia se la llama interlingua.



La traducción automática basada en corpus

La traducción automática a partir de un corpus lingüístico se basa en el análisis de muestras reales con sus respectivas traducciones, usando dos tipos de mecanismos: 

EstadísticaMediante este mecanismo, las traducciones se generan en base de los modelos estadísticos cuyos parámetros derivan del análisis de corpus monolingües y bilingüesSe necesitan un mínimo de 2 millones de palabras para un dominio específico y más incluso para el idioma en general.

Basada en ejemplos: se caracteriza por el uso de un corpus bilingüe como principal fuente de conocimiento en tiempo real. Es esencialmente una traducción por analogía y puede ser interpretada como una implementación del razonamiento por casos-base empleado en el aprendizaje automático, que consiste en la resolución de un problema basándose en la solución de problemas similares.

A continuación, os ofrecemos una tabla en la que se informa de las principales diferencias entre la traducción basada en reglas y la traducción estadística:
MT basada en reglasMT estadística
+ Calidad coherente y previsible- Calidad de la traducción imprevisible
+ Calidad de la traducción fuera del dominio- Calidad fuera del dominio deficiente
+ Conoce las reglas gramaticales- No conoce la gramática
+ Alto rendimiento y robustez- Elevados requisitos de CPU y espacio en disco
+ Coherencia entre versiones- Incoherencia entre versiones
- Falta de fluidez+ Buena fluidez
- Es difícil manejar las excepciones a las reglas+ Buena para tratar las excepciones a las reglas
- Costos elevados de desarrollo y personalización+ Desarrollo rápido y rentable siempre que exista el corpus requerido


Y finalmente, el tercer tipo de traducción automática: 


La traducción automática basada en el contexto

Se trata de un método basado en  ideas bastante simples, que ofrece unos muy buenos resultados en comparación a algunos de los métodos anteriores. Cuenta además con una ventaja: añadir nuevas lenguas, ya que solo se necesita un buen diccionario y un corpus en la LM.

¿En qué consiste?

Este tipo de traducción automática utiliza técnicas basadas en hallar la mejor traducción para una palabra fijándose en el resto de palabras que la rodean, básicamente  trata el texto en unidades de entre 4 y 8 palabras, de manera que se traduce cada una de ellas por su traducción al idioma destino y se eliminan las traducciones que han generado una “frase” sin sentido.


Eso es todo en cuanto a los tipos de traducción automática. Esperamos que tengáis ahora una idea más clara.

No hay comentarios:

Publicar un comentario