AYUTRA

Aprovechamiento de la traducción automática y de otras fuentes de información bilingüe en la traducción asistida por ordenador (AyuTra)

Proyecto financiado por el Ministerio de Economía y Competitividad (código TIN 2012-32615).

Período de actividad: 2013–2015 (–2016?)

Breve resumen

Este proyecto se ha centrado en el desarrollo de técnicas basadas en fuentes de información bilingüe externas (diccionarios, traducción automática) en los entornos tradicionales de traducción asistida por ordenador con el fin de aumentar la productividad en la traducción profesional. De esta forma, el trabajo desarrollado proporciona nuevas utilidades de soporte a la traducción que aprovechan recursos preexistentes, dándoles un nuevo uso. La integración de información bilingüe se lleva a cabo de forma robusta, e independiente de la tecnología que haya detrás de la fuente de información bilingüe, independiente de las lenguas, e independiente del dominio.

Las tres tecnologías de soporte a traductores en el ámbito de la traducción asistida por ordenador que se han desarrollado son: (a) recomendaciones de edición sobre sugerencias de traducción provenientes de memorias de traducción; (b) sugerencias de alternativas de traducción para estas sugerencias; y © ensamblaje interactivo de sugerencias de traducción a nivel de subsegmentos. Las técnicas (a) y © han sido implementadas como extensiones de la herramienta libre/de código abierto de traducción asistida por ordenador OmegaT (accesibles en https://github.com/transducens/OmegaT-Marker-Plugin y https://github.com/dtr5/Forecat-OmegaT). Asimismo, se han desarrollado métodos de evaluación silenciosa del rendimiento profesional cuando se usan herramientas de traducción asistida por ordenador, lo que permite evaluar el rendimiento de las tecnologías desarrolladas (accessible en https://github.com/mespla/OmegaT-SessionLog). También se ha propuesto una utilización creativa de algunas etiquetas del estándar TMX para la anotación de memorias de traducción para facilitar la aplicación de los métodos desarrollados.

Una de las técnicas básicas que permiten el resto de técnicas es el diseño de métodos que perimeten el alineamiento de sub-segmentos y palabras. Estas técnicas han sido implementadas y están accesibles en https://github.com/transducens/Flyligner.

En el ámbito de este proyecto, también se ha investigado en la creación de nuevos recursos bilingües que permiten la aplicación de las técnicas de asistencia a traductores en traducción asistida por ordenador. Por una parte, se han desarrollado nuevas técnicas para la recolección de corpus paralelos a partir de sitios web multilingües. Éstas técnicas se han implementado en la herramienta Bitextor (accesible en http://sourceforge.net/projects/bitextor/). Asimismo, se han desarrollado técnicas para el desarrollo asistido de sistemas de traducción automática basada en reglas (una de las fuentes de información bilingüe más utilizada en nuestros experimentos) a partir de corpus paralelos.

Entre las aportaciones teóricas de este proyecto, se encuentra una propuesta para un marco que unifica los procesos de selección de tecnologías de traducción, su mejora iterativa (tuning), su evaluación y la estimación de la calidad de la traducción.

Equipo integrante

Los investigadores de Ayutra están todos en el grupo Transducens del Departamento de Lenguajes y Sistemas Informáticos de la Universitat d'Alacant.

 
start.txt · Última modificación: 19/01/2016 08.39 por mespla · []
Recent changes RSS feed Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki