EFFORTUNE

Optimización de la Traducción Automática Estadística Guiada por el Esfuerzo (EFFORTUNE)

Proyecto financiado por el Ministerio de Economía y Competitividad (código TIN2015-69632-R).

Período de actividad: 2016–2018

Breve resumen

Tras el entrenamiento sobre corpus representativos, los sistemas de traducción automática estadística se suelen optimizar para que produzcan traducciones próximas a una serie de traducciones de referencia que forman un corpus de desarrollo. Para esto se usan medidas automáticas de evaluación genéricas basadas en precisión o en errores tales como BLEU y TER. Sin embargo, la correlación esperada de estas medidas con el ahorro real en el esfuerzo de corrección de la traducción (“posteditabilidad”) que se espera al usar estos sistemas ha resultado ser muy limitada. Como resultado, el campo de la traducción automática puede no estar produciendo los sistemas que tan perentoriamente se necesitan en un mundo multilingüe. Se hace por tanto necesario el empleo de medidas de evaluación más avanzadas que se puedan ajustar para medir el esfuerzo de post-edición en tareas concretas de traducción.

Cuando las lenguas implicadas en la traducción son sintácticamente diferentes, los sistemas jerárquicos de traducción automática estadística (un subtipo de sistemas de traducción automática estadística) pueden beneficiarse de una nueva formulación basada en los conocimientos existentes en el campo de la inferencia gramatical de lenguajes de árboles, que a su vez esté lista para ser puesta a punto usando medidas más avanzadas del esfuerzo de post-edición.

El proyecto EFFORTUNE se centrará en la investigación y la innovación en las siguientes áreas:

  1.  el desarrollo de un marco de calidad unificado, sensible a tareas y orientado a negocio, formado por
    1. medidas automáticas de evaluación innovadoras que permitan optimizar los sistemas de traducción automática estadística de manera que el esfuerzo real de post-edición necesario para transformar su salida en texto adecuado para un propósito específico sea mínimo;
    2. funciones de estimación de calidad mejoradas que predigan, con la mayor precisión posible, la cantidad de esfuerzo que realmente se necesita para convertir el resultado de la traducción automática en texto adecuado: esto hará posible presupuestar un encargo de traducción, o seleccionar entre las diferentes tecnologías de traducción disponibles.
  2.  una nueva formulación de la traducción automática estadística jerárquica, inspirada en la inferencia gramatical clásica, en la que una gramática independiente del contexto síncrona probabilística se infiere a partir de textos paralelos alineados palabra a palabra.

Como resultado, los sistemas de traducción automática producidos por EFFORTUNE serán capaces de reaccionar a medidas reales de esfuerzo de post-edición y usarán nuevas formas de establecer representaciones jerárquicas de la equivalencia de traducción. Los desarrolladores de sistemas de traducción automática y directores de proyectos podrán implementar sistemas de traducción automática que ofrezcan la calidad más alta posible para cada aplicación, lo que minimizará así la necesidad de intervención manual y facilitará así la portabilidad entre pares de idiomas y tareas.

Las innovaciones de EFFORTUNE se implementarán e integrarán en las plataformas de traducción automática libre/de código abierto existentes con el fin de maximizar su impacto y adopción, y serán evaluadas competitivamente, tanto internamente como en competiciones públicas de traducción automática, centrándose en aquellos pares de idiomas y tareas donde la puesta a punto y una transferencia sintáctica adecuada tengan el mayor impacto esperado.