lunes, 9 de abril de 2012

La alineación y Bitext2TMX


Hoy, vamos a iniciar nuestra andadura por las herramientas de traducción que nos van a simplificar el trabajo. En este post hablaré de la alineación de textos, que proporcionan una valiosa fuente documental y léxica.

En estos años hemos aprendido que uno de los recursos más útiles para un traductor son los textos paralelos, es decir, aquellos que versan sobre el mismo tema y que probablemente tengan parte del vocabulario que necesitaremos para nuestra traducción. Un buen traductor debe tener un corpus de textos paralelos rico y variado (dependiendo de sus campos de trabajo); si encima, este corpus es bilingüe, la tarea es más fácil aún, pues podremos comprobar el uso que se da en cada lengua al término o  expresión necesitados. Sin embargo, tener estos textos en documentos sueltos y desordenados hace que la labor de búsqueda y consulta entre sus líneas sea, cuanto menos, lento y tedioso. Es aquí donde entran en acción los alineadores de textos, como por ejemplo Bitext2tmx o las herramientas de alineación que incorporan programas de traducción asistida como Déjà Vu o Trados.

En todos los casos, el procedimiento es bastante similar, pero hoy nos centraremos en el funcionamiento de Bitext2tmx. Este programa permite segmentar y alinear oraciones traducidas de textos con formatos simples y generar una memoria de traducción en formato TMX que luego podrá usarse con aplicaciones de traducción asistida.

El programa es bastante sencillo y las funciones básicas son accesibles para cualquiera. Una vez que tenemos el texto origen y el meta en archivos con formato txt, abrimos Bitext2tmx y pinchamos en Archivo>Abrir, elegimos los archivos origen y meta y establecemos las lenguas de partida y llegada así como la codificación (UTF-8 es la más adecuada).  Estos pasos son intuitivos y el propio programa hace saltar las ventanas necesarias para elegir los idiomas y la codificación.

Atención: es importante que decidamos cuál es el texto origen y cual el meta en base al tipo de traducciones que solamos hacer o la MT en la que vayamos a incluir esta alineación. La razón es simple, si nuestro trabajo se centra en traducciones directas (EN-ES) pero al alinear, establecemos que el texto origen es español y el meta inglés, es probable que al trabajar en nuestra aplicación de MT esta alineación no nos sirva, pues el programa no reconozca la codificación de los idiomas.

Tras terminar estos pasos, nos aparecerá una ventana que tiene este aspecto:



Como se puede observar, aparecen dos columnas con ambos textos alineados automáticamente por el programa. Es probable, por no decir que es seguro, que esta alineación no sea exacta; para corregirla o adaptarla a nuestras necesidades, tenemos debajo de cada columna los botones "Unir", "Eliminar", "Partir" que, obviamente, sirven para modificar las oraciones, haciéndolas más o menos largas, para eliminar cuestiones irrelevantes etc.

Una vez que hayamos completado de alinear el texto, lo guardaremos pinchando en Archivo>Guardar. Se creará entonces un archivo TMX que podrá ser importado a nuestro entorno de traducción habitual.

Si comparamos este programa con otros más conocidos como Trados WinAlign, veremos que Bitext2tmx es bastante simple y no ofrece tantas herramientas; sin embargo, para iniciarnos en el mundo de la alineación y trabajar textos no muy largos, es una buenísima opción.