Posts in CAT systems

Copiar/pegar para traductores

junio 19th, 2012 Posted by blog, CAT systems, herramientas, petraREV, translation tools No Comment yet

Aunque los avances en los modernos procesadores de textos y en los programas de traducción asistida han facilitado notablemente las tareas del traductor, traducir un texto sigue implicando un buen número de actividades mecánicas. Por ejemplo, al traducir la documentación de un software, el traductor debe asegurarse de que la traducción de cada elemento (botón, cuadro de diálogo, mensaje, etc.) corresponde a la que después le aparecerá al usuario en pantalla. Para ello se usa un volcado del software donde figura el texto en el idioma de origen junto a su traducción al idioma de destino. Esta tarea puede automatizarse con las funciones de gestión de terminología que incorporan algunas soluciones de traducción asistida. No obstante, a menudo el cliente impone al traductor herramientas que no incluyen este tipo de funciones, por lo que la herramienta que normalmente acaba utilizándose para realizar estas búsquedas es de propósito general, como el sencillo Bloc de Notas o el conocido Search&Replace.

1

Para agilizar estas tareas, la nueva versión de petraREV incluye una nueva función, ubicada en una nueva pestaña del cuadro de diálogo Buscar. Esta pestaña, llamada Buscar y copiar y descrita en detalle en la ayuda en línea de petraREV, ejecuta en cadena las diversas operaciones para buscar un elemento en un glosario: extrae automáticamente el texto del portapapeles, busca si existe una traducción en el glosario indicado y avisa al usuario si ha encontrado una o varias traducciones, copia al portapapeles el resultado y lo resalta con un código de color. Así, no solo acelera la labor del traductor, sino también reduce la cantidad de pasos (teclas y movimientos de ratón) por realizar.

La nueva función de petraREV propone un modelo que, en breve, intercalar un paso intermedio, «transformar», en la habitual operación «copiar/pegar». En ese paso intermedio se aplica una operación al texto copiado. En la búsqueda de terminología, la transformación consiste en buscar en un glosario, pero la transformación puede incluir varias operaciones para ejecutar tareas que, de otra manera, el traductor debería realizar mecánicamente. Por ejemplo, los cambios de terminología que implican un cambio de género, como cambiar «ordenador» por «computadora», se pueden llevar a cabo encadenando diversas operaciones de sustitución con los determinantes más habituales. Esta estrategia no ahorra el paso de leer cada frase para detectar si hay algún elemento que también precisa un cambio adicional (como, por ejemplo, los adjetivos), pero la mayoría de los cambios se pueden realizar no solo con mayor rapidez, sino también con más precisión.
La cuestión consiste, por tanto, en determinar cuáles son las operaciones que pueden facilitar el trabajo. Buscar en glosarios, reemplazar un texto por otro y cambiar el uso de mayúsculas y minúsculas son las primeras candidatas, aunque este enfoque modular permite crear otras más complejas con el fin de estudiar su comportamiento en determinadas situaciones. Por ejemplo, cuando se trabaja con un reducido número de palabras que aparecen en diversas combinaciones, y a través de operaciones de inversión y sustitución de elementos, se puede crear una versión reducida de un motor de traducción automática útil para traducir software o listas de palabras clave para casos concretos. Este método, mediante el que a partir de un texto de origen se crea un texto de destino, que recuerda vagamente a la gramática generativa de Chomsky, ha demostrado sus flaquezas, si bien su aplicación en ciertos ámbitos no solo podría ser útil en la vida real, sino que también ayudaría en el intento de dilucidar qué ocurre en la mente de un traductor mientras realiza su trabajo. Por el momento, la lista de operaciones solo incluye cuatro opciones, pero esta lista puede ampliarse a voluntad. ¿Qué operaciones podrían hacer que esta función fuera más útil?

Busca las diferencias

octubre 27th, 2011 Posted by blog, CAT systems, fuzzy match, translation memories No Comment yet

¿En qué se parecen dos oraciones? Esta cuestión, engañosamente sencilla, es importante para los traductores autónomos. La mayoría de las agencias de traducción exigen a empleados y autónomos que usen sistemas de traducción asistida con memorias de traducción. Estos sistemas clasifican una a una las oraciones del texto por traducir como nuevas, si no se parecen a ninguna de las que incluye la memoria de traducción de referencia, o de coincidencia 

parcial, si son razonablemente similares a alguna de las traducciones que sí contiene.

Por las palabras de las oraciones de coincidencia parcial se suele pagar la mitad de lo que se abona por una palabra de una oración completamente nueva. En consecuencia, el algoritmo que establece si dos oraciones se parecen lo suficiente o son básicamente distintas tiene un efecto directo sobre el importe que finalmente percibe el traductor. Por ejemplo, tras introducir en la memoria de traducción el primer segmento de la tabla siguiente, para el siguiente segmento obtenemos un porcentaje de coincidencia bastante alto y, por tanto, se pagará ala mitad:

Segmento

% de coincidencia

Are you sure you want to delete the file?

0%

Are you sure you want to overwrite the file?

90%

Curiosamente, los traductores suelen confiar ciegamente en el ordenador. No suelen ser conscientes de que las diferencias de cálculo tienen un efecto directo sobre su remuneración. Tampoco parecen darse cuenta de que programas como SDL Trados, Geoworkz o Idiom tienen sistemas muy diferentes de tratar esta cuestión. Así pues, aplicar la misma tarifa en todos ellos no refleja en absoluto el trabajo y tiempo que requiere cada traducción.

Segmento

Trados

Wordfast

Are you sure you want to delete the file?

0%

0%

Are you sure you want to overwrite the file?

90%

79%

Programar un algoritmo que determine en qué letras o palabras se diferencian dos oraciones resulta sencillo pero ¿basta con ese análisis para justificar la reducción de la tarifa por el ahorro de tiempo que supone disponer de una oración traducida similar de algún modo? Bastan unos ejemplos para comprender que los factores son muchos, como por ejemplo el orden de las palabras o la presencia de etiquetas.

Como suele ocurrir al intentar crear otros algoritmos, el propio concepto que intentamos emular no está definido con nitidez: la ayuda que supone, para traducir una oración, tener otra similar traducida. Una determinada oración muy útil para algunos traductores no resulta de tanta ayuda para otros tantos. En definitiva, resulta arduo conseguir para el algoritmo una objetividad difícil de encontrar en la realidad. A medida que se profundiza en este problema, aparecen muchos otros factores que tal vez hay que considerar. Por ejemplo, convendría tener en cuenta las diferencias en el orden de las palabras y el uso de mayúsculas y minúsculas, así como las variaciones en las etiquetas del texto, etc. ¿No habría que tener en cuenta —un ejemplo adicional— si las palabras que marcan la diferencia son palabras plenas o no?

Aunque casi siempre es posible encontrar para todo factor una definición aceptablemente rigurosa, al final hay que combinar los disímiles factores para reducirlos a un solo porcentaje que pretende aprehender la similitud general de dos cadenas. En breve, resulta inevitable ponderar los factores. Aquí es donde la objetividad es discutible. Por ejemplo, ¿realmente conviene dejar de lado otras oraciones de la memoria notan similares estructuralmente pero con la terminología necesaria para traducir rápidamente la oración de turno?

Todas estas preguntas se adentran cada vez más en la naturaleza íntima de la traducción y los procesos cognitivos que los traductores experimentan al traducir un texto. La mayor facilidad para traducir una oración se asume correlacionada con la cantidad y dificultad de las operaciones cognitivas necesarias para ello.

Del mismo modo se entiende en las memorias de traducción, donde el menor valor se relaciona con la mayor facilidad derivada de tener algo parecido en la memoria (de traducción). Pero podría ocurrir que las memorias humana y automática no funcionen del mismo modo. Deberíamos, pues, profundizar en las diferencias para comprender mejor sus similitudes y su papel en el proceso de traducción.

Así que este es un tema candente por investigar, pues no solo sirve para profundizar en el conocimiento del modo de pensar humano. Aclarar en qué se parecen dos oraciones con mayor precisión podría tener, además, un efecto práctico inmediato en los bolsillos de los traductores, al informar la remuneración justa por su trabajo.

Una aproximación al problema es partir de este supuesto: que el ordenador evalúe con total precisión la relación entre dos oraciones equivale a poder traducirlas correctamente. De ser así, podría determinar con precisión las diferencias en las operaciones necesarias al traducir un segmento textual partiendo de cero (si eso existe) y al traducir contando con una base almacenada en la memoria. Claro que, en este caso, la respuesta a esta pregunta sería mucho menos relevante.

Mientras tanto, ya modo de punto de partida, debería desarrollarse un estándar que armonice loscriterios y un mecanismo de garantía de que se aplican de manera uniforme. Los experimentos para validar las fórmulas como, por ejemplo, evaluar el tiempo que tarda un grupo de traductores en traducir un texto con memorias de traducción más o menos alimentadas podrían ser realmente valiosos. Literalmente, en este caso.

 

by J. Perea

Recent Comments