Posts in herramientas

Comprobación de la coherencia léxica con petraREV

mayo 27th, 2013 Posted by blog, coherencia, comprobación, herramientas, localización, petraREV, revisión, revisión asistida No Comment yet

Los archivos bilingües utilizados con tanta frecuencia en localización resultan muy útiles cuando un revisor, ya sea autónomo o asalariado, debe trabajar sobre un texto. Hay muchas maneras eficaces de comprobar que la terminología de una traducción es la correcta. Por ejemplo, podemos realizar un vaciado terminológico de estos archivos, bien manualmente o bien mediante un sistema de extracción automática de términos, y recurrir a una herramienta que garantice que en cada ocasión se ha utilizado el término correcto. Lamentablemente, la mayoría de estas posibilidades queda fuera del alcance de numerosos traductores y revisores, para quienes el tiempo que pueden dedicar a la tarea no permite emplear estos métodos.

petrarevlogo

Además, aún cuando optaran por extraer la terminología presente en un texto, al no existir un límite perfectamente definido entre qué es un término y qué no lo es, muchas incoherencias terminológicas pueden pasar desapercibidas. Algunas palabras extremadamente sencillas y aparentemente sinónimas, como añadir y agregar, por triviales que parezcan a primera vista, tal vez merezcan tratarlas como términos en contextos donde haya unas reglas estrictas sobre la preferencia por una de ellas.

Por último, estas comprobaciones terminológicas pueden ser precisamente más necesarias cuando no se dispone del tiempo adecuado para someter la traducción a una revisión minuciosa y, por lo tanto, menos aún para confeccionar glosarios.

En estos casos, es mejor contar con que el revisor solo va a poder dedicarle un tiempo cero a estos menesteres y únicamente querrá ver resultados significativos que hagan que el tiempo invertido en examinarlos sea más provechoso que una revisión manual del texto.

Una posibilidad que a simple vista puede parecer obvia es crear una especie de macroglosario que contenga información global sobre la correspondencia de términos en una combinación de idiomas particular. Por ejemplo, podemos pensar que cada vez que aparezca Spain debe traducirse como España, cuando aparezca Canada debe traducirse como Canadá, etc.

Lamentablemente, a poco que nos pongamos a crear este macroglosario nos daremos cuenta de que su utilidad disminuye a medida que incorporamos más términos. Retomando el ejemplo sobre añadir y agregar, si introducimos ambas posibilidades como traducciones aceptadas del verbo add, el sistema pierde la capacidad de detectar el uso incoherente de estos términos.

El problema radica en que los textos suelen ser muy regulares cuando nos limitamos a uno concreto, pero muy irregulares entre sí, esto es, cuando cambiamos de uno a otro. De esta manera, realmente podemos crear un macroglosario para comprobar la terminología de un texto en particular, pero no podemos aplicarlo directamente, porque antes debemos ajustarlo a ese texto que queremos revisar.

Llegados a este punto, se abren dos posibilidades: la primera es emular los sistemas estadísticos de entrenamiento y reservar una parte del texto para entrenar nuestro macroglosario y, a continuación, aplicar las enseñanzas derivadas de esa parte al resto del texto. Por ejemplo, podemos revisar concienzudamente un 10% o un 20% del texto y luego ver si el texto cumple los criterios que implícitamente se establecen en esa parte.

Aunque el esfuerzo que debe realizar el revisor se reduce bastante, ya que solo debe establecer una división entre lo que se revisa y lo que no, aún es posible buscar un método más eficiente que lo libere incluso de tener que tomar esta decisión, gracias a una curiosa particularidad de los errores. Y es que muchos de los errores más graves suelen ser extremadamente poco frecuentes. Por tanto, si una línea de un texto contiene un error, no es descabellado suponer que ese error solo aparece en esa línea y, por tanto, podemos utilizar el resto del texto para entrenar nuestro glosario con la información que nos permita detectarlo.

Para ilustrar este método vamos a ver un ejemplo muy sencillo. Imaginemos que en nuestra recopilación de posibles traducciones, hemos especificado dos posibles traducciones para el término expiration: caducidad y vencimiento. Con esta información queremos revisar los siguientes dos segmentos:

The expiration date cannot be earlier than today.
La fecha de caducidad no puede ser anterior a la actual.
Segmento 1

The expiration date is not valid.
La fecha de vencimiento no es válida.
Segmento 2

Al aplicar el algoritmo propuesto al segmento 1, se detectaría que expiration se ha traducido como vencimiento en el resto de la traducción (en este caso el segmento 2). Por tanto, al no encontrar este término se mostraría una advertencia.

Por supuesto, este método presenta varios inconvenientes. Por ejemplo, en cuanto un error se repite en dos líneas, el sistema pierde la capacidad de detectarlo, lo que lo invalida para detectar errores recurrentes. No obstante, ofrece una nueva manera de detectar errores que pasan desapercibidos en la mayoría de las comprobaciones que realizan las aplicaciones de revisión asistida en la actualidad, con la ventaja añadida de crear muy poco ruido.

Copiar/pegar para traductores

junio 19th, 2012 Posted by blog, CAT systems, herramientas, petraREV, translation tools No Comment yet

Aunque los avances en los modernos procesadores de textos y en los programas de traducción asistida han facilitado notablemente las tareas del traductor, traducir un texto sigue implicando un buen número de actividades mecánicas. Por ejemplo, al traducir la documentación de un software, el traductor debe asegurarse de que la traducción de cada elemento (botón, cuadro de diálogo, mensaje, etc.) corresponde a la que después le aparecerá al usuario en pantalla. Para ello se usa un volcado del software donde figura el texto en el idioma de origen junto a su traducción al idioma de destino. Esta tarea puede automatizarse con las funciones de gestión de terminología que incorporan algunas soluciones de traducción asistida. No obstante, a menudo el cliente impone al traductor herramientas que no incluyen este tipo de funciones, por lo que la herramienta que normalmente acaba utilizándose para realizar estas búsquedas es de propósito general, como el sencillo Bloc de Notas o el conocido Search&Replace.

1

Para agilizar estas tareas, la nueva versión de petraREV incluye una nueva función, ubicada en una nueva pestaña del cuadro de diálogo Buscar. Esta pestaña, llamada Buscar y copiar y descrita en detalle en la ayuda en línea de petraREV, ejecuta en cadena las diversas operaciones para buscar un elemento en un glosario: extrae automáticamente el texto del portapapeles, busca si existe una traducción en el glosario indicado y avisa al usuario si ha encontrado una o varias traducciones, copia al portapapeles el resultado y lo resalta con un código de color. Así, no solo acelera la labor del traductor, sino también reduce la cantidad de pasos (teclas y movimientos de ratón) por realizar.

La nueva función de petraREV propone un modelo que, en breve, intercalar un paso intermedio, «transformar», en la habitual operación «copiar/pegar». En ese paso intermedio se aplica una operación al texto copiado. En la búsqueda de terminología, la transformación consiste en buscar en un glosario, pero la transformación puede incluir varias operaciones para ejecutar tareas que, de otra manera, el traductor debería realizar mecánicamente. Por ejemplo, los cambios de terminología que implican un cambio de género, como cambiar «ordenador» por «computadora», se pueden llevar a cabo encadenando diversas operaciones de sustitución con los determinantes más habituales. Esta estrategia no ahorra el paso de leer cada frase para detectar si hay algún elemento que también precisa un cambio adicional (como, por ejemplo, los adjetivos), pero la mayoría de los cambios se pueden realizar no solo con mayor rapidez, sino también con más precisión.
La cuestión consiste, por tanto, en determinar cuáles son las operaciones que pueden facilitar el trabajo. Buscar en glosarios, reemplazar un texto por otro y cambiar el uso de mayúsculas y minúsculas son las primeras candidatas, aunque este enfoque modular permite crear otras más complejas con el fin de estudiar su comportamiento en determinadas situaciones. Por ejemplo, cuando se trabaja con un reducido número de palabras que aparecen en diversas combinaciones, y a través de operaciones de inversión y sustitución de elementos, se puede crear una versión reducida de un motor de traducción automática útil para traducir software o listas de palabras clave para casos concretos. Este método, mediante el que a partir de un texto de origen se crea un texto de destino, que recuerda vagamente a la gramática generativa de Chomsky, ha demostrado sus flaquezas, si bien su aplicación en ciertos ámbitos no solo podría ser útil en la vida real, sino que también ayudaría en el intento de dilucidar qué ocurre en la mente de un traductor mientras realiza su trabajo. Por el momento, la lista de operaciones solo incluye cuatro opciones, pero esta lista puede ampliarse a voluntad. ¿Qué operaciones podrían hacer que esta función fuera más útil?

¿Piensas en horizontal o en vertical?

marzo 8th, 2012 Posted by blog, herramientas, informática, TAO, traducción asistida por ordenador No Comment yet
Al presentar al traductor el texto por traducir, los programas de traducción asistida utilizan interfaces muy diferentes. Un posible criterio para clasificarlas consiste en distinguir entre las que presentan los segmentos como líneas separadas por determinados caracteres (figura 1) y las que presentan los segmentos en forma de tabla (figura 2).


Figura 1. Presentación de los segmentos en forma de líneas (horizontal)

 


Figura 2. Presentación de los segmentos en forma de tabla (vertical)

 

En el primer grupo podemos incluir la mayoría de las versiones del popular Trados, así como otros programas que parecen haberse inspirado en este sistema de trabajo, tales como WordFast Classic, Translation Workspace, Gtranslator o Launchpad Translations. En el segundo grupo, que probablemente resulte más nutrido, se cuentan Idiom Workbench, SDLx, SDL Trados y POedit, entre otros.
 
Aparte de la diferente manera de presentar los segmentos, los programas del primer grupo vemos también se caracterizan por incluir el texto intersticial de los segmentos, es decir, el texto que no es necesario traducir (por ejemplo, las imágenes de los documentos redactados con un procesador de textos o las etiquetas de los documentos escritos en un lenguaje de maquetación). Esta es, probablemente, la razón que motiva la elección de la presentación en tabla, ya que una distribución por líneas habría obligado a duplicar en pantalla una importante cantidad de información, sin contar con las dificultades técnicas que habría podido suponer.
 
La cuestión es que, independientemente de las razones por las que haya sido tomada en cada caso, esta decisión no suele ponerse en cuestión a pesar de su impacto sobre el trabajo del traductor, tanto en lo relativo a su calidad como a su rapidez. Desde luego, el método de trabajo es similar en ambos casos, ya que la mayoría de los traductores suelen comenzar a traducir un segmento copiando exactamente el texto de origen para, a continuación, sobrescribir (o machacar) el texto en la lengua de origen por la correspondiente traducción. Este método presenta la ventaja de que minimiza la posibilidad de cometer errores al tener que reproducir (o cortar y pegar) elementos como cifras, etiquetas, nombres propios, etc.
 
Aun así, cuando el texto se presenta en forma de columnas vemos que el menor espacio horizontal disponible obliga al traductor a trabajar con un mayor número de líneas y, curiosamente, parece que determinados errores abundan más en los textos traducidos con este tipo de interfaz. Por ejemplo, parece más habitual repetir palabras, dejar dobles espacios y, tal vez, cometer errores de concordancia entre palabras de líneas diferentes.
 
Al revisar el texto, la situación cambia y la presentación en forma de tabla resulta más cómoda para seguir el texto de la traducción y recurrir al texto de origen con facilidad. La presentación con el formato lineal, por otro lado, sólo resulta aconsejable cuando se puede ocultar el texto de origen y ver el texto de la traducción con el formato para el que está diseñado.
 
A pesar de los grandes avances que han sufrido los ordenadores durante los últimos años, resulta curioso que haya aplicaciones, como los sistemas de traducción asistida, que se han aferrado a los viejos esquemas y no incorporan conceptos ya muy populares en la informática. Por ejemplo, las aplicaciones dirigidas al gran público ya han descubierto el valor que los usuarios confieren a poder personalizar la interfaz (y hasta el comportamiento) de una aplicación a su gusto. Incorporar estas opciones a los sistemas de traducción asistida permitiría agilizar el trabajo del traductor y elevar la calidad de los textos.
 
Más allá de la metáfora del papel, en la que se representan en pantalla las traducciones de manera similar a como se imprimirían en un libro, una interfaz de ordenador ofrece infinitas posibilidades de presentación visual utilizando, por ejemplo, colores y signos, que nos permitirían observar el texto desde diferentes puntos de vista. Un buen comienzo, por ejemplo, podría ser permitir que el usuario pudiese elegir entre la manera en que se le presentan los segmentos por traducir y que su espacio de trabajo en pantalla deje de ser un minúsculo recuadro de la pantalla rodeado de información que no le interesa.

¿Qué interfaz de traducción asistida prefieres?
Vote

Recent Comments