7 de abril de 2010


Un mundo sin fronteras

idiomáticas

Los buscadores de Internet impulsan la traducción automática e instantánea con éxito creciente en los textos no creativos

JAVIER MARTÍN 04/04/2010


"El traductor automático me ha salvado la vida", confiesa Jordi Ramot. Este gerundense dirige Wikiloc, un sitio donde la gente cuelga sus excursiones. Más de 156.000 rutas de 168 países. Excursionistas de todo el mundo le escriben a Ramot como si Babel no existiera. "Ven la página en su idioma y se creen que yo lo hablo".


Google traduce en 52 idiomas y 2.500 combinaciones, Bing en 20 y Yahoo! en 11

"El ordenador no entiende el lenguaje, lo procesa", dice un experto

En el mundo real, Ramot se entiende en cinco idiomas, una nadería en el ciberespacio. "Paso el traductor de Google para escribir en griego, ruso, polaco, sueco... Me llega un e-mail en ruso, lo traduzco online, escribo mi respuesta en español o inglés, lo vuelvo a traducir al ruso y lo envío. Funciona muy bien. Cuando me responden dando las gracias en ruso me pregunto si saben que yo estoy en Girona y no en Moscú".

"El mayor obstáculo para el entendimiento global es idiomático", explica Javier Arias, ingeniero lingüístico de Google. "Nuestro objetivo fundacional era ordenar toda la información y hacerla accesible". El gran buscador traduce 52 idiomas en más de 2.500 combinaciones posibles. Gracias al poderío de la potencia de cálculo de decenas de miles de ordenadores, Google ha llegado más lejos que nadie en la traducción automática, gratis, universal y al instante.

El traductor de Google es el más habitual, pero no el único. También lo tienen los buscadores Bing y Yahoo! y varias universidades españolas investigan proyectos sobre lenguas del Estado. Además, la traducción automática de calidad es un negocio para empresas especializadas.

La filosofía de la traducción automática siempre es la misma: llenar el ordenador de información, empacharle de diccionarios y de gramáticas. El ordenador traduce según la información que almacena; cuanta más, mejor. "El ordenador no entiende el lenguaje, lo procesa", describe Juan Alonso, directivo de Lucy Software, un traductor automático para empresas.

El límite es la capacidad de memoria; la de la computadora de casa es limitada, sin embargo los buscadores de Internet aprovechan la capacidad casi infinita de sus redes de ordenadores para llenarlos de información. Miles de diccionarios, millones de documentos, leyes, discursos de la ONU y del Parlamento Europeo traducidos por humanos, con carácter oficial y a decenas de idiomas. Un aprendizaje de idiomas por acumulación de información (Internet no tiene problema de estanterías) y de usuarios (cientos de millones de personas empleando estos traductores y corrigiéndoles).

El Translate me ha traducido "fan", aficionado, por ventilador, en un texto en el que no cabía la confusión. "Ante el error se puede optar por dos sistemas de corrección", explica Arias, "el artesanal, que introduce manualmente correcciones, y el algorítmico, que, antes de tocar nada, busca averiguar por qué el algoritmo ha llegado a esa conclusión en ese contexto. Google opta por el segundo sistema que a largo plazo da mejores rendimientos. Introducir manualmente excepciones y más excepciones nos llevaría al caos".

Cada 14 días muere una lengua. Hay 2.500 en peligro de extinción, muchas de ellas amenazadas por los idiomas-asesinos: inglés, español y francés. En el año 2100 pueden haber desaparecido la mitad de las 7.000 lenguas actuales, según la Unesco. La traducción automática podría frenar la tendencia. Gracias a ella es posible la comunicación y los negocios, sin abandonar la lengua materna. Del yiddish al gallego, del suajili al letón o del bielorruso al afrikaans. Los textos de 52 idiomas en Google, de 20 en Bing y de 11 en Yahoo! se traducen automáticamente.

Pero el mundo de la traducción automática ni empezó ni acabará en Internet. Antes de que Google existiera, Óscar Suau y su equipo se inventaron un sistema para la traducción automática de El Periódico de Catalunya, que en 1994 se empezó a vender en castellano y catalán. Suau creó Automatictrans, empresa que hoy da servicio, entre otros, a las agencias Efe y Europa Press y a la web del Ministerio de Educación, "la única de la Administración con sus contenidos en las cuatro lenguas del Estado", explica Suau.

"A diferencia de otros traductores, nuestro método emplea tres sistemas, el estadístico, que es el de Google; el sistema de memorias de traducción dinámica y el de las reglas gramaticales de cada idioma", explica Suau. Los textos van pasando los tres filtros. "Si el primero detecta una palabra dudosa, se encola para que lo coja el corrector (automático) que, una vez asegurado el término, lo devuelve al sistema para que lo aprenda".

Suau deja claro que la traducción automática se divide entre la que sólo persigue captar el sentido del texto, como Google, y la publicable o productiva. Es el caso de los servicios de pago que ofrecen Automatictrans o Lucy Software. "A diferencia de los buscadores, nosotros empleamos sistemas híbridos, técnicas mixtas: el algoritmo y la corrección humana", explica Alonso, que tiene entre sus clientes a las administraciones y a grandes corporaciones como SAP o Volkswagen. "Indudablemente ha mejorado la calidad respecto hace una década, pero nunca será comparable a la traducción humana".

Sin embargo, Suau cree que el éxito puede llega al 99%. "En lenguas cercanas, como las latinas, la calidad roza el 95% y con las correcciones del cliente alcanza el 99%. En lenguas como euskera, inglés o chino, los resultados rondan el 80% de éxito".

Los expertos coinciden en que la traducción automática de la obra creativa es imposible. "Pero son sólo el 10% de la producción", advierte Suau, que cree inviable económicamente las webs en varios idiomas y con nuevos contenidos diarios. "La traducción automática reduce los costes hasta un 85% respecto a las webs sin esta tecnología".

Las empresas como Automatictrans y Lucy Software, o los proyectos universitarios juegan la carta de la especialización. "No creo en la traducción universal", dice Suau. "En Efe, el sistema que traduce la información local es diferente al de economía, y así podrá distinguir cuándo un banco es para sentarse, para meter dinero o para almacenar sangre. Creamos sistemas para el contenido de cada cliente, con sus propias normas de estilo. El primer punto es tecnología, pero el segundo, metodología".

Los avances no se detienen. Desde hace unos meses ya se traduce de voz a texto, mucho más complicado técnicamente que de texto a voz. La novedad llega de la mano de YouTube. A petición del internauta es capaz de que un vídeo con voz en inglés incorpore subtítulos en castellano. Más aún, Android, el sistema telefónico de Google, ya es capaz de traducir y convertir la voz en texto. Según explica Arias, la técnica empleada es la más ambiciosa. "El clásico dictado al ordenador de un texto hasta que reconoce la voz del que habla, pero con millones y millones de usuarios. El sistema va aprendiendo con el tiempo y el uso. Al igual que el ordenador, el teléfono no tiene suficiente potencia, o sea información, para traducir. Nosotros esa voz la enviamos a la nube, a Internet, donde la potencia de información es infinita, y la nube te lo devuelve traducido, en texto al segundo. Es bastante revolucionario".

Lo último son las gafas Tele Scouter, de la empresa japonesa Nec. Traducen en tiempo real lo que el interlocutor al que mira pronuncia, o sea, será literal decir: "Ya veo lo que dices". Con estas gafas, si un chino hablando chino se mirara a los ojos de un español hablando español, ambos se entenderían con la inmediatez de una película con subtítulos.

En las lentes se proyecta el texto, para lo cual llevan integrados una cámara y un micrófono, que recogen las palabras que se pronuncian y que las envía a un pequeño ordenador que lleva encima, envía la voz a Internet que convierte el audio en texto en el idioma que hayamos escogido.

Los avances no acaban. Aquí llega otra vez Google con su conversor fonético. Convertir caracteres latinos a su equivalente fonético en hindi, marati o urdu, entre otras lenguas no romanizados. Si queremos decir "Hoy luce el sol" en telugu, pero no sabemos pronunciar esos caracteres, Google voceará lo escrito. Si no tenemos el teclado en telugu, escribe cómo te suena que Google lo convierte en el sonido de la lengua nativa.

Gracias a que lio sus idiomas, Yavé consiguió que los albañiles no acabaran la Torre de Babel. Hoy, con la traducción automática, rumanos, serbios, polacos y paquis nos podrían acabar antes y mejor la reforma de la cocina.

El País




Nenhum comentário:

Postar um comentário