Ignasi Navarro

Director gerente de Incyta

Post edición

“Hoy nadie duda del origen humano de los textos de internet. Pero esto va a cambiar”

El gerente de Incyta advierte sobre las traducciones de Chat GPT: “pueden inventarse palabras”
0
4210

Incyta es una empresa de servicios lingüísticos y de distribución de soluciones de traducción automática. Es la responsable de la traducción y postedición cotidiana de las noticias que leemos en periódicos de cabecera. Hoy hablamos con uno de sus fundadores y gerente, Ignasi Navarro.

Incyta es un nombre que sugiere muchas cosas. ¿Cuál es su origen?

Incyta nació hace 22 años. Los socios fundadores veníamos de ser compañeros de trabajo en un centro de desarrollo de software que Siemens tenía en Cornellà. Era un lugar donde se investigaba, entre otras cosas, la lingüística computacional y en donde había una tecnología muy avanzada para la época en traducción automática.

Uno de nuestros proyectos se desarrollaba junto con el Ministerio de Industria y respondía al acrónimo “Incyta”: “Ingeniería, Consultoría y Traducción Automática”.

Pero luego, Siemens cerró el centro…

Así es. Aunque también dio facilidades a los trabajadores para que creáramos nuestras propias empresas. De ahí que unos cuantos decidiéramos seguir en ese campo. En 1993 creamos una primera empresa, que a la larga fue comprada por una multinacional. Y más tarde esta misma multinacional quebró, por lo que creamos una segunda versión de Incyta en 2001. Y hasta hoy.

Una historia que se asemeja a una montaña rusa, llena de perseverancia. ¿Siguen trabajando los mismos que la fundaron?

Básicamente sí. Nos mantenemos muchos de los que comenzamos el proyecto. Pero también se nos han añadido nuevas personas. La confianza de nuestros clientes, junto con la voluntad de seguir incluso en los momentos más difíciles, nos han dado la fuerza para renacer cuando ha sido necesario.

La confianza de nuestros clientes, junto con la voluntad de seguir incluso en los momentos más difíciles, nos han dado la fuerza para renacer cuando ha sido necesario

Entre sus mayores clientes se hallan periódicos importantes. Les ayudan en la creación de la versión idiomática al catalán todos los días.

Así es. Aunque, para ser justos, el primero que implantó una doble versión idiomática (castellano y catalán) en Catalunya fue el Diario Segre, de Lleida, hace 25 años. Y lo hizo con nuestra tecnología de aquel momento.

A los pocos meses, El Periódico también se planteó hacer lo mismo pero, después de considerarlo, optó por desarrollar una tecnología propia. Años más tarde fue La Vanguardia la que vino a pedirnos ayuda. Y, al poco tiempo, El Periódico hizo lo mismo.

En la actualidad nuestra tecnología está instalada en los procesos productivos de Segre, El Nacional, el Principal, El Periódico y La Vanguardia. Para estos dos últimos, además de la traducción idiomática también realizamos la corrección.

Nuestra tecnología está instalada en los procesos productivos de Segre, El Nacional, el Principal, El Periódico y La Vanguardia

¿Ortográfica y gramatical?

Así es. Nuestro sistema asegura que un texto traducido automáticamente está corregido y es fiel al original y que dice exactamente lo que quiere decir. Pero, además, teniendo en cuenta las peculiaridades de cada libro de estilo, dado que cada medio tiene el suyo.

A esta tarea la denominamos “postedición” y no consiste en una mera corrección de tildes y puntuación, sino también en una edición estilística y un encaje en la maqueta. Y todo ello a contrarreloj en la mayoría de los casos.

Nuestro sistema asegura que un texto traducido automáticamente es fiel al original y que dice exactamente lo que quiere decir

Además de la automatización, ese trabajo requiere de personas. ¿De dónde salen estos perfiles?

Pues son ciertamente complicados de encontrar. Son personas con grandes conocimientos de la gramática y la lengua catalana, que cuentan con la máxima titulación posible: hay filólogos, traductores, postgraduados en Corrección Lingüística (son unos estudios que se ofrecen en la UAB)… Antiguamente existía el nivel oficial “K” de idioma, que era el dedicado a la corrección. Hoy ya no existe ese examen.

Digamos que, para traducir bien al catalán, no basta con saberlo hablar y leer bien. Hay que conocer la gramática a fondo. Y si estas personas tienen inquietudes periodísticas, mucho mejor. Para corregir y traducir una crónica futbolística o política es bueno conocer el entorno temático.

Para corregir y traducir una crónica futbolística o política es bueno conocer el entorno temático

¿Alguna vez se les ha quejado algún periodista por una traducción incorrecta?

Afortunadamente tenemos una interlocución permanente con los departamentos de edición de cada periódico. A través de ellos se canalizan las quejas, cuando las hay. Hay que pensar que este es un trabajo que se realiza bajo mucha presión, y que cada periódico representa unas 40.000 palabras diarias que hay que tratar de manera precisa en un plazo de tiempo muy corto. Las ediciones se cierran a las 11 de la noche y, a menudo, los textos comienzan a generarse a las seis de la tarde.

Los procesos están muy automatizados. A medida que los contenidos se van cerrando y nos llegan en lengua castellana, los vamos traduciendo al catalán de forma automática y se posteditan según se van cerrando las páginas. Es un flujo continuo.

Cada periódico representa unas 40.000 palabras que hay que tratar de manera precisa en un plazo de tiempo muy corto

¿La inteligencia artificial, y el popular Chat GPT, son una amenaza para ustedes?

En los últimos meses se viene diciendo que la traducción es una de las profesiones más amenazadas por la inteligencia artificial. Y creo que es así. Pero también creo que lo es para todas las demás profesiones. Y si no están amenazadas, por lo menos requerirán una adaptación.

Hace muchos años que veo que el progreso de la traducción automática es muy considerable. Siempre he pensado que llegará un momento en que el sistema lo hará suficientemente bien por su cuenta y estoy convencido de que los últimos avances, basados en el deep learning y los motores neuronales, nos proporcionarán una traducción automática cada vez mejor.

Siempre he pensado que llegará un momento en que el sistema lo hará suficientemente bien por su cuenta

¿Y del todo fiable?

El riesgo actual, precisamente, es que los sistemas de traducción automática, como el Chat GPT, generan unos textos que son muy convincentes y lingüísticamente correctos. Pero pueden tener, y de hecho tienen, errores semánticos y de contenidos.

El riesgo es que los sistemas de traducción automática generan textos muy convincentes y correctos. Pero pueden tener errores semánticos y de contenidos

¿Acaban diciendo cosas que el original no dice?

Así es. Y también omiten textos, o se inventan palabras que no están en el contenido original. Así que la traducción del Chat GPT puede ser gramaticalmente muy buena, pero siempre hay que vigilar que el contenido sea fiel. De ahí la importancia del trabajo de postedición.

Hasta ahora las tareas de revisión se hacen de una manera secuencial: los textos se leen, se comparan con el original, se traducen, se corrigen… Nosotros estamos trabajando para romper esa secuencialidad e ir directamente a aquellas frases donde se puedan contener los errores.

¿Qué significa?

Pues que en un texto automáticamente traducido habrá muchas frases que estarán bien, pero habrá otras en las que aparecerá un nombre propio innecesariamente traducido, o una omisión, o una palabra que no había pasado por el diccionario. Queremos hacer más eficaz y productiva la tarea de revisión para no tener que leer todo el texto en busca de esos errores de principio a final.

¿Podría pasar que algún periodista decida escribir su crónica a partir de la realidad artificial?

Podría pasar. Yo puedo explicar alguna anécdota en otros campos. Por ejemplo, cuando comenzó el boom de la traducción automática, hace 15 años, alguno de los traductores externos y freelance con los que trabajábamos nos decían que nunca la iban a utilizar. En cambio, lo hacían.

Hasta ahora, pensamos que los textos que están colgados en Internet son el summum de toda la información. Y nadie duda de su origen humano, ya estén mejor o peor escritos. Pero esto va a cambiar.

Y en cuanto al reconocimiento del audio, ¿ha habido alguna mejora significativa?

Pues sí. El reconocimiento de voz y la síntesis ya estaban bastante desarrollados hace unos años. Pero ahora todavía lo están más. Lo podemos ver con los asistentes domésticos del tipo “Alexa” o “Siri”. Poseen una calidad altísima. Reconocen perfectamente la mayoría de las expresiones verbales que utilizamos. Otra cosa distinta es que terminen haciendo lo que les pidamos, pero eso ya depende de las limitaciones de otros sistemas, y no tanto del reconocimiento de voz.

¿En qué dirección quiere crecer Incyta en los próximos años? ¿Cuál es la estrategia de negocio?

Nuestros gran reto actual es el de optimizar y hacer más eficaces los servicios que damos a la prensa escrita. Por otro lado, en cuanto a los clientes de traducción convencional, queremos aplicar el modelo de traducción automático a otras lenguas como son el gallego, el portugués, el euskera o el inglés. Hasta la fecha no hemos tenido los volúmenes de texto necesarios en esas lenguas y todavía no las tenemos tan implantadas y desarrolladas como sería el caso del catalán o el castellano.

Última pregunta: si algún día les envían una exclusiva importante desde algún periódico, ¿tienen obligación de guardar silencio?

Por supuesto. Existen cláusulas de confidencialidad para ello. Todos los procesos con los medios de comunicación están perfectamente acotados en flujos de trabajo y en procedimientos técnicos que hacen imposible compartir este tipo de información.

El gerente de Incyta es informático de profesión y, a lo largo de los años, se formó también en gestión y dirección de empresas, así como en profesorado de educación secundaria. A primeros de los años 90 desarrolló sistemas de lingüística computacional en el centro que Siemens tuvo en Cornellá de Llobregat. Al cierre de éste, se unió a otros colegas para crear una empresa que les permitiera seguir trabajando en la traducción automática. Su proyecto necesitó dos nacimientos. Al fin, Incyta reúne todo ese bagaje y lo añade a los avances tecnológicos actuales para enriquecer el mundo de la traducción profesional.

FER UN COMENTARI

Introduïu el vostre comentari.
Introduïu el vostre nom aquí

Feedback se reserva el derecho de revisar los comentarios y despublicar en caso de no ser apropiados.