Lingüistas y traductores

IA y localización: lo que nadie le cuenta a los traductores e intérpretes

Si eres lingüista o intérprete, llevas años escuchando que la IA va a quitarte el trabajo. Unas veces con alarma, otras con condescendencia. Lo que casi nadie te explica es qué está pasando de verdad por dentro: por qué la IA falla donde falla, y dónde sigues siendo insustituible. Vamos a eso.

D
Equipo Día a día IA
Publicado
10 min lectura · Nivel: principiante

Traducción y localización no son lo mismo

Empecemos por algo que parece obvio pero que, en la práctica, muy poca gente tiene claro. Traducción es convertir un texto de un idioma a otro conservando el significado. Eso es todo. Localización es otra cosa: es adaptar un producto completo —sus textos, su tono, sus imágenes, sus fechas, sus referencias culturales, a veces hasta su interfaz gráfica— para que funcione con naturalidad en un mercado diferente. No que suene "traducido". Que suene de allí.

Un caso concreto: una aplicación americana que felicita a sus usuarios el Día de Acción de Gracias. Localizarla para España no consiste en traducir el mensaje. Consiste en decidir si esa celebración tiene algún sentido para el usuario español, qué hacer si no lo tiene, y si la solución es sustituirla por algo equivalente o eliminarla directamente. Esa decisión requiere criterio editorial, conocimiento del mercado de destino y, en muchos proyectos, coordinación con el equipo de producto. No hay modelo de IA que tome esa decisión de forma fiable.

Esta distinción es la que define, con bastante precisión, dónde la automatización ya ha llegado y dónde todavía no.

Para tenerlo claro

Los sistemas actuales traducen texto con una calidad que hace diez años habría parecido imposible. Localizar de verdad —con criterio cultural, editorial y de producto— sigue siendo trabajo humano.

Cómo aprende un modelo de traducción

No hace falta entrar en arquitecturas de transformers ni en álgebra lineal para entender lo esencial. Los modelos modernos —los que hay detrás de DeepL, Google Translate, o los LLMs como ChatGPT cuando traducen— aprenden exponiendo a cantidades enormes de texto en paralelo: el mismo documento en inglés y en español, en francés y en alemán, repetido miles de millones de veces con variaciones. El modelo no memoriza reglas gramaticales. Aprende a reconocer que cierta secuencia de tokens en un idioma tiende a corresponderse con cierta otra en el idioma de destino. Es inferencia estadística a una escala que ningún humano puede procesar.

Esto tiene una implicación directa que conviene interiorizar: la calidad de un modelo sobre un par de idiomas concreto depende casi por completo de cuántos datos de calidad existen para ese par. El inglés tiene décadas de contenido digital en cantidades astronómicas. El inglés-español también está bien cubierto. Pero el catalán-alemán, el euskera-francés, o cualquier par que involucre una lengua con menor presencia digital tiene un techo de calidad mucho más bajo, no por falta de capacidad del modelo, sino por falta de datos de entrenamiento.

En Alexa trabajamos con textos en más de quince idiomas simultáneamente. Cuando un modelo daba resultados pobres en una lengua concreta, la causa casi nunca era el diseño del sistema: era la escasez de datos de entrenamiento etiquetados en ese idioma. La correlación entre volumen de datos disponibles y calidad de salida era constante, sin excepciones.

Los errores que comete la IA no son aleatorios

Hay un patrón en los fallos de la traducción automática, y conocerlo es una de las cosas más útiles que puede hacer un lingüista que trabaje con estas herramientas. No se trata de errores distribuidos al azar: se concentran en puntos específicos y predecibles.

El primero es la coherencia en textos largos. Frase a frase, un modelo actual puede producir resultados bastante aceptables. Pero cuando el texto tiene cincuenta páginas y el significado de un párrafo depende de una decisión terminológica tomada veinte páginas antes, el modelo no mantiene el hilo. Puede traducir deployment como "despliegue" en el capítulo dos y como "implementación" en el cinco, sin ninguna razón aparente. En un manual técnico eso es un problema real; en una novela, puede ser catastrófico.

El segundo punto débil es el registro. Saber cuándo tutear y cuándo no, en qué contexto una empresa usa un tono formal con sus clientes o uno más cercano, es lectura social. Los modelos aprenden un promedio del corpus de entrenamiento, y ese promedio raramente coincide con las convenciones específicas de un cliente o de un sector. El resultado es una traducción que técnicamente es correcta pero que suena desencajada —demasiado fría, demasiado informal, o simplemente genérica.

El humor y la ironía son otro territorio difícil. No porque los modelos no reconozcan que algo es un chiste, sino porque el mecanismo del humor —activar una expectativa y romperla de forma inesperada— es profundamente dependiente de la cultura y del contexto. Lo que funciona en español de España puede no funcionar en español de Argentina, y lo que es gracioso en inglés puede ser completamente opaco en cualquier variante del español. La solución habitual del modelo es traducir literalmente, lo que mata el efecto, o ignorar el elemento humorístico por completo.

Los nombres propios son un campo minado específico. Un modelo puede decidir traducir el nombre de un personaje cuando no debería, o transcribir fonéticamente una marca cuando existe una versión oficial en el idioma de destino. Este tipo de error es especialmente frecuente en localización de videojuegos y en literatura, donde los nombres propios a veces tienen una carga semántica intencionada que hay que gestionar con criterio.

Y luego están las lenguas con pocos datos. El euskera, el gallego, el catalán, el swahili o cualquier lengua con presencia digital limitada dan resultados notablemente peores que el inglés o el español. No es que el modelo sea incapaz: es que no ha visto suficientes ejemplos para aprender los patrones con la misma precisión. Los lingüistas que trabajan con lenguas minorizadas lo saben bien: la IA, en esos casos, genera más trabajo de corrección del que ahorra.

Dónde sí tiene sentido usarla

Dicho todo esto, hay contextos donde la traducción automática produce resultados que justifican su uso, especialmente cuando el objetivo no es calidad editorial sino velocidad y volumen.

La documentación técnica estándar es el caso más claro. Manuales de usuario, especificaciones de producto, notas de versión de software. El vocabulario es controlado, el tono es neutro, y la estructura de las frases tiende a ser predecible. En esas condiciones, un modelo bien configurado —con un glosario de cliente cargado y una memoria de traducción activa— puede generar borradores que el lingüista revisa en una fracción del tiempo que tardaría en traducir desde cero.

Los proyectos de alto volumen y baja variación también encajan bien: catálogos con miles de referencias de producto, respuestas de atención al cliente con estructuras muy similares, strings de interfaz de aplicaciones. Aquí el valor no está en la calidad de cada segmento individual, sino en la velocidad global del proceso. El papel del lingüista cambia: en lugar de producir, supervisa, corrige y valida.

Herramientas como Phrase, memoQ o el propio DeepL integran hoy funciones de IA que van más allá de la traducción en sí: detectan inconsistencias terminológicas entre documentos, sugieren segmentos de memorias de traducción anteriores, o alertan cuando una cadena de la versión original ha cambiado ligeramente. Son funciones modestas, pero para alguien que gestiona proyectos recurrentes con el mismo cliente, representan un ahorro real de tiempo administrativo.

Un cambio de proporción, no de oficio

El lingüista que antes dedicaba el 80% del tiempo a producir traducción y el 20% a revisar puede, en ciertos proyectos, invertir esa proporción. No es necesariamente peor trabajo: revisar con criterio es una competencia distinta y, en muchos sentidos, más exigente que traducir mecánicamente.

La post-edición y por qué no es lo mismo que revisar una traducción humana

La post-edición de traducción automática —MTPE, por sus siglas en inglés— lleva años creciendo como especialidad dentro del sector. La idea de base es simple: el motor genera una primera versión y el lingüista la revisa, corrige y eleva. Pero hay algo importante que los que llegan de la revisión tradicional tardan en entender: los errores de un motor de traducción no se parecen a los de un traductor humano.

Un traductor humano comete errores por desconocimiento del tema, por despiste, por cansancio. Sus fallos son irregulares y difíciles de anticipar. Un motor de traducción, en cambio, falla de forma sistemática: siempre en los mismos tipos de construcciones, siempre con el mismo tipo de confusión de registro, siempre con el mismo patrón de inconsistencia terminológica en textos largos. Conocer esos patrones —y saber qué partes del texto merecen revisión minuciosa y cuáles se pueden aceptar con más confianza— es lo que diferencia a un post-editor eficiente de uno que tarda lo mismo que si hubiera traducido desde cero.

Muchas agencias de localización y empresas de software ya trabajan con flujos de MTPE como opción estándar para ciertos tipos de contenido. No para todo —hay clientes que siguen exigiendo traducción humana completa en sus materiales de marketing o en sus textos legales— pero sí para documentación interna, actualizaciones de producto, soporte técnico. El lingüista que sabe moverse en esos flujos tiene acceso a más proyectos y puede gestionar más volumen. La trampa está en aceptar tarifas de post-edición sin haber medido bien cuánto tiempo requiere el trabajo real: hay motores y tipos de texto donde la post-edición es más rápida que traducir, y otros donde no lo es en absoluto.

Qué hacer con todo esto

No existe una respuesta universal, porque la situación de un intérprete de conferencias juradas en español-árabe no tiene nada que ver con la de un traductor de videojuegos inglés-alemán. Pero hay algunas cosas que aplican con bastante independencia del perfil.

La primera es, simplemente, probar las herramientas. No leer sobre ellas. Probarlas. Coge un texto que conozcas bien —en tu especialidad, en tu par de idiomas— y pásalo por DeepL, por Google Translate y por ChatGPT con un prompt específico. Luego revísalo. Ese ejercicio, hecho con un texto que dominas, te enseña más sobre los límites reales de estos sistemas que cualquier artículo del sector, incluido este. Las opiniones sobre IA formadas sin haber tocado las herramientas suelen ser las más equivocadas en ambos sentidos: ni tan amenazadoras ni tan inofensivas como parecen desde fuera.

Si ya usas modelos de lenguaje para tareas lingüísticas, vale la pena invertir algo de tiempo en aprender a construir instrucciones más precisas. No es algo técnico: es especificar el registro, la audiencia, el glosario, las restricciones de formato. Un prompt bien construido a un LLM puede producir una primera versión bastante más usable que uno genérico. Tenemos un artículo sobre qué es el prompt engineering si quieres ver ejemplos concretos.

En cuanto a especialización: los perfiles que están notando más presión son los de traducción de volumen sin especialización temática. Los que trabajan en literatura, publicidad, humor, localización de videojuegos complejos, traducción jurada o interpretación en situaciones de alta exigencia tienen más margen. No porque la IA no llegue ahí nunca, sino porque esos trabajos requieren criterio, responsabilidad y conocimiento contextual que los modelos actuales no tienen.

Y hay una última cosa que merece mencionarse, que es hablar con claridad con los clientes. Muchos ya usan traducción automática para generar borradores antes de enviarte el encargo, sin decírtelo. Cuando eso pasa y no se nombra, el trabajo que haces —post-editar, no traducir— se factura como si fuera otra cosa. Poner nombre preciso a lo que haces, y cobrar en función de eso, requiere entender la diferencia. Lo cual, a su vez, requiere conocer el proceso.


Preguntas frecuentes

¿Va a reemplazar la IA a los traductores?

Depende mucho del tipo de traducción. La traducción de contenidos estándar —documentación técnica, textos repetitivos, strings de interfaz— ya se gestiona con modelos automáticos en muchas empresas. El lingüista revisa y valida. Lo que no ha cambiado es la necesidad de alguien con criterio que decida qué es aceptable y qué no, y que gestione todo lo que el modelo no puede: tono, coherencia en largo, referencias culturales, decisiones editoriales. El perfil que está bajo más presión es el traductor generalista sin especialización. El que tiene formación específica y criterio claro sigue siendo necesario, aunque el trabajo sea diferente al de hace diez años.

¿Qué es la localización y en qué se diferencia de la traducción?

Traducción es convertir palabras de un idioma a otro. Localización es adaptar un producto completo —texto, interfaz, imágenes, fechas, referencias culturales— para que funcione con naturalidad en otro mercado. No que se entienda. Que suene como si hubiera sido creado allí. La traducción automática puede hacer lo primero con resultados aceptables en muchos casos. Lo segundo todavía requiere criterio humano.

¿Qué habilidades debería desarrollar un lingüista hoy?

Tres que tienen aplicación inmediata: saber evaluar la calidad de la traducción automática (no solo detectar errores, sino calibrar cuánta corrección necesita un texto antes de ser publicable), entender los patrones de fallo típicos de los modelos para saber dónde concentrar la revisión, y saber construir instrucciones precisas para LLMs cuando los usas como herramienta de trabajo. Son competencias que se aprenden con práctica y que tienen un impacto directo en la eficiencia real del trabajo.

¿Los intérpretes están igual de afectados que los traductores?

La situación es bastante diferente. La interpretación simultánea en tiempo real —con cambios de tema, autocorrecciones del orador, alusiones implícitas y una latencia máxima de un par de segundos— sigue siendo un problema abierto para los sistemas automáticos. Existen prototipos y experimentos, pero ninguno está cerca de ser viable en una conferencia real de alta exigencia. Los intérpretes tienen más margen que los traductores, aunque conocer estas herramientas sigue siendo útil para entender el contexto en el que trabajan y para gestionar las expectativas de clientes que las sobreestiman.

¿Te ha sido útil? Compártelo: