La subtitulación profesional se halla en un proceso de cambio tecnológico sin precedentes, en el que cada vez se utilizan más aplicaciones informáticas para automatizar el proceso. A pesar de la democratización de la subtitulación, la calidad de los subtítulos es muy dispar dependiendo de la vitalidad lingüística de los idiomas. En el caso de los idiomas mayoritarios, tales como el inglés o el español, la calidad de los subtítulos automatizados ha mejorado notablemente (Romero-Fresco y Fresno, 2023; Romero-Fresco et al., 2023) en los últimos años, pero la situación es muy diferente en el caso de las lenguas minoritarias (en nuestro caso, el euskera) (Tamayo y Ros-Abaurrea, 2024) y dista mucho, por ahora, de la calidad que ofrecen los profesionales de la subtitulación.
Esta premisa ha servido como punto de partida para el estudio[1] llevado a cabo por el grupo de investigación Tralima/Itzulik (UPV/EHU) en colaboración con Elhuyar[2], que se presenta en este artículo.
Objeto del estudio
Hemos querido contrastar las prácticas profesionales (totalmente humanas) con aquellas realizadas de forma semiautomática y automática, mediante el uso de herramientas de transcripción y traducción automáticas. En concreto, para este análisis se ha utilizado la tecnología de reconocimiento del habla Aditu, así como el traductor automático Elia. Con este objetivo, se ha analizado el subtitulado del castellano al euskera mediante distintos flujos de trabajo:
- Subtitulado humano, subtítulos creados íntegramente por parte de un profesional, utilizando herramientas habituales de subtitulación.
- Subtitulado semiautomático, transcripción automática del habla, seguida de revisión y traducción de los subtítulos realizadas por una persona.
- Subtitulado semiautomático, transcripción automática con revisión humana; traducción automática y posterior revisión humana de la traducción.
- Subtitulado semiautomático, transcripción y traducción automáticas, con revisión final de los subtítulos por parte de una persona.
- Subtitulado automático, proceso completamente automatizado, que incluye tanto la transcripción como la traducción automática, sin intervención humana.
Para los flujos humanos y semiautomáticos se ha contado con ocho traductores profesionales, que han realizado las tareas humanas correspondientes en dos vídeos de características muy diferentes, dentro del contexto de informativos televisados. El primer vídeo contiene un lenguaje formal y prefabricado locutado en plató y sin ruidos de fondo y el segundo vídeo es de carácter informal y espontáneo, con entrevistas en la calle a diferentes personas. A continuación, se ha medido la precisión de los subtítulos siguiendo el modelo NTR (Romero-Fresco y Pöchhacker, 2017) creado para la evaluación interlingüística de subtítulos. Estos resultados se han complementado con las respuestas a cuestionarios proporcionadas por los traductores sobre su opinión y percepción de los diferentes flujos de trabajo en los que han colaborado.
Resultados
Los resultados cuantitativos indican que el subtitulado totalmente automático resulta, en la actualidad, inadecuado e insuficiente para generar subtítulos de calidad suficiente en el par de lenguas castellano-euskera. En cambio, el subtitulado semiautomático, en los diferentes flujos analizados, ha mostrado resultados más positivos y consistentes, lo que sugiere la conveniencia de incorporar herramientas automáticas al flujo de trabajo, siempre acompañadas de las pertinentes revisiones por parte de profesionales. No obstante, los resultados del subtitulado semiautomático, se encuentran, aún, algo por debajo de la calidad del subtitulado humano. Cabe resaltar que este estudio presenta limitaciones relevantes, tanto en su duración como en el tamaño de la muestra analizada y en el número de traductores participantes, por lo que será necesario profundizar en estos resultados en futuras investigaciones.
Además de los resultados cuantitativos, se han obtenido también resultados de carácter cualitativo, recopilados mediante un cuestionario diseñado para conocer la percepción de los traductores sobre los procedimientos en los que han trabajado.
Las preguntas se centraron en el tiempo necesario para llevar a cabo la tarea, en el grado en que la transcripción y/o la traducción automática resultaron de ayuda y, por el contrario, en si estas tecnologías generaron algún tipo de dificultad. En general, los traductores manifiestan una preferencia por trabajar sin traducción automática o, al menos, consideran poco viable su uso sistemático. En cambio, la percepción de la transcripción automática es más positiva y, en algunos casos, reconocen que ha contribuido a facilitar su labor. De manera general, se considera que estas herramientas tecnológicas pueden desempeñar un papel de apoyo, pero que no pueden sustituir el trabajo de los profesionales.
Por último, resulta necesario insistir en la conveniencia de analizar y seguir evaluando los efectos, tanto en el proceso como en el producto y la recepción, de las innovaciones tecnológicas orientadas a mejorar y agilizar el trabajo de los profesionales de la traducción y la subtitulación.
REFERENCIAS
Romero-Fresco, P. y Pöchhacker, F. (2017). Quality assessment in interlingual live subtitling: The NTR Model. Linguistica Antverpiensia, New Series – Themes in Translation Studies, 16, 149–167. https://doi.org/10.52034/lanstts.v16i0.438
Romero-Fresco, P., Reviers, N., Jankowska, A., Vercauteren, G. y Rico, M. (2023). Assessment of Automatic and Semi-Automatic Live Speech-To-Text Translation Workflows at the European Parliament. https://qualisub.webs.uvigo.es/results/reports/spanish/
Tamayo, A. y Ros Abaurrea, A. (2024). Speech-to-text Recognition for the Creation of Subtitles in Basque: An Analysis of ADITU Based on the NER Model. The Journal of Specialised Translation, 41, 48–73. https://doi.org/10.26034/cm.jostrans.2024.4711
[1] Estudio realizado dentro del marco de la convocatoria KSIgune Konexioak de 2024. Este programa pretende impulsar y ayudar al desarrollo de proyectos de formación, investigación y transferencia basados en la cooperación entre centros de Educación Superior y los agentes de los sectores culturales y creativos del País Vasco.
[2] Los participantes del proyecto han sido Elizabete Manterola, Zuriñe Sanz, Ana Tamayo y Naroa Zubillaga por parte de Tralima/Itzulik (UPV/EHU); Lide Azkue, Klara Ceberio y Eli Pociello por parte de Elhuyar.


