El mundo del doblaje lucha contra la cesión de sus voces a la IA

Los programas que clonan y generan voces a través de inteligencia artificial (IA) generativa son cada vez más accesibles para el público general. Con este aumento de usuarios surge la pregunta: ¿De dónde salen estas voces? ¿Qué han utilizado las empresas para entrenar a sus modelos?

produccion audiolibros@260220 134053

Que tu voz se escuche es un sueño para actores y actrices de doblaje. Poner voz a caras ajenas, a ilustraciones o incluso en locuciones que no van acompañadas con imágenes. Sin embargo, con la proliferación de los programas de IA generativa que clonan o imitan voces de otras personas, este sueño se ha convertido en una pesadilla para muchos profesionales del sector.

Hoy en día, herramientas como ElevenLabs permiten al usuario, sin necesidad de pagar por una cuenta premium, clonar voces existentes tras proporcionar una grabación de muestra e incluso generar voces «artificiales» desde cero. Otra plataforma, Suno, ofrece la posibilidad de crear canciones con voces «artificiales» y melodías inventadas.

¿Y cómo se entrenan los modelos que reproducen estas voces que, en teoría, no pertenecen a nadie? Para que a nosotros nos llegue esta voz, primero el programa a utilizar tiene que haber sido entrenado con ejemplos reales de voces reales. Esto implica recopilar datos sobre grabaciones, etiquetar las mismas correctamente y «explicarle» al programa qué contenido estás ingestando (las etiquetas que hemos puesto al contenido, su descripción) y cómo suena, para que en próximas ocasiones, cuando se le pida una voz con un número de características que ya ha visto antes, pueda reconocerlas e implementarlas.

Estas grabaciones para entrenar modelos deben ser muy diversas, tanto en acentos como en orígenes, géneros, velocidades… etc. Recopilar este tipo de datos desde cero, es decir, contratando a profesionales para que graben el contenido que se utilizará para entrenar los modelos, no es sencillo, por lo que la mayoría de grandes empresas optan por comprar bases de datos con cientos y miles de grabaciones ya existentes. El problema viene cuando esas grabaciones se crearon para otro fin y las personas que cedieron su voz no son conscientes de esta venta que se hace de la misma.

Una cláusula para luchar

La Plataforma de Asociaciones y Sindicatos de Artistas de Voz de España, PASAVE, ha tratado de centralizar los esfuerzos de todos los profesionales que, individualmente, trataban de negociar con las empresas contratantes para evitar que su voz fuese cedida a alguna de las empresas que trabajan entrenando modelos de IA generativa.

Por eso, desde 2024 han creado una cláusula que instan a cualquier profesional del doblaje a incluir en sus contratos para evitar futuras sorpresas desagradables:

No se permite ni cede el uso de la voz, modulación, timbre, gestos y análogos del locutor/de la locutora y/o del actor/de la actriz de doblaje o de voz, para ser utilizados para alimentar, entrenar, simular o acciones similares, en programas o proyectos de inteligencia artificial (IA), robótica, juegos informáticos o cualquier metodología que utilice o transforme la voz e interpretación grabada originalmente por el locutor/la locutora y/o el actor/la actriz, para destinarse a otro fin distinto al detallado en este contrato, que es dar voz e interpretar a un/os personaje/s de una producción en concreto.

No todas las empresas que trabajan con profesionales del doblaje aceptan esta condición. El año pasado, la división de juegos de Microsoft, Activision Blizzard, se negó a aceptar esta cláusula en sus contratos con los profesionales españoles. Como consecuencia, varios videojuegos publicaron actualizaciones en España en versión original, sin doblaje al castellano, y varios juegos de prestigio de la firma amenazaban también con publicarse sin versión en castellano. Finalmente, Microsoft aceptó incluir esta cláusula en sus contratos, después de una polémica que alcanzó tanto a profesionales del sector como a fanáticos de los videojuegos.

El futuro de las profesiones después de la IA

Está claro que la inteligencia artificial presenta muchas oportunidades para un número importante de sectores. Pero cuando hablamos de IA generativa y profesionales creativas, el futuro se vislumbra borroso. Si tu trabajo es poner voz a un texto, ¿qué es lo que puedes hacer cuando un programa gratuito de IA puede hacerlo en apenas unos minutos o incluso segundos?

Aunque esta tecnología aún no esté plenamente desarrollada, cada vez es más difícil distinguir entre una grabación humana y una recreación. Esta herramienta se utiliza ya para narrar audiolibros, vídeos corporativos, contenido en redes sociales e incluso podcasts.

Es previsible que pronto se dé el paso definitivo y se utilicen estas voces artificiales en videojuegos, series o películas, privándonos entre otras cosas de momentos tan emocionantes como aquel discurso de la actriz estadounidense Sigourney Weaver, que recogiendo su premio Goya Internacional en 2024 se acordó de la actriz de doblaje que lleva décadas poniéndole voz en las pantallas españolas, María Lluisa Solà«

«Mi amigo Bill Murray», contó Weaver en el escenario, «siempre dice que mi interpretación es mejor en español. La excelente actriz que pone la voz en español debería de estar aquí en el escenario conmigo. Me ha doblado en más de 30 películas, su nombre es María Luísa Solà. Te lo agradezco desde el fondo de mi corazón». ¿Queremos un futuro en el que esta profesión desaparezca?

Haz - RTVE Instituto - Hub de formación en contenidos digitales avanzados
Privacy Overview

This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.