Cómo hacer un pódcast sin micrófono: convertir textos en audio con inteligencia artificial (IA)

Para convertir un texto en un audio ya no es necesario un estudio de grabación ni una persona que locute. Con la llegada de la inteligencia artificial, cualquier pieza periodística en formato texto puede llegar a ser un audio de calidad profesional en apenas unos minutos. Te contamos cómo hacerlo paso a paso

un chico y una chica creando un podcast y que en la imagen haya algun elemento que se relacione con la inteligencia artificial
Imagen creada con IA

En los últimos meses, la inteligencia artificial ha avanzado a una velocidad vertiginosa y, tanto es así, que lo que antes requería locutores, un estudio de grabación y una edición, ahora puede hacerse en apenas unos minutos y con resultados profesionales. Hablamos de transformar una pieza escrita en un pódcast de forma eficaz para poder ampliar audiencias, llegar a nuevas plataformas u ofrecer una experiencia más cercana.

Te contamos cómo hacer un pódcast sin micrófono, paso a paso, y cuáles son las herramientas de IA más recomendables a día de hoy:

1. Notebook LM

La forma más sencilla, y quizá también conocida, de transformar piezas de texto en contenido de audio es NotebookLM, de Google. Con esta aplicación, solamente tienes que subir un texto, resumirlo o reescribirlo con el tono que el pódcast requiera, y el sistema genera un guion y lo locuta.

¿Cómo usarlo?

  1. Subir el documento, poner el enlace o copiar el texto directamente en su sistema. Permite hasta 50 archivos.
  2. Pinchar la opción «Resumen de audio» y después «Generar». Puedes personalizarlo a tu gusto, indicando tono o estructura del pódcast.
  3. Esperar a que se genere el audio y ¡listo!

Si no te convence el resultado o las voces que utiliza Notebook LM, tienes otra opción un poco más elaborada:

  1. Subir los documentos, enlaces o copiar el texto en su sistema.
  2. Pedir el siguiente prompt en la pestaña ‘Chat’: «Genera una versión narrada tipo pódcast de este artículo/reportaje, con un tono conversacional y que sea claro y dinámico».
  3. Ajustar el estilo: puede ponerse más rápido o más pausado, más divulgativo o más íntimo…
  4. Descargar el guion y llevarlo a una aplicación como ElevenLabs.

Y como lo mejor para contar este tipo de cosas es probarlas, aquí dejamos el pódcast generado a partir de esta entrada con Notebook LM:

2. ElevenLabs

Es la aplicación de generación de voces por excelencia y cada actualización es mejor que la anterior. Sus voces suenan tan naturales que casi parecen reales. Tiene personajes en una infinidad de idiomas, por lo que hay que elegir uno en español peninsular si se quiere hacer un pódcast que parezca generado por un humano. La diferencia con respecto a Notebook LM es que hay que aportar el texto que se necesita en audio, no lo genera de forma automática.

¿Cómo usarlo?

  1. Introducir el texto o guion para el pódcast en el sistema de ElevenLabs marcando la opción’Text to Speech’
  2. Elegir la voz teniendo en cuenta el idioma. La versión de pago permite clonar la voz de otra persona, pero la gratuita no.
  3. Seleccionar un hablante o varios dependiendo de cómo vaya a ser el pódcast.
  4. Elegir la velocidad, estabilidad o estilo.
  5. Generar el audio y descargarlo.

Además, ElevenLabs permite modificar el tono de la conversación, por lo que si es necesario que muestren emoción, tristeza o enfado, por ejemplo, hay que indicarlo antes de la frase entre corchetes, de esta forma: [con risa genuina y profunda] Jajaja.

Aquí os dejamos el pódcast, cuyo guion ha sido creado por ChatGPT con esta entrada, generado con la voz española de Antonio LV, mi favorito de ElevenLabs:

3. Generar un código para Google Colab con gTTS

Otra opción, para los más atrevidos, es utilizar código en Google Colab y crear un cuaderno para generar pódcast. Es una plataforma gratuita y solo requiere de introducir el código y ejecutar. Y, como no todo el mundo sabe generar código, se puede pedir ayuda a ChatGPT para generarlo, como hemos hecho nosotros.

Con herramientas de inteligencia artificial como gTTS basta con introducir el guion, ejecutar unas pocas líneas de código y generar un archivo de audio en español que suene como una locución profesional. En cuestión de minutos, el texto se transforma en un pódcast listo para descargar y compartir.

¿Cómo usarlo?

  1. Abrir un nuevo cuaderno en Google Colab.
  2. En una nueva línea de código, introducir lo siguiente:

# 1️⃣ Instalar gTTS

!pip install gTTS

# 2️⃣ Importar librerías

from gtts import gTTS

from IPython.display import Audio

# 3️⃣ Definir tu texto

texto = «»»Introduce aquí tu texto«»»  # Reemplaza con tu texto completo

# 4️⃣ Crear audio

tts = gTTS(text=texto, lang=’es’)  # Idioma español

tts.save(«podcast.mp3»)

# 5️⃣ Reproducir audio en Colab

Audio(«podcast.mp3»)

from google.colab import files

# 6️⃣ Descarga directa del archivo

files.download(«podcast.mp3»)

¡Y listo! Aquí tenemos nuestro pódcast:

,
Haz - RTVE Instituto - Hub de formación en contenidos digitales avanzados
Privacy Overview

This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.