Los podcasts en Spotify podrán escucharse en español gracias al doblaje automático
Los programas en la plataforma serán doblados con voz sintética casi igual a la original. La velocidad con la que la inteligencia artificial resuelve retos y abre nuevos espacios es inagotable
Este artículo es una parte de la newsletter semanal de Tecnología, que se manda cada viernes. Si quiere apuntarse para recibirla entera, con temas similares, pero más variados y breves, puede hacerlo en este enlace.
Hace literalmente solo dos semanas, El Fary y Núñez Feijóo circularon por los chats de España hablando un inglés admirable con su propia voz. Ahora, hace un par de días, Spotify ha anunciado que episodios completos de podcasts en inglés van a estar disponibles doblados en español, francés, alemán. De momento solo hay unos pocos ejemplos de prueba. El escritor israelí Yuval Noah Harari habla un español latino extremadamente fluido. De repente ya hay, para los interesados, una entrevista de 3 horas en español con Harari. Es una prueba que irá a más. Hay un detalle curioso: los capítulos traducidos al español son entre 10 y 30 minutos más largos que el original. Quizá sea por la inteligencia artificial (IA), quizá por la estructura de la lengua.
La novedad de Spotify ya merecía que nos centráramos en el impacto que tendrá en nuestro futuro lingüístico y en el consumo cultural. Pero en los últimos días Amazon, Meta, OpenAI (y pronto Google) también han anunciado o sugerido cambios extraordinarios en cómo viviremos.
Podcasters - what if I told you could offer your pod to any listener around the world, in their own local language but still keep it in your own voice? That’s the pilot we’re launching @Spotify!
— Daniel Ek (@eldsjal) September 25, 2023
It’s called Voice Translation and using AI, translates podcasts episodes into… pic.twitter.com/kYq0bgxJYq
La IA venía a por nuestros trabajos, pero acabará cambiando parte de nuestras vidas. Estos son solo algunos anuncios de estos días (algunos no son novedades absolutas, sino mejoras): se podrá charlar con ChatGPT, que no será solo un avance respecto a Alexa o Siri, sino que hay quien lo ha probado como terapia (¿o amiga?) para descargar emociones después de un día de trabajo. En el chat de WhatsApp del colegio podrá invocarse la inteligencia artificial para que resuma cientos de mensajes o pedirle un sticker de una bicicleta con las ruedas en forma de corazón y una marmota al manillar para nuestra pareja. Podrá hacerse una foto a las sumas del libro de mates y dará los resultados. Podrán retocarse fotos en el móvil con un nivel hasta ahora reservado a los expertos en Photoshop, y será tan sencillo que lo difícil será encontrarse con fotos originales. También explicará memes o secuencias de imágenes que no son evidentes a ojos humanos. Dentro de WhatsApp podrá tenerse una conversación con preguntas que hasta ahora se las hacíamos a Google: para ello, Meta ha creado incluso chats con famosos que ponen su cara a las IA expertas en recetas, videojuegos, deportes o bromas; parece hasta cursi para esta época.
Son solo algunos ejemplos improvisados. Pero hay más. Meta anunció unas nuevas RayBan con cámaras que podrán mirar un grifo averiado y sugerir cómo repararlo con un vídeo que veremos en las propias gafas. Y, por supuesto, podremos pasear por El Cairo o Shanghai, mirar los carteles de las calles o las cartas de restaurantes y leerlos en español en las gafas. No quedará tanto ya para que esas mismas gafas traduzcan lo que oigan en chino al español en nuestras orejas. Esta semana se ha sabido también que OpenAI está hablando con Jony Ive, célebre colaborador de Steve Jobs en Apple y hoy fuera de la compañía, para crear “el iPhone de la IA”. Y es que el teléfono móvil quizá ya no es el dispositivo con el tamaño y formato más conveniente para este arsenal de opciones nuevas.
Just got smarter. Next gen POV with #RayBanMeta pic.twitter.com/2fKzq7AYWO
— Ray-Ban (@ray_ban) September 27, 2023
Pero ¿y las lenguas?
Tenía preparadas algunas cosillas para comentar el fin de la Torre de Babel con Spotify. Pero ya me parecen hasta secundarias. Es complicado imaginar el ritmo de cambios que traerá la combinación de esas novedades que acabo de enumerar. La cantidad de contenido disponible se va a multiplicar. ¿Por qué no escuchar una guía sobre los rincones de Bangkok o Mindanao escogidos por unos tipos locales muy avispados? ¿Por qué no seguir la NBA escuchando podcasts especializados hechos desde Los Angeles o Milwaukee? ¿Por qué no escuchar, también en nuestra lengua, la última entrevista a cualquier campeón mundial (de ajedrez, de CounterStrike, de minigolf, de bailes de salón)? Claro que en principio no estará todo disponible en todas las lenguas, pero no debería tardar mucho; y el español será una prioridad tras el inglés.
La supresión de las lenguas para consumir información es una novedad brutal. Pero esa no es la única barrera. A los medios globales, por ejemplo, les cuesta funcionar en otra lengua y fuera de su área de influencia cultural. Los grandes medios anglosajones nunca han trasladado su peso a otras lenguas, aunque su influencia en inglés sea enorme. Pero Hollywood o Netflix sí lo han hecho. Es probable que tutoriales y podcasts también logren más influencia. Es dudoso, sin embargo, que el francés Squeezie o el estadounidense Kai Cenat invadan el terreno de Ibai o Auron. Sí puede que haya trasvases en todas direcciones, y más en el futuro, cuando los directos y el chat puedan ser traducidos a la vez en tiempo real y las máquinas pillen expresiones nuevas. Es difícil imaginar el impacto concreto de esto, pero ya no es utopía.
@verge @CrashMX Done! Here is your Spanish dub: https://t.co/WjzY2PwvgZ
— EzDubs (@ezdubs_bot) September 27, 2023
📺🔴 𝙔𝙤𝙪𝙏𝙪𝙗𝙚: https://t.co/NOojBAvkEA
💬🟢 𝙒𝙝𝙖𝙩𝙨𝘼𝙥𝙥: https://t.co/S3vvLaDAyM
📱🔵 𝙏𝙚𝙡𝙚𝙜𝙧𝙖𝙢: https://t.co/znXbHu1u99 pic.twitter.com/OxDDVEi8tk
El incremento de traducciones es tan inminente que ya hay cuentas en X que traducen automáticamente las voces de los vídeos al español con el tono de original. Su nivel de traducción es justito aún, pero este miércoles ya vi un clip de Mark Zuckerberg presentar sus nuevas gafas en un español entendible.
El beneficio de aprender una lengua seguirá ahí, imagino. Yo hablo varias y me ha sido increíblemente útil en mi vida. ¿Será a partir de ahora el mejor modo de emplear horas de aprendizaje? No lo sé.
De un rascacielos a docenas
Ya habíamos comentado que ChatGPT parecía ralentizar su implantación. Quizá era solo mi deseo de entender mejor su adopción. Me equivocaba mucho y poco a la vez: ChatGPT sigue siendo un increíble generador de texto y poco más, pero a su alrededor no para de surgir competencia. Es como si ChatGPT fuera el nuevo rascacielos en la ciudad global con sus 44 pisos y en apenas unos meses se hubieran proyectado por todas partes otros rascacielos de 60 plantas.
Amazon, por ejemplo, acaba de invertir 4.000 millones en Anthropic, los creadores de Claude, uno de los principales competidores de ChatGPT. Para entender mejor las derivadas de la IA tenemos este ejemplo que aparece en el anuncio de ese acuerdo: “Lonely Planet, una célebre editorial de viajes, redujo sus costes de generación de itinerarios en casi un 80 por ciento, después de implementar Claude 2; sintetizando sus décadas de contenido de viajes para ofrecer recomendaciones de viajes coherentes y altamente precisas”.
Es imposible que todo esto se convierta en cotidiano a la vez. No somos capaces de asumir tanta novedad. Pero irá ocurriendo. Nadie se resistirá a crear stickers inventados, preguntar paridas en el chat grupal o consultar recetas con lo que hay en la nevera en lugar de recurrir a las habituales de internet con ingredientes raros, o a recurrir a las gafas que nos dicen a qué edificio miramos. Mucha gente estará ahora pensando: “Nada, esto me pilla mayor, no es para mí”. Ya, yo también me resistí a los móviles, pero llega un día en que resistirse es la postura irracional: lo nuevo es demasiado útil, divertido o lo tiene el cuñado.
Las nuevas gafas de Meta costarán menos de 300 dólares y estarán a la venta en octubre. Son las Google Glass, sí. pero mucho más chulas. Grabarán y no lo sabremos. En 2014 había pocas cámaras en la calle y hoy la privacidad en público no existe. Si te hurgas la nariz y eres famoso (más en el Congreso) te pueden grabar. Si te caes o chocas o te peleas, es indudable que vas a llegar a internet.
Puedes seguir a EL PAÍS Tecnología en Facebook y X o apuntarte aquí para recibir nuestra newsletter semanal.
Tu suscripción se está usando en otro dispositivo
¿Quieres añadir otro usuario a tu suscripción?
Si continúas leyendo en este dispositivo, no se podrá leer en el otro.
FlechaTu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.
En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.