La IA ha llegado al Proyecto Gutenberg: así ha generado más de 5.000 audiolibros nuevos

Para muchas personas, Internet es una arcadia de conocimiento libre y democrático. Nos permite acceder a toneladas de contenido liberado sin tener que pagar ni un solo euro. Por desgracia, damos por hecho demasiado a menudo este derecho a leer, escuchar y ver. Casi nunca pensamos en la infraestructura que lo ha hecho posible: voluntarios, iniciativas a escala global e instituciones sin ánimo de lucro que quieren hacer del acceso al conocimiento algo universal.

Hace años que cualquier persona aficionada a los libros tiene en el Proyecto Gutenberg y su catálogo un refugio al que acudir para consultar, leer y disfrutar de miles de obras de libre acceso. El proyecto, que fue creado por Michael S. Hart en 1971, ha conseguido digitalizar, archivar y distribuir más de 60.000 libros en formato electrónico, facilitando así la democratización de la lectura a escala global y dándonos un templo lector de primer orden.

No hay avaricia capitalista o ansia de propiedad, sino servicio público, tal y como lo definió su CEO cuando explicó los objetivos del proyecto para los próximos años: "El acceso al conocimiento es un bien público y un derecho humano”.

Era cuestión de tiempo que la inteligencia artificial olfateara por esos pagos y la biblioteca digital del Proyecto Gutenberg encontrara una sinergia perfecta con esta tecnología destinada a cambiar el mundo, y a nosotros. Ahora, además de tener a nuestra disposición una cantidad obscena de libros en formato digital, la IA, las redes neurales han convertido 5000 obras del proyecto Gutenberg en audiolibros.

La IA ya puede leer por nosotros

Distintos expertos del sector tecnológico consideran este paso un enorme avance en la democratización del acceso a la cultura escrita. Hasta ahora, convertir una obra en audiolibro demandaba recursos de tiempo y dinero, tanto en el proceso de conversión como en el pago de la locución a la persona encargada de infundirle emoción y hondura al texto escrito.

Esto era todavía más complicado en el caso del Proyecto Gutenberg, ya que su catálogo cuenta con libros con fuentes y formatos muy diferentes. Unificar los procesos de reconocimiento óptico del texto escrito y corregirlos añadía un sobrecoste al proceso, algo inasumible en muchos casos. Esto hacía que un buen puñado de obras interesantes se quedaran fuera de las posibilidades de las personas con discapacidad visual, que no podían leer o preferían conocer y profundizar en ellas a través del sonido. Aquí es donde entra la capacidad de demiurgo de la IA para simplificar lo que antes costaba tanto esfuerzo y dinero.

Libros con voces humanas

La transformación de parte del catálogo en audiolibros ha sido posible gracias a la alianza entre el Proyecto Gutenberg, el Instituto Tecnológico de Massachussets y Microsoft.

Fue esta última empresa la que propuso una solución basada en IA. Decidieron utilizar una red neuronal para transformar en audiolibros las más de 5000 obras que ya están disponibles de forma libre y gratuita. Lo inquietante viene aquí: la voz que lee las obras pasa por una real, con su timbre, su calidez y su sensación de autenticidad. Lo han logrado gracias a un sistema automático de inferencia de emociones que aprende en tiempo real a cambiar la voz de forma dinámica. Según sus responsables, lo más difícil de conseguir fue ‘extraer el texto adecuado para leerlo en voz alta’ y que la IA seleccionara fragmentos adecuados para su transformación.

Los responsables del nuevo catálogo de audiolibros están encantados con los avances en su proyecto de biblioteca universal. “Microsoft AI nos está ayudando a expandir nuestro alcance a audiencias completamente nuevas. La gran literatura es más accesible que nunca”.

El siguiente paso que planean es todavía más ambicioso. Además de convertir todo el catálogo restante en audolibros, los responsables de Gutenberg Literary Project quieren que cualquier persona pueda utilizar esta red neuronal para poner voz a una obra del catálogo. Si la tecnología que han patentado se democratiza lo suficiente, en el futuro sería posible leer un par de líneas de un libro para que la IA lo convirtiera completo con nuestra voz, nuestras inflexiones y nuestro tono.

La nueva biblioteca abierta de audiolibros ya está disponible en algunas de las principales plataformas distribuidoras de contenido en formato audio: LibriVox, Internet Archive, Spotify, Apple Podcasts y Google Podcasts.