El audio nos permite consumir un contenido sin la necesidad de paralizar nuestra actividad. Es tan sencillo como darle al play, ponerte tus auriculares y caminar al trabajo mientras escuchas un pódcast que te resume cada mañana las noticias más importantes del día. O alzar la voz y pedirle a tu asistente de voz que encienda las luces del salón mientras tu altavoz inteligente se sincroniza con la canción que estás reproduciendo desde el portátil.

Hace diez años muchas de estas acciones eran difíciles de imaginar, pero la sociedad se digitaliza con tal celeridad, que ya tenemos que comenzar a mirar al futuro para saber cómo la tecnología condicionará nuestras vidas. Para tratar de responder a todas estas cuestiones, la consultora Prodigioso Volcán y SEIM han presentado este miércoles su III Estado de Voz y Audio en España, “Mejor te mando un audio”, basado en las respuestas de 769 internautas españoles de entre 18 y 74 años.

Aunque para entender cómo será el futuro, primero hay que saber cómo anda el mercado del audio en el presente: En concreto, el documento analiza los cuatro sistemas más utilizados del sector: los pódcasts, los audiolibros, los asistentes de voz y los altavoces inteligentes.

El audio como producto: podcast y audiolibros.

El mercado del pódcast continua la tendencia alcista que inició en 2019. Según los datos esgrimidos, un 80 % ha oído hablar de ellos, y más de la mitad (53,2 %) de los encuestados los consume, cada vez con más frecuencia. Su target predilecto son las mujeres trabajadoras de entre 35 y 44 años; aunque se ha registrado un gran aumento de oyentes jóvenes de entre 18 y 34 años: el 64 % los escucha.

El lugar favorito para disfrutarlos es en el hogar, y, con mucha diferencia, a través del teléfono móvil (79 %), muy a distancia de su competidor más próximo: el portátil (25, 4 %). Spotify se posiciona como la aplicación favorita del 56,7 % de los amantes del podcast, al igual que para los de los audiolibros, un producto conocido por el 90 % de los encuestados, aunque solo consumido por el 31,1 % de ellos.

El audio como herramienta: asistentes de voz y altavoces inteligentes

Cada vez hay más. Siri, Alexa… pero de momento Google Assistant sigue en la delantera de los asistentes de voz, aunque estos sabelotodo digitales todavía generan desconfianza entre la población española por cuestiones de privacidad de las grandes tecnológicas. Aun así, el 81 % sabe de su existencia y el 54,6 % los utiliza, principalmente para buscar contenido, y cada vez más frecuentemente: un 27 % recurren a ellos a diario (un 22 % más que el año pasado).

¿Y por qué los utilizamos o no? Su principal ventaja: que nos ahorra tiempo; su desventaja más destacada: que a veces no saben responder cuándo les indicas un comando y se limitan a decir: “Lo siento, no te he entendido”. En cuanto a los altavoces digitales, en 2021 ha aumentado su uso un 19 %.

“Los claros vencedores de la pandemia durante el último año han sido el pódcast y los altavoces inteligentes, lo que evidencia que la tecnología alza la voz y la escucha”, ha explicado la socia directora de SEIM, Noelia Ruiz.

Mensajes desde 2031

Del mismo modo, han consultado con diferentes expertos en el sector de la tecnología del lenguaje, la innovación o la inteligencia artificial, entre otros, para determinar cuáles van a ser las claves de audio y la voz en esta próxima década.

En la actualidad, dividimos el audio entre contenido y herramienta, pero el futuro difuminará la barrera entre ambas, porque con la Inteligencia Artificial (IA) pueden llegar a confluir en una única cosa.

“Somos una especie que hace las cosas con la voz. Es algo que está en nuestro día a día. Por eso tengo claro que el uso de la tecnología basada en la voz va a crecer”, afirma en el informe la diseñadora conversacional de VASS, Amy Dolin.

Seguiremos utilizando la voz como herramienta para dar órdenes o recibir información, aunque los dispositivos con los que establezcamos comunicación podrán adaptar su respuesta a nuestras necesidades y en el formato que más conveniente sea para nosotros. Pasarán de ser asistentes virtuales a ser asistentes totales.

A día de hoy, el sonido puede influir hasta un 86 % en el consumidor a la hora de conectar con una marca o rechazarla, según indica Fast Company. Por ello, las compañías comenzarán a comunicarse directamente con nosotros apelando a la cercanía de la voz. El branding dejará de ser puramente visual.

Pero no es oro todo lo que reluce. El incremento del uso de tecnologías de voz y audio también encierra retos importantes, como su universalidad y el alcance a todos los lenguajes del planeta, incluidos los minoritarios. Pero especialmente en el ámbito de la desinformación, el acoso y los discursos de odio, donde tendrán que lidiar con las tecnologías deepfakes y las suplantaciones de identidad.

Las 7 notas del futuro

A modo de resumen y partiendo de la idea de las siete notas musicales, desde Prodigioso Volcán y SEIM han elaborado las siete notas del futuro:

DO: Adaptación

El audio nos acompaña a todas partes y nos permite hacer otras cosas mientras escuchamos. El de mañana, se ajustará a las demandas y, por ejemplo, podremos pedir un resumen en función del tiempo que tengamos.

RE: Personalización

También el propio contenido se adaptará a nuestras preferencias y no solo podremos elegir si queremos una voz femenina o masculina, sino la voz de nuestro artista o cantante favorito, por ejemplo, leyéndonos las noticias cada mañana.

MI: Accesibilidad

Los asistentes de voz permiten el uso de las tecnologías a personas mayores o discapacitadas para comunicarse con facilidad. En el futuro, la voz eliminará las brechas tecnológicas de uso.

FA: Viajes

Ahora podemos sugerir a nuestro coche que llame a alguien mientras conducimos, o que cambie de canción. En el futuro serán nuestros coches los que nos hablarán, nos informarán y actuarán conforme a lo que nosotros les indiquemos. Pero eso no es nada nuevo, ya lo vimos con Michael y “Kitt”, El Coche Fantástico.

SOL: Transmedia

Una buena historia se puede contar en forma de noticia, de podcast, de libro o una película. En el futuro el contenido podrá amoldarse a todos los formatos de manera automática.

LA: Ecosistemas

Nuestro altavoz se sincroniza con el ordenador, el teléfono móvil, la televisión. En el futuro todo será uno.

SI: Privacidad

Conjugar todos los avances con las amenazas a la privacidad. Evitar el mal uso de las tecnologías de automatización y evitar las suplantaciones/fraudes.