Hasta hace muy poco, la inteligencia artificialnos sonaba a películas de ciencia ficción, androides y robots domóticos malignos, como el Ultrahouse 3000 que intenta matar a Homer Simpson lanzándole al triturador automático de basura. En los últimos cinco o seis años la hemos asociado con grandes empresas tecnológicas como Google, Amazon o Meta, y hemos visto cómo se convertía en una nueva salida laboral para ingenieros, matemáticos y lingüistas.

Sin embargo, algo ha cambiado desde 2020, y las grandes compañías han empezado a poner a disposición del público los grandes modelos generativos. Estos sistemas están entrenados para producir texto, voz e imágenes de manera artificial, y hace tiempo que no son territorio exclusivo de los programadores: si sabes escribir, puedes probarlos. Estas son las cinco claves para entenderlos mejor.

1. Publicar para mejorar

Todo empezó en noviembre de 2021, cuando OpenAI, la empresa de Elon Musk, lanzó en abierto una plataforma donde cualquiera -previo registro con un correo electrónico y un teléfono- podía probar su nuevo modelo de generación de lenguaje: GPT-3. Podías pedirle que generase automáticamente una historia, un poema o una noticia, y también hablar con el sistema como si fuera un chatbot.

Era la primera vez que un modelo de inteligencia artificial tan potente estaba disponible en abierto para probarlo de manera masiva y gratuita, pero esto no era a cambio de nada. Por ejemplo, la plataforma te permitía marcar el texto generado con un pulgar hacia arriba o hacia abajo, con lo que guardaba tu satisfacción con la respuesta. Estas valoraciones, junto con las críticas en redes sociales y las investigaciones publicadas por expertos, han permitido a OpenAI un control de calidad masivo y a muy bajo coste para mejorar GPT-3.

2. El lenguaje como puente

Para que una herramienta de IA generativa funcione, hay que formular la instrucción con una frase; por ejemplo “Escribe un poema sobre un barco que cruza el horizonte”, o “Vas a entrevistar al CEO de una compañía de comunicación”. También es conveniente aportar algún ejemplo, como los dos primeros versos del poema o la primera pregunta de la entrevista. Así es como ha nacido un concepto fundamental para la IA: el prompt.

Imagen generada por Midjourney por el prompt "robot teniendo una reunión online con una mujer"
Imagen generada por Midjourney por el prompt "robot teniendo una reunión online con una mujer" | Prodigioso Volcán

El primer paso para que el sistema inteligente entienda qué le estamos pidiendo es descifrar este prompt, asignar un significado a nuestras palabras y desambiguarlas correctamente en su contexto. Esta tecnología, llamada comprensión del lenguaje natural (Natural Language Understanding), ha experimentado una mejora sin precedentes desde 2018 y es la que nos está permitiendo el acceso a una IA sin código.

3. Creatividad para todos

En la primavera de 2022, comenzaron a abrirse al público distintas herramientas que transformabancualquier prompt en una imagen. Las primeras no conseguían una gran calidad, pero en el mes de junio aparecieron Midjourney y Stable Diffusion para revolucionarlo todo. Las imágenes generadas son de una nitidez asombrosa, y la capacidad de los usuarios para crearlas ha ido sofisticándose cada vez más, añadiendo estilos pictóricos, lentes fotográficas, iluminaciones y planos.

Robot escribe un poema mientras videochatea - Midjourney
Robot escribe un poema mientras videochatea - Midjourney | Prodigioso Volcán

DALL·E 2, la IA de imagen de OpenAI, se llama así en honor a Salvador Dalí y al robot de Pixar WALL-E. Abrió sus puertas en septiembre de 2022, después de varios meses en los que solo se podía acceder por lista de espera, y permite no solamente crear imágenes de cero, sino también modificar o completar una imagen subida por nosotros con cualquier prompt que se nos ocurra. El arte digital y la creatividad han vivido un año de reinvención y revolución constante.

4. Conversar más, programar menos

Como fin de fiesta de este año IA 2022, OpenAI decidió lanzar chatGPT a finales de noviembre. Se trata de un asistente virtual entrenado específicamente para el diálogo que consigue mantener una conversación muy natural, bastante similar en expresión a la que podríamos tener con otra persona, y en distintos idiomas. Puede responder a cualquier pregunta, desde resolver problemas de programación hasta aconsejarnos qué regalar a una amiga o contarnos episodios históricos.

Durante los primeros cinco días de su lanzamiento, más de un millón de usuarios han querido probarlo e interactuar con él. Las redes se han llenado de ejemplos de sus respuestas, algunas de ellas muy inteligentes y otras no tanto. Su principal defecto es que está orientado a recrear una conversación muy convincente, pero no comprueba los datos que ofrece. Ante la posibilidad de que se haya inventado fechas, lugares e incluso hechos, es mejor no tomarlo como una fuente fiable de información.

El éxito inmediato de chatGPT resume bastante bien cómo vemos la nueva inteligencia artificial: el lenguaje se ha convertido en la mejor interfaz para comunicarnos con los sistemas, nos gusta la universalidad, los modelos multilingües y la conversación más que la búsqueda. Hemos dejado de intentar distinguir entre las producciones humanas y las automáticas, y nos preocupa más cómo seguir desarrollando nuestro espíritu crítico, nuestra imaginación y nuestro pensamiento lateral para convivir con la IA en un escenario de futuro híbrido. Y, por supuesto, estamos deseando ver qué novedades traerá 2023.