¿Qué son los agentes de IA basados en LLMs?

¿Qué son los agentes de IA basados en LLMs?

¿Prefieres un resumen de este blog? ¡Da click en el botón de abajo y deja que ChatGPT te lo cuente! (también puedes probar con Perplexity)

Actualmente hay muchas clases de agentes de IA. Los basados en LLMs aprovechan el potencial de los modelos más populares (ChatGPT, Gemini, Claude, Grok, Perplexity, etc.) para ofrecer un asistente con capacidades de agente.

Puede sonar complejo, pero para comprenderlo vamos a ir paso a paso.

Sistemas, agentes, modelos: ¿por dónde emepezar?

¿Qué es un sistema de IA?

Es un sistema diseñado para imitar el pensamiento humano. Hay tantos tipos de sistemas de IA como necesidades en el mercado. Una herramienta de software que use el machine learning para identificar patrones, es un sistema de IA, más no es un agente, ni un modelo.

Puede usar sus capacidades de aprendizaje para reconocer patrones y en el proceso imita el pensamiento humano, pero no necesariamente reconoce el lenguaje, ni interpreta otra información ajena a la que necesita para su labor básica.

Contenido relacionado: ¿Cuál es la IA más precisa?

¿Qué es un agente?

En ‘el mundo ideal’ un agente de IA es un programa de software capaz de ejecutar ciertas tareas de manera autónoma, sin intervención humana. Son herramientas a las que se les pueden confiar tareas básicas repetitivas.

Por esta razón muchos usan herramientas de IA para por ejemplo, crear un itinerario de viaje, comprar los tiquetes más económicos y definir los planes más atractivos en el lugar de destino. En este ejemplo, funcionan más como asistentes que como agentes.

Muchas compañías están ahora invirtiendo en la búsqueda de agentes de IA capaces de realizar tareas más complejas, que requieran de memoria, análisis de contexto y toma de decisiones.

Sin embargo, según Gartner, un agente con estas características aún no está disponible en el mercado por varias razones que exploraremos más adelante. Ahora veamos que son los LLMs.

Asistentes de IA vs. Agentes de IA según Gartner

¿Qué son los LLMs?

Los LLMs (Large Language Models) son sistemas de inteligencia artificial capaces de identificar el lenguaje humano e interactuar con este. Se entrenan con múltiples datos (libros, páginas web, videos, audios, imágenes, etc.) a partir de técnicas de machine learning.

Las aplicaciones más conocidas en el mercado (ChatGPT, Gemini, Perplexity, Claude, etc.) cuentan (cada uno) con su propio modelo de lenguaje (LLM) y han sido diseñados a partir de diferentes datos, por lo que sus respuestas suelen ser diferentes y en ocasiones contradictorias.

¿Por qué los agentes de IA aún no trabajan como se esperaba?

Varias empresas han empezado a invertir en el desarrollo de agentes basados en LLMs (en el modelo de lenguaje de ChatGPT,  o de Gemini, o de…) y han encontrado algunas barreras importantes según lo reporta Gartner:

  1. Fortalezas y debilidades de cada modelo: Los LLMs tienen sus propias particularidades. Algunos responden muy bien a solicitudes relacionadas con cuentas, estados financieros y proyecciones económicas, mientras otros están más orientados a ofrecer una mejor experiencia al usuario.

¿Prefieres un resumen de este blog? ¡Da click en el botón de abajo y deja que ChatGPT te lo cuente! (también puedes probar con Perplexity)

Con el estado actual de los LLMs es imposible contar con un agente que sea bueno con todas las tareas, todo el tiempo. Las big tech siguen invirtiendo miles de millones de dólares para reducir las debilidades de sus propios sistemas mientras buscan innovación y un mejor retorno de inversión.

  1. El problema del contexto: Los agentes basados en LLMs pueden encontrar información muy valiosa en internet, registrar los datos previos del funcionamiento de la empresa y anticipar algunos sucesos basados en los patrones anteriores entre muchas otras cosas.

Pero son incapaces de tomar decisiones por un elemento clave: el contexto. Aún con los datos de ventas, confianza del consumidor y otros más, deben comprender algunos elementos socioeconómicos que van más allá de la mera información.

Interpretar’ el panorama completo es fundamental para la toma de decisiones. Sin este aspecto, los agentes son solo asistentes de IA que siguen requiriendo del humano para ejecutar acciones.

Además de estos problemas, desarrollar una IA sigue siendo bastante costoso. Según estimaciones de Gartner, el 40% de los proyectos de agentes de IA será cancelado para el 2027.

¿Qué cosas si pueden hacer los agentes de IA basados en LLMs?

Para Gartner, los agentes basados en LLMs gozan de popularidad en el mercado pero sus funciones aún distan del ‘deber ser’ y se basan en tres componentes que las compañías pueden aprovechar:

  • Recolección de información: pueden reunir grandes cantidades de datos de diversas fuentes, procesarlos y brindar insights de contexto.

  • Uso de herramientas: pueden interactuar con diversas aplicaciones para cumplir con ciertas tareas y ejecutar comandos en flujos de trabajo definidos.

  • Pensamiento paso a paso: Pueden usar capacidades de ‘razonamiento’ o cadena de pensamiento (COT - Chain of thought) para realizar inferencias y apoyar la toma de decisiones.

Este último componente (COT) es uno de los más usados aunque en ocasiones pasa desapercibido. Si le preguntas a un asistente de IA por las guitarras eléctricas más económicas en tu ubicación geográfica, establecerá una cadena de pensamiento antes de dar la respuesta.

Primero busca tiendas de instrumentos musicales, luego identifica a las que venden guitarras eléctricas y por último compara precios. De esa manera se excluyen resultados inútiles (tiendas que no venden guitarras, o que si las venden no publican su precio, etc.). Estas tres tareas, ejecutadas en forma lineal, componen una chain of thought o cadena de pensamiento.

¿Y si realmente no necesitas de un agente de IA?

Los agentes son uno de los múltiples sistemas de IA existentes. No podemos concebir la IA como una sola cosa, pues se trata de una tecnología muy versátil que ofrece distintas herramientas encaminadas a resolver diferentes problemas.

Por ejemplo, muchas compañías utilizan capacidades de machine learning para hacer predicciones sobre su stock: en qué meses se necesitarán más productos y en qué temporadas podrán ver reducida la cantidad de artículos disponibles.

Al usar machine learning, estamos hablando de una herramienta basada en IA, pero no es un agente. Lo mismo sucede con un chatbot de atención al usuario: está basado en IA pero no es un agente como tal.

Por ahora, mientras se resuelven los problemas de falta de contexto que tienen los actuales agentes, lo más recomendable es resolver cada situación con la solución más indicada.

Y no son los agentes. No todavía.