Oficina 100% IA: Lo que salió mal

Agregue a sus temas de interés
Inteligencia artificial
Software

Una de las grandes preguntas de hoy es: ¿Podrán los agentes de inteligencia artificial, IA, asumir la gestión de una empresa y reemplazarnos? Precisamente, esta fue la pregunta a la que pretendieron darle respuesta un grupo de investigadores de las universidades Carnegie Mellon y Duke, y cuyos resultados compartieron en el documento “The Agent Company: Benchmarking LLM Agents on Consequential Real World Tasks”.

El experimento consistió en diseñar lo que los autores describen como “un entorno autónomo con sitios web internos y datos que imita el funcionamiento de una pequeña empresa de software, junto con una variedad de tareas que podrían realizar los trabajadores de dicha empresa”. En este contexto, agentes basados en grandes modelos de lenguaje (LLM, por sus siglas en inglés) fueron evaluados en tareas similares a las que enfrenta un trabajador de oficina: programación, gestión de proyectos, análisis financiero, y comunicación con colegas, entre otras.

Para desempeñar sus actividades, los agentes contaban con las herramientas típicas de una oficina: sistemas de programación, almacenamiento de documentos, planificación de proyectos y una plataforma de chat para la comunicación interna, donde podían coordinarse y obtener información no disponible en las descripciones iniciales de las tareas.

Para ilustrar los desafíos del experimento, una de las tareas asignadas consistía en completar un formulario de impuestos utilizando datos financieros almacenados en la nube, consultar instrucciones en un PDF, resolver dudas contactando al director financiero por chat, y finalmente guardar el formulario en formato PDF.

Los resultados del experimento fueron modestos: el mejor desempeño lo obtuvo la IA de Anthropic (Claude 3,5), completando solo 24% de las tareas, con una calificación global de 34%, mientras que ChatGPT o4 alcanzó 9% y 17%, respectivamente.

Según los autores, estos resultados reflejan que los agentes de IA aún presentan varias limitaciones para actuar de forma autónoma:

• Falta de sentido común: Incapacidad para inferir detalles implícitos evidentes para los humanos, como identificar que un archivo .docx debe tratarse como un documento de Word.

• Carencia de habilidades sociales: Dificultad para seguir interacciones básicas, como continuar una conversación tras recibir indicaciones claras.

• Problemas al navegar la web: Las interfaces modernas y elementos simples como pop-ups bloquean a los agentes, mientras que los humanos los sortean sin dificultad.

• Atajos engañosos: Ante la incertidumbre, los agentes tienden por soluciones incorrectas (alucinaciones), como renombrar usuarios para simular la finalización de una tarea.

Los resultados del experimento “The Agent Company” confirman que los agentes de IA aún están lejos de ser verdaderamente autogestionados, reforzando la relevancia del enfoque “Human in the Loop”, donde la supervisión y guía del usuario aportan el criterio, el contexto y el sentido común que solo las personas pueden ofrecer.

Así como al inicio de los LLMs el desempeño en tareas específicas fue precario y luego superado, hoy estamos en las primeras etapas de los agentes de IA. Es probable que muchas de estas brechas se reduzcan con el tiempo. La verdadera incógnita es: ¿Qué tan autónomos podrán llegar a ser?

Conozca los beneficios exclusivos para
nuestros suscriptores

ACCEDA YA SUSCRÍBASE YA

MÁS DE ANALISTAS

Camilo Guzmán

ÚLTIMO ANÁLISIS 10/06/2026

Usted construía empresa y ellos construían el relato

Tras el colapso parcial del socialismo y las reformas liberales de los años noventa, los defensores de la sociedad libre cayeron en la trampa del optimismo, asumiendo que el debate ideológico estaba superado para siempre

Alberto J. Bernal-León

ÚLTIMO ANÁLISIS 09/06/2026

Abelardonomics

En una entrevista muy completa, Abelardo y José Manuel respondieron decenas de preguntas sobre los temas más relevantes que hoy afectan la economía de Colombia y el equilibrio macroeconómico

Billy Escobar

ÚLTIMO ANÁLISIS 12/06/2026

La convergencia pendiente del sistema cameral

Las cámaras de comercio han sido determinantes para la formalización y el desarrollo empresarial del país. La evolución de las funciones del sistema ha sido evidente

MÁS ANALISTAS

MÁS DE LA REPÚBLICA

Japón 11/06/2026

INICIO

ANÁLISIS

HERNÁN DAVID PÉREZ

Oficina 100% IA: Lo que salió mal