MI SELECCIÓN DE NOTICIAS
Noticias personalizadas, de acuerdo a sus temas de interés
Una de las grandes preguntas de hoy es: ¿Podrán los agentes de inteligencia artificial, IA, asumir la gestión de una empresa y reemplazarnos? Precisamente, esta fue la pregunta a la que pretendieron darle respuesta un grupo de investigadores de las universidades Carnegie Mellon y Duke, y cuyos resultados compartieron en el documento “The Agent Company: Benchmarking LLM Agents on Consequential Real World Tasks”.
El experimento consistió en diseñar lo que los autores describen como “un entorno autónomo con sitios web internos y datos que imita el funcionamiento de una pequeña empresa de software, junto con una variedad de tareas que podrían realizar los trabajadores de dicha empresa”. En este contexto, agentes basados en grandes modelos de lenguaje (LLM, por sus siglas en inglés) fueron evaluados en tareas similares a las que enfrenta un trabajador de oficina: programación, gestión de proyectos, análisis financiero, y comunicación con colegas, entre otras.
Para desempeñar sus actividades, los agentes contaban con las herramientas típicas de una oficina: sistemas de programación, almacenamiento de documentos, planificación de proyectos y una plataforma de chat para la comunicación interna, donde podían coordinarse y obtener información no disponible en las descripciones iniciales de las tareas.
Para ilustrar los desafíos del experimento, una de las tareas asignadas consistía en completar un formulario de impuestos utilizando datos financieros almacenados en la nube, consultar instrucciones en un PDF, resolver dudas contactando al director financiero por chat, y finalmente guardar el formulario en formato PDF.
Los resultados del experimento fueron modestos: el mejor desempeño lo obtuvo la IA de Anthropic (Claude 3,5), completando solo 24% de las tareas, con una calificación global de 34%, mientras que ChatGPT o4 alcanzó 9% y 17%, respectivamente.
Según los autores, estos resultados reflejan que los agentes de IA aún presentan varias limitaciones para actuar de forma autónoma:
• Falta de sentido común: Incapacidad para inferir detalles implícitos evidentes para los humanos, como identificar que un archivo .docx debe tratarse como un documento de Word.
• Carencia de habilidades sociales: Dificultad para seguir interacciones básicas, como continuar una conversación tras recibir indicaciones claras.
• Problemas al navegar la web: Las interfaces modernas y elementos simples como pop-ups bloquean a los agentes, mientras que los humanos los sortean sin dificultad.
• Atajos engañosos: Ante la incertidumbre, los agentes tienden por soluciones incorrectas (alucinaciones), como renombrar usuarios para simular la finalización de una tarea.
Los resultados del experimento “The Agent Company” confirman que los agentes de IA aún están lejos de ser verdaderamente autogestionados, reforzando la relevancia del enfoque “Human in the Loop”, donde la supervisión y guía del usuario aportan el criterio, el contexto y el sentido común que solo las personas pueden ofrecer.
Así como al inicio de los LLMs el desempeño en tareas específicas fue precario y luego superado, hoy estamos en las primeras etapas de los agentes de IA. Es probable que muchas de estas brechas se reduzcan con el tiempo. La verdadera incógnita es: ¿Qué tan autónomos podrán llegar a ser?
La adhesión a la Ruta de la Seda no es solo un acuerdo comercial. Es una decisión política y estratégica de gran calado. No se trata de satanizar a China, pero tampoco de lanzarse a sus brazos con los ojos cerrados
La globalización es una apertura total al conocimiento, pero el globalismo es la lucha digital por la dominancia en términos de poder y se opone al progreso de la civilización entera
El Papa León XIV tiene hoy la oportunidad de reafirmar y reimaginar una visión humanista de la educación, para que esta sea faro orientador y puente seguro hacia una sociedad más cuidadora, más democrática, justa y en paz