La IA de Anthropic (Claude) aprende “soñando” para mejorar de forma autónoma

Notícias Portuguesas » La IA de Anthropic (Claude) aprende “soñando” para mejorar de forma autónoma
Preview La IA de Anthropic (Claude) aprende “soñando” para mejorar de forma autónoma

Anthropic ha introducido una actualización significativa para sus agentes de IA, modificando la manera en que estos sistemas aprenden. La empresa detrás de Claude ha presentado nuevas funcionalidades para Managed Agents, su infraestructura de ejecución autónoma de agentes. La característica más destacada se denomina “Dreaming” (Soñar), un término inusual en el ámbito de la inteligencia artificial.

La función ‘Dreaming’ permite que, durante los periodos de inactividad, el agente revise sus sesiones recientes. Identifica patrones en sus aciertos y errores, actualizando su memoria con estas observaciones. Este proceso, programado y realizado mientras la IA no está activamente procesando tareas, está inspirado en el funcionamiento del cerebro humano durante el sueño, donde se consolidan recuerdos y se refuerzan conexiones. Anthropic afirma que esta combinación de memoria y “sueño” permite a los agentes mejorar por sí solos con el tiempo.

Según un comunicado de la compañía, este enfoque de “sueño” aborda un problema recurrente: la dificultad de un agente individual para detectar patrones que se manifiestan a lo largo de múltiples sesiones. La función ‘Dreaming’ es capaz de identificar errores repetitivos o flujos de trabajo comunes, incluso entre agentes de un mismo equipo que comparten metodologías.

Los usuarios tienen la opción de permitir que el proceso de ‘Dreaming’ sea completamente automático o de revisar los cambios antes de que se incorporen a la memoria del agente. Actualmente, ‘Dreaming’ se encuentra en una fase de investigación y está disponible para desarrolladores que soliciten acceso en la plataforma de Claude.

Otras innovaciones: ‘Outcomes’ y orquestación multiagente

Además de la función de ‘Dreaming’, Anthropic ha lanzado otras dos características diseñadas para aumentar la autonomía y fiabilidad de los agentes. La primera es ‘Outcomes’, basada en la premisa de que un agente funciona mejor cuando recibe retroalimentación sobre su rendimiento.

Con ‘Outcomes’, es posible definir un criterio de éxito para una tarea específica. Un agente evaluador independiente compara el resultado obtenido con estos criterios. Si existen discrepancias, el evaluador señala los fallos, y el agente realiza una nueva pasada. Este ciclo se repite hasta que el resultado cumple con el estándar establecido, eliminando la necesidad de intervención humana en cada intento. Anthropic destaca que ‘Outcomes’ es particularmente útil para tareas que requieren alta precisión o cobertura exhaustiva, habiendo demostrado mejoras de hasta un 10% en la tasa de éxito en sus pruebas internas, en comparación con los métodos convencionales.

Finalmente, se ha implementado la función de orquestación multiagente. Esta característica es aplicable cuando una tarea es demasiado compleja o extensa para ser manejada por un solo agente. En estos casos, un agente principal puede dividir la tarea en subpartes y asignarlas a agentes especializados que trabajan en paralelo. Cada agente especializado dispone de su propio modelo, instrucciones y herramientas. El agente principal supervisa el proceso general y puede consultar el estado de los demás agentes. Toda la actividad queda registrada en la consola de Claude, permitiendo visualizar las acciones de cada agente, el orden en que se ejecutaron y las razones detrás de cada decisión.

A diferencia de ‘Dreaming’, las funciones ‘Outcomes’ y la orquestación multiagente ya están disponibles en beta pública dentro de la plataforma Managed Agents de Anthropic.