A fecha de 11 de mayo de 2026, Anthropic ha publicado tres nuevas características para Claude Managed Agents que representan un avance técnico concreto en cómo los sistemas de inteligencia artificial aprenden de su propia experiencia, evalúan su propio desempeño y colaboran en equipos de agentes especializados. Estas funciones —Dreaming, Outcomes y Orquestación Multiagente— pasaron del anuncio técnico a disponibilidad pública o a preview controlada en el transcurso de la primera semana de mayo de 2026, consolidando a Claude como una plataforma de agentes de IA orientada a entornos de producción empresarial de alta exigencia.

El anuncio llegó en un contexto de intensa actividad en la plataforma de Anthropic: la misma semana se confirmó el acuerdo de cómputo con SpaceX para utilizar el centro de datos Colossus 1 (más de 220.000 GPUs NVIDIA y 300 megavatios de capacidad), la duplicación de los límites de uso en Claude Code y la expansión hacia servicios financieros con integración completa de Microsoft 365. Las tres nuevas capacidades de Managed Agents forman parte de esta aceleración, pero merecen análisis independiente: cada una aborda un problema técnico distinto que ha limitado la adopción de agentes de IA en producción.

Contexto: el estado de los agentes de IA en 2026

El término "agente de IA" dejó de ser un concepto experimental durante 2025 y se consolidó como una categoría de producto en 2026. Hoy, organizaciones de distintos sectores despliegan sistemas autónomos que ejecutan tareas de múltiples pasos —análisis de contratos, generación de código, síntesis de datos financieros, soporte técnico de nivel avanzado— con supervisión humana variable.

Claude Managed Agents es la plataforma de Anthropic que permite a los equipos de desarrollo construir, desplegar y supervisar agentes basados en Claude en entornos productivos. A diferencia de llamadas a la API simples o de interacciones de un solo turno, los Managed Agents mantienen sesiones persistentes, acceden a herramientas externas, conservan memoria entre conversaciones y pueden integrarse con sistemas empresariales como Microsoft 365, bases de datos relacionales y servicios en la nube de AWS, Google y Azure.

La evolución de la plataforma a lo largo de 2025 y 2026 ha seguido una lógica clara: cada iteración añade capacidades que reducen la dependencia del diseño manual de instrucciones y que acercan el comportamiento del agente al de un colaborador que aprende de la experiencia y puede coordinar trabajo con otros agentes.

Las tres funciones anunciadas la primera semana de mayo de 2026 responden a tres limitaciones concretas que han frenado la adopción empresarial:

  1. La falta de aprendizaje continuo de la experiencia pasada, que obliga a los equipos a actualizar manualmente las instrucciones del agente cuando su rendimiento se degrada.
  2. La dificultad de definir criterios de éxito verificables en tareas con requisitos cualitativos o multidimensionales, donde el prompt inicial no es suficiente para garantizar la calidad del resultado.
  3. La incapacidad de paralelizar trabajo complejo entre múltiples agentes especializados cuando una sola ventana de contexto no es suficiente para la tarea.

Entender qué resuelve cada función requiere distinguirlas con precisión técnica.

Dreaming: cuando los agentes aprenden de su propia historia

¿Qué es Dreaming?

Dreaming es una función en fase de investigación experimental (research preview) —acceso disponible solo por solicitud— que introduce un proceso programado de consolidación de memoria en los agentes de Claude Managed Agents.

La analogía con el sueño humano es deliberada y técnicamente apropiada. Durante el sueño REM, el cerebro humano consolida experiencias del día, extrae patrones relevantes, descarta información redundante y refuerza los aprendizajes más útiles para la actividad futura. Dreaming implementa un proceso análogo para los agentes de IA: en lugar de tratar cada sesión como un evento aislado, un proceso asincrónico de fondo revisa el historial completo de sesiones pasadas, identifica patrones recurrentes y actualiza la memoria del agente de forma estructurada.

Según la descripción técnica de Anthropic, Dreaming "surfacifica patrones que un solo agente no puede ver por sí mismo, incluyendo errores recurrentes, flujos de trabajo que los agentes convergen a adoptar, y preferencias compartidas entre miembros del equipo."

Cómo funciona técnicamente

Dreaming es un proceso asincrónico, completamente separado del ciclo de inferencia principal del agente. Cuando se activa según la programación definida por el desarrollador, el sistema ejecuta los siguientes pasos:

  1. Revisión de sesiones: el sistema accede al almacén de sesiones pasadas del agente, organizadas por tipo de tarea, usuario o proyecto.
  2. Extracción de patrones: identifica tendencias que solo son visibles al analizar múltiples sesiones en conjunto —por ejemplo, que el agente comete sistemáticamente un error de formato en un tipo específico de informe, o que los usuarios del equipo ajustan consistentemente la respuesta de una forma particular.
  3. Propuesta de actualizaciones: el sistema genera propuestas concretas para actualizar la memoria del agente: nuevas instrucciones, correcciones a reglas existentes, o refinamientos de preferencias documentadas.
  4. Aplicación controlada: las actualizaciones se aplican automáticamente o esperan revisión y aprobación humana, según la configuración elegida por el desarrollador.

Este diseño preserva el control operativo: los equipos que operan en entornos regulados o que requieren auditoría estricta pueden configurar Dreaming para que proponga cambios sin aplicarlos, manteniendo un flujo de aprobación humana. Los equipos que priorizan velocidad de mejora pueden habilitarlo en modo automático con revisión periódica.

El caso de Harvey: multiplicar por seis la tasa de finalización

El ejemplo más concreto de Dreaming en producción proviene de Harvey, empresa de tecnología legal que utiliza Claude para automatizar tareas de análisis jurídico de alta complejidad. Harvey reportó que, tras implementar Dreaming en sus flujos de trabajo, las tasas de finalización en tareas legales complejas aumentaron aproximadamente seis veces respecto al rendimiento sin Dreaming activo.

Este número merece contexto crítico: no se trata de un benchmark controlado en condiciones de laboratorio, sino de un resultado observado en producción con documentos legales reales, flujos de trabajo empresariales activos y usuarios con necesidades específicas del sector. El resultado sugiere que la brecha entre un agente que aprende sistemáticamente de sus errores y uno que no lo hace puede ser sustancial —no marginal— en dominios de alta complejidad y alta variabilidad.

Por qué Dreaming importa estratégicamente

El reto de los agentes de IA en 2025 era la rigidez temporal: un agente bien configurado en el momento del despliegue inicial podía degradar su rendimiento con el tiempo si las condiciones del entorno cambiaban, si los usuarios adoptaban nuevos patrones de trabajo o si surgían nuevos tipos de tareas no contemplados en el diseño original. Corregir esta degradación requería intervención manual costosa: revisar sesiones individuales, identificar el problema, rediseñar instrucciones y volver a desplegar el agente.

Dreaming aborda este problema de forma sistemática introduciendo un ciclo de retroalimentación continua que no depende de que el equipo humano detecte cada problema individualmente. Es, funcionalmente, el equivalente de un colaborador que revisa su propio desempeño al final de cada jornada y actualiza sus notas de trabajo, en lugar de esperar a que su responsable le señale los errores en la siguiente evaluación trimestral.

Que Anthropic mantenga Dreaming como research preview —no en disponibilidad general— indica que el equipo está observando cuidadosamente los efectos en producción antes de generalizarlo. En particular, el riesgo de que un agente consolide patrones incorrectos (aprender de errores sistemáticos como si fueran buenas prácticas) es real y requiere salvaguardas adicionales que el equipo continúa evaluando.

Outcomes: definir el éxito y dejar que el agente lo persiga

El problema de las instrucciones ambiguas

Los sistemas de instrucciones para agentes de IA funcionan bien cuando el éxito es binario y verificable: ¿se ejecutó la tarea? ¿Se generó el documento? Pero la mayoría de las tareas empresariales de valor implican criterios subjetivos o multidimensionales: un informe ejecutivo no solo debe existir —debe tener el tono de la marca, cubrir los puntos requeridos, ajustarse al formato establecido y no superar la extensión apropiada para la audiencia objetivo.

Comunicar todos esos criterios en el prompt inicial es difícil; verificar que se cumplieron, aún más. El resultado habitual es un ciclo manual de revisión y corrección donde un usuario humano lee el resultado, identifica qué falla, añade instrucciones al prompt y vuelve a ejecutar el agente.

Outcomes resuelve este problema introduciendo un mecanismo formal y automatizado de evaluación separado del proceso de generación.

Cómo funciona Outcomes

Con Outcomes, el desarrollador (o el equipo que despliega el agente) define un rubric: un conjunto explícito de criterios que describe qué constituye éxito para una tarea específica. Este rubric puede incluir:

  • Criterios cualitativos: "el documento debe mantener un tono neutro y técnico, sin lenguaje de ventas".
  • Criterios cuantitativos: "la respuesta no debe superar las 500 palabras" o "debe incluir al menos tres ejemplos concretos".
  • Criterios estructurales: "el tercer párrafo debe mencionar el marco regulatorio aplicable".
  • Criterios de cobertura: "todos los ítems del checklist adjunto deben estar abordados en la respuesta".

Una vez definido el rubric, Outcomes introduce un grader —un componente de evaluación independiente— que opera en su propio contexto de inferencia, completamente separado del razonamiento interno del agente que generó la respuesta. Esta separación es técnicamente significativa: el evaluador no conoce el proceso de generación, solo evalúa el resultado contra los criterios definidos. Esto elimina el sesgo de confirmación que ocurre cuando el mismo sistema que genera un resultado también lo evalúa.

El ciclo de Outcomes funciona así:

  1. El agente genera una respuesta inicial basada en las instrucciones del prompt.
  2. El grader evalúa la respuesta contra cada criterio del rubric en su propio contexto.
  3. Si la respuesta no cumple los criterios, el agente recibe retroalimentación específica y genera una versión revisada.
  4. El proceso se repite hasta que la respuesta supera todos los umbrales definidos, o hasta que se alcanza el número máximo de iteraciones configurado por el desarrollador.

Los benchmarks: hasta 10 puntos porcentuales de mejora

Anthropic publicó benchmarks internos que comparan el rendimiento de Outcomes frente al bucle estándar de prompting sin evaluación automatizada. Los resultados más destacados:

  • Generación de archivos .docx con formato específico: +8,4 puntos porcentuales en tasa de éxito de tareas.
  • Generación de presentaciones PowerPoint con criterios de diseño: +10,1 puntos porcentuales en tasa de éxito.
  • Tasa de éxito general: mejoras de hasta 10 puntos porcentuales, con los mayores incrementos concentrados en las tareas más difíciles del conjunto de evaluación.

La última observación es especialmente relevante: las mejoras más grandes se producen en tareas complejas, no en tareas simples. Esto es consistente con la hipótesis de que Outcomes aporta más valor cuando la tarea tiene alta variabilidad de resultados posibles —exactamente el escenario donde los agentes de IA fallan con mayor frecuencia en producción.

Casos de uso prácticos para Outcomes

La función es especialmente útil en dominios donde la calidad subjetiva o multidimensional importa:

  • Documentación técnica: el agente debe cubrir todos los puntos requeridos, usar el glosario corporativo correcto y mantener un nivel de detalle apropiado para la audiencia técnica específica.
  • Informes de análisis financiero: los criterios incluyen cobertura de variables definidas, formato de datos según estándares internos y claridad de las conclusiones respecto a los objetivos del informe.
  • Materiales de comunicación corporativa: la voz de la marca, el tono apropiado para la audiencia objetivo y el cumplimiento de guías editoriales son perfectamente verificables con un rubric bien diseñado.
  • Generación y revisión de código: el código generado debe superar tests específicos, cumplir convenciones de estilo definidas y no introducir patrones de vulnerabilidad conocidos.
  • Respuestas de soporte técnico: las respuestas deben cubrir el problema reportado, ofrecer pasos de resolución verificables y mantener el tono apropiado según la categoría de severidad del ticket.

Outcomes está disponible en beta pública para todos los clientes de Claude Managed Agents, lo que indica que Anthropic considera el mecanismo lo suficientemente maduro para uso generalizado en producción.

Orquestación Multiagente: dividir para conquistar

Por qué un solo agente no es suficiente para todo

Los agentes de IA actuales tienen limitaciones inherentes a la arquitectura de transformadores: pueden mantener un número finito de tokens en su ventana de contexto activa, lo que limita la cantidad de información que pueden procesar en una sola sesión. Además, ciertas tareas requieren paralelismo —ejecutar múltiples análisis simultáneamente para reducir el tiempo total— o especialización: un agente configurado para análisis legal de alta precisión puede no ser el más adecuado para generar código Python que automatice ese mismo análisis.

La Orquestación Multiagente de Claude Managed Agents aborda estas limitaciones introduciendo una arquitectura estructurada de coordinación entre agentes.

La arquitectura: un coordinador y sus especialistas

La arquitectura sigue un patrón de agente coordinador (lead agent) y agentes especialistas (subagents). El coordinador recibe la descripción de la tarea completa, la descompone en partes manejables e independientes, y delega cada parte a un especialista configurado con:

  • Su propio modelo de Claude (que puede ser diferente al del coordinador según las necesidades de la subtarea).
  • Su propio conjunto de instrucciones optimizado para el tipo de trabajo asignado.
  • Sus propias herramientas y accesos a sistemas externos relevantes para su función específica.

Los especialistas trabajan en paralelo sobre un sistema de archivos compartido, lo que les permite acceder a los resultados intermedios de otros especialistas sin necesidad de comunicación explícita entre ellos. El coordinador puede consultar el estado de cada especialista durante la ejecución del flujo —no solo al final— porque los eventos son persistentes y cada agente conserva un registro completo de lo que ha realizado.

La Claude Console ofrece visibilidad completa del proceso en tiempo real: qué tarea delegó el coordinador a cada especialista, en qué orden se ejecutaron las subtareas, cuáles completaron su trabajo y cuál es el estado general de la tarea principal. Esta trazabilidad es fundamental para entornos empresariales donde la auditoría del proceso es tan importante como el resultado final.

La limitación deliberada: profundidad máxima de un nivel

Un aspecto técnico que merece atención especial: Anthropic impuso una restricción de profundidad de un nivel. El coordinador puede delegar a especialistas, pero los especialistas no pueden crear sus propios subespecialistas. La jerarquía máxima permitida es coordinador → especialistas; cualquier instrucción que intente crear agentes a mayor profundidad es ignorada por el sistema.

Esta restricción es explícitamente deliberada, no una limitación técnica temporal que se planea eliminar en versiones futuras. El razonamiento de Anthropic es transparente: los sistemas de agentes con múltiples niveles de delegación se vuelven rápidamente difíciles de rastrear, depurar y auditar en producción. Un error introducido en un subagente de tercer nivel puede propagarse de formas no predecibles hacia arriba en la jerarquía, produciendo resultados incorrectos que son extremadamente difíciles de atribuir a su causa raíz.

Al limitar la profundidad a un nivel, Anthropic sacrifica la flexibilidad arquitectónica máxima a cambio de predecibilidad operativa y trazabilidad auditables —dos valores que las organizaciones empresariales priorizan sistemáticamente sobre la complejidad técnica máxima posible.

El caso de Netflix: procesar cientos de builds en paralelo

El ejemplo empresarial publicado por Anthropic con el anuncio proviene de Netflix. El equipo de plataforma de la empresa de streaming construyó un agente de análisis que procesa registros de cientos de compilaciones de código provenientes de distintas fuentes y equipos, para identificar problemas recurrentes que afectan a miles de aplicaciones en producción.

Sin orquestación multiagente, este análisis requeriría procesar cada conjunto de registros de forma secuencial —uno tras otro— o construir infraestructura personalizada de paralelismo fuera de Claude, con toda la complejidad operativa que eso implica. Con Orquestación Multiagente, el coordinador distribuye el análisis de cada fuente de logs entre especialistas que trabajan en paralelo, consolidan sus hallazgos en el sistema de archivos compartido y el coordinador genera un informe unificado con los patrones identificados.

El resultado no es solo más rápido en términos de tiempo total de ejecución: es cualitativamente diferente, porque el análisis puede cubrir un volumen de datos que ningún agente individual podría procesar dentro de los límites de su ventana de contexto.

Comparativa con el ecosistema: cómo se posiciona Anthropic

OpenAI y los Workspace Agents

OpenAI presentó en 2025 sus Workspace Agents, que permiten delegar tareas a agentes especializados dentro del ecosistema de herramientas de Microsoft 365. Sin embargo, la arquitectura de OpenAI prioriza la integración con productos de productividad existentes —Word, Excel, Outlook— más que las primitivas de orquestación programables que ofrecen los desarrolladores.

La apuesta de Anthropic con Claude Managed Agents es diferente: ofrece primitivas de más bajo nivel (coordinación programable, memoria consolidada, evaluación separada) que los equipos de desarrollo pueden usar para construir flujos de agentes a medida, en lugar de flujos predefinidos dentro de aplicaciones de productividad específicas.

GPT-5.5 Instant —el nuevo modelo por defecto de ChatGPT lanzado el 5 de mayo de 2026— también introduce mejoras en reducción de alucinaciones (52,5% menos que su predecesor en prompts de alto riesgo en medicina, derecho y finanzas), pero se centra en la experiencia de usuario de ChatGPT, no en la infraestructura de agentes programables.

Google Cloud y Vertex AI

Google Cloud ofrece agentes basados en Gemini dentro de Vertex AI, con capacidades de orquestación mediante ML Pipelines y soporte para flujos de trabajo multi-modelo. Sin embargo, el equivalente funcional a Dreaming —un ciclo de retroalimentación continua basado en análisis de sesiones pasadas con actualización automatizada de memoria— no tiene un análogo directo en la oferta pública de Google a mayo de 2026.

AWS Bedrock y la consolidación de proveedores

Amazon Web Services ha expandido significativamente las capacidades de agentes en Bedrock durante 2026, incluyendo integración nativa con servicios propios (Lambda, S3, DynamoDB) y soporte para Claude Opus 4.7 directamente en la plataforma. La diferenciación de Claude Managed Agents frente a Bedrock Agents no es el modelo subyacente —Claude Opus 4.7 está disponible en ambos— sino el conjunto de primitivas de gestión (Dreaming, Outcomes, Orquestación) que Anthropic desarrolla exclusivamente en su plataforma nativa.

Esto crea una decisión arquitectónica concreta para los equipos empresariales: maximizar la integración con el ecosistema AWS usando Bedrock Agents, o acceder a las capacidades más avanzadas de gestión de agentes usando la plataforma directa de Anthropic.

Qué significa para las empresas: oportunidades concretas

Servicios legales y compliance

El caso de Harvey ilustra el potencial en servicios legales. Los documentos jurídicos requieren precisión terminológica, cobertura completa de cláusulas específicas y tono formal consistente —criterios perfectamente codificables en un rubric para Outcomes. Dreaming permite que el agente aprenda las convenciones específicas de cada organización o departamento legal sin requerir que un equipo de IA rediseñe el sistema de instrucciones manualmente tras cada cambio de contexto o de cliente.

La Orquestación Multiagente permite asignar especialistas distintos a distintas fases del análisis jurídico: un agente que identifica las cláusulas relevantes, otro que verifica su conformidad con el marco regulatorio aplicable y otro que genera el resumen ejecutivo, todo de forma paralela y coordinada.

Análisis de datos a escala

El caso de Netflix ilustra el potencial en análisis de datos a gran volumen. Cualquier organización que necesite procesar regularmente grandes volúmenes de registros, documentos o señales puede beneficiarse de Orquestación Multiagente: análisis de logs de seguridad y detección de anomalías, procesamiento masivo de contratos de proveedores, revisión de registros financieros para auditorías internas o auditorías de repositorios de código.

Generación de contenido estructurado y escalable

La mejora de +10,1 puntos porcentuales en generación de presentaciones PowerPoint con criterios de diseño específicos no es un dato menor. Para equipos que generan decenas o cientos de informes mensuales con formatos predefinidos —reportes de gestión, informes de clientes, materiales de capacitación— Outcomes convierte al agente en un sistema que puede iterar hasta cumplir con los estándares establecidos sin intervención humana en cada documento individual.

Operaciones de software y DevOps

La Orquestación Multiagente permite construir pipelines de análisis de software donde distintos especialistas se encargan de distintas dimensiones: un agente que analiza calidad de código, otro que verifica dependencias y licencias, otro que genera o actualiza documentación técnica y otro que ejecuta y verifica los resultados de los tests automatizados. El coordinador consolida los resultados y genera un informe unificado del estado del repositorio, listo para revisión humana.

Limitaciones reales y consideraciones de adopción

Dreaming sigue siendo experimental

Es importante subrayar que Dreaming no está en disponibilidad general. El acceso por solicitud refleja que Anthropic está evaluando cómo los sistemas de memoria consolidada se comportan en entornos de producción reales antes de abrir el acceso. Los equipos que adopten Dreaming deben estar preparados para encontrar comportamientos inesperados y para mantener revisión humana de los cambios propuestos, especialmente en las fases iniciales de implementación.

El costo incremental de Outcomes

Cada ciclo de iteración en Outcomes implica llamadas de inferencia adicionales: la generación inicial, la evaluación del grader en su propio contexto y cada iteración correctiva posterior. Para tareas que requieren múltiples iteraciones antes de alcanzar los criterios del rubric, el costo acumulado en tokens —y por ende en tiempo de respuesta y presupuesto de API— puede ser significativamente mayor que un prompt único. Los equipos deben calibrar el número máximo de iteraciones según el valor de la tarea, el costo aceptable por ejecución y la urgencia del resultado.

La profundidad de un nivel en Orquestación

La restricción de profundidad máxima de un nivel es una limitación real para flujos de trabajo que naturalmente tendrían una jerarquía más profunda. Los equipos que diseñan pipelines complejos deben incorporar esta restricción como un principio de diseño desde el inicio del proyecto arquitectónico, no como algo que podrán superar con actualizaciones futuras de la plataforma.

La calidad del rubric determina la calidad de Outcomes

Outcomes es tan efectivo como el rubric que lo define. Un rubric con criterios vagos, contradictorios o incompletos producirá un grader que evalúa incorrectamente, lo que puede llevar al agente a iterar en la dirección equivocada o a producir resultados que superan los criterios técnicos pero no cumplen con la intención del usuario. El diseño de rubrics de alta calidad es un nuevo tipo de trabajo técnico —similar al diseño de tests automatizados— que los equipos deben aprender a realizar con rigor.

Privacidad y retención de datos en Dreaming

Dreaming accede al historial completo de sesiones pasadas del agente para extraer patrones. En entornos donde las sesiones contienen información confidencial —conversaciones sobre estrategia legal, datos financieros no públicos, información identificable de clientes— los equipos deben verificar que las políticas de retención de datos, los acuerdos de procesamiento de datos y las obligaciones regulatorias aplicables son compatibles con el acceso de Dreaming a ese historial antes de habilitarlo.

Preguntas frecuentes

¿Cuál es la diferencia entre la memoria de sesión estándar y Dreaming?

La memoria de sesión en Claude Managed Agents permite que el agente acceda a información de conversaciones y sesiones pasadas dentro de los límites configurados: documentos previos, preferencias del usuario expresadas anteriormente, contexto acumulado en interacciones previas. Dreaming es un proceso técnicamente distinto que opera sobre el conjunto de sesiones acumuladas para extraer patrones transversales: no solo recuerda lo que ocurrió en sesiones individuales, sino que identifica tendencias recurrentes que solo son visibles al analizar múltiples sesiones en conjunto.

¿Outcomes reemplaza el diseño cuidadoso del prompt inicial?

No. Outcomes complementa el diseño del prompt, no lo reemplaza. El prompt inicial sigue siendo el punto de partida y el marco de referencia del agente; Outcomes añade un mecanismo automatizado de verificación y corrección para los casos en que el resultado inicial no cumpla todos los criterios definidos. Un prompt bien diseñado reduce el número de iteraciones necesarias; Outcomes actúa como red de seguridad estructurada cuando el resultado inicial no supera el umbral de calidad requerido.

¿Cómo se determina el número óptimo de especialistas en Orquestación Multiagente?

No existe una fórmula universal. El número óptimo depende de la naturaleza de la tarea, la cantidad de paralelismo genuino posible, el costo de coordinación entre agentes y el presupuesto de inferencia disponible. Anthropic recomienda comenzar con la arquitectura más simple que resuelva el problema —frecuentemente un solo agente es suficiente— y añadir especialistas únicamente cuando la complejidad o el volumen de la tarea justifican la inversión en coordinación.

¿Los tres sistemas (Dreaming, Outcomes, Orquestación) funcionan conjuntamente?

Sí, y los beneficios son complementarios en términos arquitectónicos. Un flujo de trabajo puede utilizar Orquestación Multiagente para distribuir el trabajo entre especialistas, Outcomes para verificar la calidad del resultado de cada especialista antes de consolidarlo y Dreaming para que el sistema global mejore progresivamente con el tiempo. Sin embargo, la complejidad de configurar, monitorear y mantener los tres sistemas simultáneamente es considerablemente mayor que cada uno por separado, y se recomienda implementarlos de forma incremental, validando cada capa antes de añadir la siguiente.

¿Estas funciones están disponibles en Amazon Bedrock o Google Vertex AI?

Outcomes y Orquestación Multiagente son funciones nativas de la plataforma Claude Managed Agents, accesible directamente a través de la plataforma de Anthropic (claude.ai/agents y la API de Claude). Su disponibilidad en Amazon Bedrock o Google Cloud Vertex AI depende de lo que cada proveedor implemente en sus respectivas integraciones de Claude, y a la fecha de publicación de este artículo estas funciones de gestión de plataforma son exclusivas de la plataforma directa de Anthropic.

Fuentes oficiales recomendadas