Paula Silva Software Global Black Belt
LinkedIn

Three Horizons: Agentic DevOps PlatformThree Horizons: Plataforma Agentic DevOpsThree Horizons: Plataforma Agentic DevOps

Why 95% of AI pilots fail and how Three Horizons — a joint Microsoft + Red Hat accelerator built on Azure Red Hat OpenShift — compresses the path from raw infrastructure to a production Agentic DevOps Platform from 9–18 months down to 90–180 days.Por que 95% dos projetos piloto de IA falham e como o Three Horizons — um acelerador conjunto Microsoft + Red Hat sobre Azure Red Hat OpenShift — comprime o caminho da infraestrutura bruta até uma Plataforma Agentic DevOps em produção de 9–18 meses para 90–180 dias.Por qué el 95% de los proyectos piloto de IA fracasan y cómo Three Horizons — un acelerador conjunto de Microsoft + Red Hat sobre Azure Red Hat OpenShift — comprime el camino desde la infraestructura base hasta una Plataforma Agentic DevOps en producción de 9–18 meses a 90–180 días.

The foundation is decisive in 2026

Three things are simultaneously true heading into 2026, and the pattern connecting them is not coincidence — it is causation.

First, AI adoption is universal. Gartner and McKinsey data shows that 40% of enterprise applications will include task-specific AI agents by 2026, up from less than 5% in 2024, and 78% of organizations already use AI in at least one function. Second, most AI projects fail in production: 95% of GenAI pilots fail to deliver measurable value (MIT NANDA 2025), and Gartner projects that 40% of agentic AI projects will be cancelled by 2027 due to cost overruns, unclear value, and weak risk controls. Third, the organizations that are succeeding share a common trait: they invested in Platform Engineering before they invested at scale in AI.

The DORA 2025 report — surveying 39,000 practitioners — makes the mechanism explicit. The Four Key Metrics now act as a filter through which AI’s effects are observed. Organizations with mature Internal Developer Platforms that added AI saw +98% PR throughput. Organizations without platform maturity that added the same AI tools saw +242.7% more incidents per pull request and +441% longer code review cycles. Same tool. Opposite outcomes.

Chris Aniszczyk, CNCF CTO, stated it precisely at KubeCon Europe 2026: “Agents amplify what is good or bad in your ecosystem. The question is not whether you adopt agents. The question is whether your foundation can carry their weight.”

The five-layer pyramid

The AI-native enterprise is built in five layers with strict dependency ordering. You cannot compress layer N+1 faster than layer N allows.

  • L1 — Platform Engineering: The self-service, policy-governed, observable substrate that abstracts infrastructure complexity into developer-usable primitives. Outputs: Golden Paths, Guardrails, Safety Nets, Manual Review workflows.
  • L2 — Context Layer: Codified enterprise knowledge in machine-consumable form — service catalogs, TechDocs, vector stores, embedding pipelines, lineage tracking.
  • L3 — Cognitive Layer: Foundation models (GPT-4o, Claude, Llama, Mistral), fine-tuned models, embedding services, and evaluation pipelines, mediated through a platform-provisioned model gateway.
  • L4 — Intent Layer: Codified goals agents can plan against — Spec-Driven Development, EARS notation requirements, Constitutional AI principles, agent permission scope contracts.
  • L5 — Agentic Layer: Autonomous, goal-driven agents that combine intent, context, and cognition to take action. This is the visible layer for most AI investment in 2026, and the layer most likely to fail when the layers beneath it are missing.

An organization that jumps to the agentic layer without the platform, context, and intent layers in place does not produce agents. It produces an amplified mess.

CNCF Four Pillars as the control plane for AI

The CNCF Four Pillars — Golden Paths, Guardrails, Safety Nets, and Manual Review — were originally designed for human-driven delivery. In 2026, they are re-expressed as the control plane for autonomous agents.

Golden Paths were service templates and scaffolds for developers. For agents, they become the sanctioned execution surface: if it is not a Golden Path, the agent does not run it.

Guardrails prevented human misconfiguration. For agents, they contain autonomous escalation: permission scope, data access boundaries, output filtering. The agent containment field.

Safety Nets provided rollback and progressive delivery for humans. For agents, they become decision-level rollback, prompt-injection recovery, cost circuit breakers, and SLO-driven freeze.

Manual Review was code review on pull requests. For agents, it becomes approval gates on irreversible actions. Accountability stays with named humans by design.

The control plane does not need to be invented. It needs to be re-expressed as the operating system for the agent population.

Failure modes when the foundation is weak

When the platform layer is missing, five specific failure modes appear — each with the same structural root cause: AI operates faster than ad-hoc processes can govern.

Triple debt: AI simultaneously accumulates technical debt (generated code without review discipline), cognitive debt (knowledge that exists only in prompts and Slack threads), and intent debt (implicit goals where agents act without contracts). Three debts compound in parallel; none resolves the others.

Shadow platforms: When the central platform is unusable, teams build their own. The result is bespoke CI/CD per team, five different MCP server forks, conflicting Terraform modules, and duplicated observability stacks. The aggregate cost runs 2–3× the budget of a real platform — invisible in any single budget line until the first incident exposes the full bill.

Context rot: Service catalogs, documentation, and lineage silently become stale. Without freshness metrics and ownership coverage, AI agents reason over rotted context and produce plausible but wrong answers at scale. DataHub 2025 found that 88% of data leaders prioritize context as a top investment, yet 61% report data quality blocks AI delivery in practice.

Security regression: CrowdStrike’s 2026 Global Threat Report documents that organizations deploying AI coding assistants before maturing their platform security posture experienced a +38% increase in exploitable vulnerabilities in the first 12 months. The regression disappears where the platform enforces supply-chain controls — signed images, secret scanning, IaC linting — at admission, not after deploy.

The 100:1 problem: Gartner projects the agent-to-human ratio will reach 100:1 by 2028. Manual supervision at that ratio is not feasible. The platform must govern agent lifecycle, identity, and audit at platform speed, not human speed.

The 2026 Dual Mandate

Platform teams in 2026 carry two simultaneous responsibilities.

Mandate A — Augment the platform with AI: Use AI to make the platform itself faster. Agents that triage alerts, draft runbook fixes, propose Terraform changes, route incidents. In-IDE agents that generate Golden Path invocations, explain platform errors, produce boilerplate. The goal is raising the internal velocity of the platform team. Three Horizons ships 17 GitHub Copilot Chat agents pre-wired for this mandate.

Mandate B — Enable AI workloads at scale: Expose inference, vector storage, agent runtime, evaluation, and observability as first-class platform primitives consumed through Golden Paths. The goal is raising the external velocity of application teams. A platform executing only Mandate A produces a faster platform team but leaves application teams without support. A platform executing only Mandate B becomes the bottleneck. Mature platforms execute both.

Three Horizons — the accelerator

Three Horizons is a joint Microsoft + Red Hat GitHub template repository that materializes a production-grade Agentic DevOps Platform on Azure Red Hat OpenShift. It is not a proof of concept; it is an opinionated, vendor-supported starting point.

By the numbers: 120+ files, 16 Terraform modules, 22 Golden Path templates, 17 Copilot agents, 30+ alerting rules, 13 MCP server configurations, 20,000+ lines of code, 16 operational skills.

The architecture follows three horizons:

HorizonFocusContents
H1 — FoundationCore infrastructureARO, VNet zero-trust, Key Vault, ACR, PostgreSQL, Redis, Defender for Cloud — 6 templates
H2 — EnhancementPlatform servicesOpenShift GitOps (Argo CD), RHDH IDP, Prometheus + Grafana, Tekton, Service Mesh, Red Hat Trusted Application Pipeline — 9 templates
H3 — InnovationAI capabilitiesAzure AI Foundry, RAG applications, multi-agent systems, MLOps pipelines, GitHub Copilot extensions — 7 templates

Every H3 template inherits H1 and H2 primitives. A foundry-agent is structurally a microservice plus a model binding plus an evaluation pipeline — not a separate architecture.

The 17 Copilot Chat agents cover the full engineering lifecycle: @architect, @terraform, @devops, @platform, @deploy, @sre, @security, @reviewer, @test, @docs, @onboarding, @rhdh-expert, @github-integration, @ado-integration, @template-engineer, @context-architect, and @hybrid-scenarios.

Deployment supports three paths: agent-guided via @deploy in VS Code (75–105 min for dev), automated via deploy-full.sh (100–130 min for staging), and manual Terraform for production environments (130–175 min).

Maturity model and measurement

The CNCF Platform Engineering Maturity Model provides a five-dimension, five-level framework across Investment, Adoption, Interfaces, Operations, and Measurement. The target state — AI-Native (Level 5) — is characterized by dual-mandate budgets, agents adopting the same Golden Paths as humans, agent-operated infrastructure with human review gates, and measurement that covers DORA metrics, AI ROI, and agent health simultaneously.

Most enterprises entering this work are at Level 1 (Provisional) or Level 2 (Operational). Three Horizons is designed to accelerate through Levels 1–3 so that Level 4 and Level 5 work can begin with a solid substrate.

The 90–180 day sequence

The sequencing that turns 9–18 months into 90–180 days follows the horizon structure:

Days 0–90 (H1 — Foundation): ARO cluster provisioned with Terraform, Key Vault, ACR, VNet, and Workload Identity live. RHDH deployed with H1 Golden Paths available. OpenShift GitOps with environment-specific sync policies. Prometheus + Grafana platform dashboard live. Three teams onboarded with DORA metrics tracking. Output: time-to-first-PR under one day.

Months 3–6 (H2 — Enhancement): Full platform services layer operational. OpenShift Pipelines (Tekton), Red Hat Advanced Cluster Security, Red Hat Trusted Application Pipeline, service mesh, and the complete set of 22 Golden Paths available org-wide.

Months 6–12 (H3 — Innovation): AI capabilities at scale. RAG applications, multi-agent systems, MLOps pipelines, and GitHub Copilot extensions consuming H1 and H2 primitives.

The formula is direct: Platform Engineering + Three Horizons = Agentic DevOps Platform. The question is no longer whether to build the foundation. It is how fast. For enterprises willing to commit, the answer is 90 to 180 days.

Start with H1. Commit to the platform before the agents.

A fundação é decisiva em 2026

Três fatos são simultaneamente verdadeiros em 2026, e o padrão que os conecta não é coincidência — é causalidade.

Primeiro, a adoção de IA é universal. Dados da Gartner e da McKinsey mostram que 40% dos aplicativos corporativos incluirão agentes de IA especializados até 2026, contra menos de 5% em 2024, e 78% das organizações já utilizam IA em pelo menos uma função. Segundo, a maioria dos projetos de IA falha em produção: 95% dos projetos piloto de GenAI não entregam valor mensurável (MIT NANDA 2025), e a Gartner projeta que 40% dos projetos de IA agêntica serão cancelados até 2027 por excesso de custos, valor pouco claro e controles de risco frágeis. Terceiro, as organizações que estão obtendo sucesso têm uma característica em comum: investiram em Platform Engineering antes de investir em escala em IA.

O relatório DORA 2025 — com pesquisa de 39.000 profissionais — torna o mecanismo explícito. As Quatro Métricas-Chave funcionam agora como filtro pelo qual os efeitos da IA são observados. Organizações com Internal Developer Platforms maduras que adicionaram IA registraram +98% de throughput de PRs. Organizações sem maturidade de plataforma que adicionaram as mesmas ferramentas de IA registraram +242,7% de incidentes por pull request e +441% de aumento nos ciclos de revisão de código. A mesma ferramenta. Resultados opostos.

Chris Aniszczyk, CTO da CNCF, expressou com precisão no KubeCon Europe 2026: “Agentes amplificam o que é bom ou ruim no seu ecossistema. A questão não é se você adota agentes. A questão é se sua fundação aguenta o peso deles.”

A pirâmide de cinco camadas

A empresa AI-native é construída em cinco camadas com ordem de dependência estrita. Não é possível comprimir a camada N+1 mais rápido do que a camada N permite.

  • L1 — Platform Engineering: O substrato de self-service, governado por políticas e observável, que abstrai a complexidade da infraestrutura em primitivos utilizáveis pelos desenvolvedores. Saídas: Golden Paths, Guardrails, Safety Nets, fluxos de revisão manual.
  • L2 — Camada de Contexto: Conhecimento corporativo codificado em formato consumível por máquinas — catálogos de serviços, TechDocs, vector stores, pipelines de embedding, rastreamento de linhagem.
  • L3 — Camada Cognitiva: Modelos fundacionais (GPT-4o, Claude, Llama, Mistral), modelos ajustados, serviços de embedding e pipelines de avaliação, mediados por um gateway de modelos provisionado pela plataforma.
  • L4 — Camada de Intenção: Objetivos codificados contra os quais os agentes podem planejar — Spec-Driven Development, requisitos em notação EARS, princípios de Constitutional AI, contratos de escopo de permissão dos agentes.
  • L5 — Camada Agêntica: Agentes autônomos orientados a objetivos que combinam intenção, contexto e cognição para agir. É a camada mais visível nos investimentos em IA em 2026 e a mais suscetível a falhas quando as camadas abaixo estão ausentes.

Uma organização que pula para a camada agêntica sem as camadas de plataforma, contexto e intenção não produz agentes. Produz uma bagunça amplificada.

Os Quatro Pilares da CNCF como plano de controle para IA

Os Quatro Pilares da CNCF — Golden Paths, Guardrails, Safety Nets e Manual Review — foram originalmente projetados para entregas conduzidas por humanos. Em 2026, são reexpressos como plano de controle para agentes autônomos.

Golden Paths eram templates de serviços e scaffolds para desenvolvedores. Para agentes, tornam-se a superfície de execução sancionada: se não é um Golden Path, o agente não o executa.

Guardrails preveniam erros de configuração humana. Para agentes, contêm escaladas autônomas: escopo de permissão, limites de acesso a dados, filtragem de saída. O campo de contenção do agente.

Safety Nets forneciam rollback e entrega progressiva para humanos. Para agentes, tornam-se rollback em nível de decisão, recuperação de prompt injection, circuit breakers de custo e congelamento orientado a SLO.

Manual Review era revisão de código em pull requests. Para agentes, transforma-se em gates de aprovação em ações irreversíveis. A responsabilidade permanece com humanos nominados por design.

O plano de controle não precisa ser inventado. Precisa ser reexpresso como sistema operacional para a população de agentes.

Modos de falha quando a fundação é fraca

Quando a camada de plataforma está ausente, cinco modos de falha específicos se manifestam — cada um com a mesma causa raiz estrutural: a IA opera mais rápido do que processos ad-hoc conseguem governar.

Tripla dívida: A IA acumula simultaneamente dívida técnica (código gerado sem disciplina de revisão), dívida cognitiva (conhecimento que existe apenas em prompts e threads de Slack) e dívida de intenção (objetivos implícitos onde agentes agem sem contratos). Três dívidas se compõem em paralelo; nenhuma resolve as outras.

Plataformas sombra: Quando a plataforma central é inutilizável, as equipes constroem a própria. O resultado são CI/CD específicos por equipe, cinco forks diferentes de servidores MCP, módulos Terraform conflitantes e stacks de observabilidade duplicadas. O custo agregado chega a 2–3× o orçamento de uma plataforma real — invisível em qualquer linha orçamentária individual até que o primeiro incidente exponha a conta total.

Apodrecimento de contexto: Catálogos de serviços, documentação e linhagem silenciosamente se tornam obsoletos. Sem métricas de atualidade e cobertura de ownership, agentes de IA raciocinam sobre contexto corrompido e produzem respostas plausíveis, mas erradas, em escala. O DataHub 2025 constatou que 88% dos líderes de dados priorizam contexto como investimento principal, mas 61% relatam que a qualidade dos dados bloqueia a entrega de IA na prática.

Regressão de segurança: O Relatório Global de Ameaças 2026 da CrowdStrike documenta que organizações que implantaram assistentes de codificação com IA antes de amadurecer sua postura de segurança de plataforma registraram +38% de aumento em vulnerabilidades exploráveis nos primeiros 12 meses. A regressão desaparece onde a plataforma aplica controles de supply-chain — imagens assinadas, varredura de segredos, linting de IaC — na admissão, não após o deploy.

O problema 100:1: A Gartner projeta que a proporção agente-para-humano chegará a 100:1 até 2028. Supervisão manual nessa proporção não é viável. A plataforma deve governar o ciclo de vida do agente, identidade e auditoria em velocidade de plataforma, não em velocidade humana.

O Duplo Mandato de 2026

As equipes de plataforma em 2026 carregam duas responsabilidades simultâneas.

Mandato A — Aumentar a plataforma com IA: Usar IA para tornar a própria plataforma mais rápida. Agentes que triagem alertas, rascunham correções de runbook, propõem mudanças no Terraform, roteiam incidentes. Agentes em IDE que geram invocações de Golden Path, explicam erros de plataforma, produzem boilerplate. O objetivo é aumentar a velocidade interna da equipe de plataforma. O Three Horizons entrega 17 agentes do GitHub Copilot Chat pré-configurados para esse mandato.

Mandato B — Habilitar cargas de trabalho de IA em escala: Expor inferência, armazenamento vetorial, runtime de agentes, avaliação e observabilidade como primitivos de plataforma de primeira classe consumidos por meio de Golden Paths. O objetivo é aumentar a velocidade externa das equipes de aplicação. Uma plataforma que executa apenas o Mandato A produz uma equipe de plataforma mais rápida, mas deixa as equipes de aplicação sem suporte. Uma plataforma que executa apenas o Mandato B torna-se o gargalo. Plataformas maduras executam os dois.

Three Horizons — o acelerador

O Three Horizons é um repositório de template GitHub conjunto Microsoft + Red Hat que materializa uma Plataforma Agentic DevOps de nível produtivo no Azure Red Hat OpenShift. Não é uma prova de conceito; é um ponto de partida opinativo com suporte de fornecedor.

Pelos números: 120+ arquivos, 16 módulos Terraform, 22 templates de Golden Path, 17 agentes Copilot, 30+ regras de alerta, 13 configurações de servidor MCP, 20.000+ linhas de código, 16 habilidades operacionais.

A arquitetura segue três horizontes:

HorizonteFocoConteúdo
H1 — FundaçãoInfraestrutura centralARO, VNet zero-trust, Key Vault, ACR, PostgreSQL, Redis, Defender for Cloud — 6 templates
H2 — AprimoramentoServiços de plataformaOpenShift GitOps (Argo CD), RHDH IDP, Prometheus + Grafana, Tekton, Service Mesh, Red Hat Trusted Application Pipeline — 9 templates
H3 — InovaçãoCapacidades de IAAzure AI Foundry, aplicações RAG, sistemas multi-agente, pipelines MLOps, extensões do GitHub Copilot — 7 templates

Todo template H3 herda os primitivos de H1 e H2. Um foundry-agent é estruturalmente um microsserviço mais um binding de modelo mais um pipeline de avaliação — não uma arquitetura separada.

Os 17 agentes Copilot Chat cobrem o ciclo de vida completo da engenharia: @architect, @terraform, @devops, @platform, @deploy, @sre, @security, @reviewer, @test, @docs, @onboarding, @rhdh-expert, @github-integration, @ado-integration, @template-engineer, @context-architect e @hybrid-scenarios.

O deploy suporta três caminhos: guiado por agente via @deploy no VS Code (75–105 min para dev), automatizado via deploy-full.sh (100–130 min para staging) e Terraform manual para ambientes de produção (130–175 min).

Modelo de maturidade e medição

O CNCF Platform Engineering Maturity Model fornece um framework de cinco dimensões e cinco níveis cobrindo Investimento, Adoção, Interfaces, Operações e Medição. O estado alvo — AI-Native (Nível 5) — é caracterizado por orçamentos de duplo mandato, agentes adotando os mesmos Golden Paths que humanos, infraestrutura operada por agentes com gates de revisão humana, e medição que cobre métricas DORA, ROI de IA e saúde dos agentes simultaneamente.

A maioria das empresas que inicia esse trabalho está no Nível 1 (Provisório) ou Nível 2 (Operacional). O Three Horizons é projetado para acelerar pelos Níveis 1–3 para que o trabalho dos Níveis 4 e 5 possa começar com um substrato sólido.

A sequência de 90–180 dias

O sequenciamento que transforma 9–18 meses em 90–180 dias segue a estrutura de horizontes:

Dias 0–90 (H1 — Fundação): Cluster ARO provisionado com Terraform, Key Vault, ACR, VNet e Workload Identity ativos. RHDH implantado com Golden Paths H1 disponíveis. OpenShift GitOps com políticas de sincronização específicas por ambiente. Dashboard de plataforma Prometheus + Grafana ativo. Três equipes integradas com rastreamento de métricas DORA. Resultado: tempo até o primeiro PR abaixo de um dia.

Meses 3–6 (H2 — Aprimoramento): Camada completa de serviços de plataforma operacional. OpenShift Pipelines (Tekton), Red Hat Advanced Cluster Security, Red Hat Trusted Application Pipeline, service mesh e o conjunto completo de 22 Golden Paths disponíveis em toda a organização.

Meses 6–12 (H3 — Inovação): Capacidades de IA em escala. Aplicações RAG, sistemas multi-agente, pipelines MLOps e extensões do GitHub Copilot consumindo primitivos de H1 e H2.

A fórmula é direta: Platform Engineering + Three Horizons = Plataforma Agentic DevOps. A questão não é mais se deve construir a fundação. É quão rápido. Para empresas dispostas a se comprometer, a resposta é 90 a 180 dias.

Comece pelo H1. Comprometa-se com a plataforma antes dos agentes.

La fundación es decisiva en 2026

Tres hechos son simultáneamente ciertos en 2026, y el patrón que los conecta no es coincidencia — es causalidad.

Primero, la adopción de IA es universal. Datos de Gartner y McKinsey muestran que el 40% de las aplicaciones empresariales incluirán agentes de IA especializados para 2026, frente a menos del 5% en 2024, y el 78% de las organizaciones ya usa IA en al menos una función. Segundo, la mayoría de los proyectos de IA fracasan en producción: el 95% de los pilotos de GenAI no entrega valor medible (MIT NANDA 2025), y Gartner proyecta que el 40% de los proyectos de IA agéntica serán cancelados antes de 2027 por sobrecostos, valor poco claro y controles de riesgo deficientes. Tercero, las organizaciones que están teniendo éxito comparten una característica común: invirtieron en Platform Engineering antes de invertir a escala en IA.

El informe DORA 2025 — que encuestó a 39.000 profesionales — hace explícito el mecanismo. Las Cuatro Métricas Clave actúan ahora como filtro a través del cual se observan los efectos de la IA. Las organizaciones con Internal Developer Platforms maduras que agregaron IA registraron +98% de throughput de PRs. Las organizaciones sin madurez de plataforma que agregaron las mismas herramientas de IA registraron +242,7% más incidentes por pull request y +441% de alargamiento en los ciclos de revisión de código. La misma herramienta. Resultados opuestos.

Chris Aniszczyk, CTO de la CNCF, lo expresó con precisión en KubeCon Europe 2026: “Los agentes amplif­ican lo que es bueno o malo en tu ecosistema. La pregunta no es si adoptas agentes. La pregunta es si tu fundación puede sostener su peso.”

La pirámide de cinco capas

La empresa AI-native se construye en cinco capas con un orden de dependencia estricto. No es posible comprimir la capa N+1 más rápido de lo que la capa N lo permite.

  • L1 — Platform Engineering: El sustrato de self-service, gobernado por políticas y observable, que abstrae la complejidad de la infraestructura en primitivos utilizables por los desarrolladores. Salidas: Golden Paths, Guardrails, Safety Nets, flujos de revisión manual.
  • L2 — Capa de Contexto: Conocimiento corporativo codificado en formato consumible por máquinas — catálogos de servicios, TechDocs, vector stores, pipelines de embedding, rastreo de linaje.
  • L3 — Capa Cognitiva: Modelos fundacionales (GPT-4o, Claude, Llama, Mistral), modelos ajustados, servicios de embedding y pipelines de evaluación, mediados a través de un gateway de modelos aprovisionado por la plataforma.
  • L4 — Capa de Intención: Objetivos codificados contra los que los agentes pueden planificar — Spec-Driven Development, requisitos en notación EARS, principios de Constitutional AI, contratos de alcance de permisos de agentes.
  • L5 — Capa Agéntica: Agentes autónomos orientados a objetivos que combinan intención, contexto y cognición para actuar. Es la capa más visible para la mayoría de las inversiones en IA en 2026 y la más propensa a fallar cuando las capas inferiores están ausentes.

Una organización que salta a la capa agéntica sin las capas de plataforma, contexto e intención no produce agentes. Produce un caos amplificado.

Los Cuatro Pilares de la CNCF como plano de control para la IA

Los Cuatro Pilares de la CNCF — Golden Paths, Guardrails, Safety Nets y Manual Review — fueron diseñados originalmente para entregas conducidas por humanos. En 2026, se reexpresan como plano de control para agentes autónomos.

Golden Paths eran plantillas de servicios y scaffolds para desarrolladores. Para los agentes, se convierten en la superficie de ejecución sancionada: si no es un Golden Path, el agente no lo ejecuta.

Guardrails prevenían errores de configuración humana. Para los agentes, contienen escaladas autónomas: alcance de permisos, límites de acceso a datos, filtrado de salidas. El campo de contención del agente.

Safety Nets proporcionaban rollback y entrega progresiva para humanos. Para los agentes, se convierten en rollback a nivel de decisión, recuperación de prompt injection, circuit breakers de costo y congelamiento orientado a SLO.

Manual Review era la revisión de código en pull requests. Para los agentes, se transforma en gates de aprobación en acciones irreversibles. La responsabilidad permanece con personas nominadas por diseño.

El plano de control no necesita ser inventado. Necesita ser reexpresado como el sistema operativo para la población de agentes.

Modos de fallo cuando la fundación es débil

Cuando la capa de plataforma está ausente, cinco modos de fallo específicos se manifiestan — cada uno con la misma causa raíz estructural: la IA opera más rápido de lo que los procesos ad-hoc pueden gobernar.

Triple deuda: La IA acumula simultáneamente deuda técnica (código generado sin disciplina de revisión), deuda cognitiva (conocimiento que existe solo en prompts y hilos de Slack) y deuda de intención (objetivos implícitos donde los agentes actúan sin contratos). Tres deudas se acumulan en paralelo; ninguna resuelve las otras.

Plataformas paralelas: Cuando la plataforma central no es utilizable, los equipos construyen la propia. El resultado son CI/CD específicos por equipo, cinco forks diferentes de servidores MCP, módulos Terraform conflictivos y stacks de observabilidad duplicadas. El costo agregado alcanza 2–3× el presupuesto de una plataforma real — invisible en cualquier línea presupuestaria individual hasta que el primer incidente expone la factura completa.

Putrefacción de contexto: Los catálogos de servicios, la documentación y el linaje silenciosamente se vuelven obsoletos. Sin métricas de frescura y cobertura de propiedad, los agentes de IA razonan sobre contexto corrompido y producen respuestas plausibles pero incorrectas a escala. DataHub 2025 encontró que el 88% de los líderes de datos priorizan el contexto como inversión principal, pero el 61% reporta que la calidad de datos bloquea la entrega de IA en la práctica.

Regresión de seguridad: El Informe Global de Amenazas 2026 de CrowdStrike documenta que las organizaciones que desplegaron asistentes de codificación con IA antes de madurar su postura de seguridad de plataforma experimentaron un +38% de aumento en vulnerabilidades explotables en los primeros 12 meses. La regresión desaparece donde la plataforma aplica controles de cadena de suministro — imágenes firmadas, escaneo de secretos, linting de IaC — en la admisión, no después del despliegue.

El problema 100:1: Gartner proyecta que la proporción agente-a-humano llegará a 100:1 para 2028. La supervisión manual a esa proporción no es viable. La plataforma debe gobernar el ciclo de vida del agente, la identidad y la auditoría a velocidad de plataforma, no a velocidad humana.

El Doble Mandato de 2026

Los equipos de plataforma en 2026 tienen dos responsabilidades simultáneas.

Mandato A — Aumentar la plataforma con IA: Usar IA para hacer la propia plataforma más rápida. Agentes que clasifican alertas, redactan correcciones de runbooks, proponen cambios en Terraform, enrutan incidentes. Agentes en IDE que generan invocaciones de Golden Path, explican errores de plataforma, producen boilerplate. El objetivo es aumentar la velocidad interna del equipo de plataforma. Three Horizons entrega 17 agentes de GitHub Copilot Chat preconfigurados para este mandato.

Mandato B — Habilitar cargas de trabajo de IA a escala: Exponer inferencia, almacenamiento vectorial, runtime de agentes, evaluación y observabilidad como primitivos de plataforma de primera clase consumidos a través de Golden Paths. El objetivo es aumentar la velocidad externa de los equipos de aplicación. Una plataforma que ejecuta solo el Mandato A produce un equipo de plataforma más rápido pero deja a los equipos de aplicación sin soporte. Una plataforma que ejecuta solo el Mandato B se convierte en el cuello de botella. Las plataformas maduras ejecutan ambos.

Three Horizons — el acelerador

Three Horizons es un repositorio de plantillas GitHub conjunto de Microsoft + Red Hat que materializa una Plataforma Agentic DevOps de nivel productivo sobre Azure Red Hat OpenShift. No es una prueba de concepto; es un punto de partida opinado con soporte de proveedores.

En números: 120+ archivos, 16 módulos Terraform, 22 plantillas Golden Path, 17 agentes Copilot, 30+ reglas de alertas, 13 configuraciones de servidor MCP, 20.000+ líneas de código, 16 habilidades operacionales.

La arquitectura sigue tres horizontes:

HorizonteEnfoqueContenido
H1 — FundaciónInfraestructura centralARO, VNet zero-trust, Key Vault, ACR, PostgreSQL, Redis, Defender for Cloud — 6 plantillas
H2 — MejoraServicios de plataformaOpenShift GitOps (Argo CD), RHDH IDP, Prometheus + Grafana, Tekton, Service Mesh, Red Hat Trusted Application Pipeline — 9 plantillas
H3 — InnovaciónCapacidades de IAAzure AI Foundry, aplicaciones RAG, sistemas multi-agente, pipelines MLOps, extensiones de GitHub Copilot — 7 plantillas

Cada plantilla H3 hereda los primitivos de H1 y H2. Un foundry-agent es estructuralmente un microservicio más un binding de modelo más un pipeline de evaluación — no una arquitectura separada.

Los 17 agentes Copilot Chat cubren el ciclo de vida completo de ingeniería: @architect, @terraform, @devops, @platform, @deploy, @sre, @security, @reviewer, @test, @docs, @onboarding, @rhdh-expert, @github-integration, @ado-integration, @template-engineer, @context-architect y @hybrid-scenarios.

El despliegue soporta tres rutas: guiado por agente via @deploy en VS Code (75–105 min para dev), automatizado via deploy-full.sh (100–130 min para staging) y Terraform manual para entornos de producción (130–175 min).

Modelo de madurez y medición

El CNCF Platform Engineering Maturity Model proporciona un framework de cinco dimensiones y cinco niveles que cubre Inversión, Adopción, Interfaces, Operaciones y Medición. El estado objetivo — AI-Native (Nivel 5) — se caracteriza por presupuestos de doble mandato, agentes adoptando los mismos Golden Paths que los humanos, infraestructura operada por agentes con gates de revisión humana, y medición que cubre métricas DORA, ROI de IA y salud de los agentes simultáneamente.

La mayoría de las empresas que inician este trabajo están en el Nivel 1 (Provisional) o Nivel 2 (Operacional). Three Horizons está diseñado para acelerar a través de los Niveles 1–3 para que el trabajo de los Niveles 4 y 5 pueda comenzar con un sustrato sólido.

La secuencia de 90–180 días

El secuenciamiento que transforma 9–18 meses en 90–180 días sigue la estructura de horizontes:

Días 0–90 (H1 — Fundación): Clúster ARO aprovisionado con Terraform, Key Vault, ACR, VNet y Workload Identity activos. RHDH desplegado con Golden Paths H1 disponibles. OpenShift GitOps con políticas de sincronización específicas por entorno. Dashboard de plataforma Prometheus + Grafana activo. Tres equipos integrados con seguimiento de métricas DORA. Resultado: tiempo hasta el primer PR inferior a un día.

Meses 3–6 (H2 — Mejora): Capa completa de servicios de plataforma operativa. OpenShift Pipelines (Tekton), Red Hat Advanced Cluster Security, Red Hat Trusted Application Pipeline, service mesh y el conjunto completo de 22 Golden Paths disponibles en toda la organización.

Meses 6–12 (H3 — Innovación): Capacidades de IA a escala. Aplicaciones RAG, sistemas multi-agente, pipelines MLOps y extensiones de GitHub Copilot consumiendo primitivos de H1 y H2.

La fórmula es directa: Platform Engineering + Three Horizons = Plataforma Agentic DevOps. La pregunta ya no es si se debe construir la fundación. Es qué tan rápido. Para las empresas dispuestas a comprometerse, la respuesta es 90 a 180 días.

Empieza con H1. Comprométete con la plataforma antes que con los agentes.

← Knowledge Hub

Paula Silva | Software Global Black Belt

Start with the platform, not the agents. Comece pela plataforma, não pelos agentes. Comience por la plataforma, no por los agentes.

Building the future of software development with AI and Agentic DevOps.

Knowledge Hub · v3.4.0 · 2026-06-17
paulasilva · 2026-06-17 EN · PT-BR · ES