Contexto
Una fintech con 40 equipos de ingeniería y crecimiento acelerado llegó a un punto de inflexión: cada deploy requería intervención manual del equipo de plataforma, el onboarding de un nuevo servicio tardaba entre dos y tres días y los equipos de producto pasaban más tiempo esperando que construyendo.
El equipo de plataforma tenía cuatro personas para dar soporte a más de 200 ingenieros. La arquitectura de microservicios era correcta en papel, pero el andamiaje operacional no había escalado con ella.
El reto
El problema no era técnico en el sentido clásico: la infraestructura funcionaba. El problema era de experiencia del desarrollador. Scaffolding manual, pipelines copiados de repositorio en repositorio, secretos gestionados con acceso directo a la consola de AWS y sin forma de conocer el estado real de un servicio en producción.
Decisión clave: no construir otra herramienta interna más. Adoptar Backstage como base y extenderlo con plugins propios para tener una IDP real, no un conjunto de scripts de bash bien organizados.
La solución
Diseñé la plataforma sobre tres pilares: Backstage como portal del desarrollador, ArgoCD como engine de GitOps y Terraform modules como la capa de infraestructura self-service. Los developers rellenan un formulario en Backstage y en 15 minutos tienen repositorio, pipeline CI/CD, namespace en el cluster y monitorización configurados.
# ArgoCD Application generada por el scaffolding de Backstage
apiVersion: argoproj.io/v1alpha1
kind: Application
metadata:
name: payments-service
namespace: argocd
spec:
source:
repoURL: https://github.com/org/gitops-config
path: services/payments
destination:
namespace: payments-prodResultado
A los seis meses, el 80% de los deploys no requerían intervención del equipo de plataforma. El onboarding de un servicio nuevo pasó de tres días a cuatro horas. El tiempo de deploy medio bajó de 110 minutos a 18 minutos. El equipo de plataforma dejó de gestionar tickets y empezó a trabajar en producto.
“La IDP que construyó nos permitió pasar de 3 a 12 deploys al día sin añadir un solo ingeniero de infraestructura. ROI medible desde el primer sprint.” — Laura Sanz, VP of Engineering