Plan de ejecución a 90 días para una organización de ingeniería (Parte 3/3)
Plan de ejecución a 90 días para una organización de ingeniería
Este es el último de tres posts basados en un trabajo de consultoría que hice para una fintech de pagos en LATAM. Los nombres, datos y detalles fueron modificados. En el primer post hice el diagnóstico organizacional. En el segundo, la estrategia de métricas. Aquí va el plan para poner todo en marcha.
Un diagnóstico sin ejecución es solo un documento bonito. El plan de 90 días es donde las decisiones se convierten en acciones concretas.
Rituales de squad
Los rituales no son reuniones por cumplir — son los puntos de contacto mínimos para que el equipo se mantenga alineado sin perder tiempo.
Antes del sprint
- Refinement (45min) — describir tickets, aclarar scope, estimar
- Sprint Planning (1h) — decidir qué entra al sprint
Semanal
- Sync lunes, miércoles y viernes (15min) — tres veces por semana, no cinco. Los días sin sync son para que los desarrolladores tengan bloques largos de concentración. Un daily de 15 minutos parece poco, pero cinco al hilo fragmentan la semana más de lo que parece.
Bi-semanal
- 1:1 con cada ingeniero (30min)
Fin de sprint
- Retro por squad (30min)
- Retro de ingeniería general (30min) — esta reunión, en mi experiencia, es donde realmente se alinea el equipo. Se comparten problemas, soluciones y contexto entre squads. Genera más colaboración que cualquier documento.
- Demo para interesados del negocio (30min)
Planning basado en métricas
Estimación
La escala sigue la secuencia de Fibonacci (1, 2, 3, 5, 8) — los saltos entre números reflejan que mientras más grande es algo, más incertidumbre tiene.
| Puntos | Significa | Ejemplo |
|---|---|---|
| 1 | Trivial, < 2 horas | Fix typo, cambio de config |
| 2 | Simple, medio día | Bug claro, ajuste menor |
| 3 | Moderado, 1-2 días | Feature pequeña, refactor acotado |
| 5 | Complejo, 3-4 días | Feature completa, integración |
| 8 | Muy complejo, 1 semana | Sistema nuevo, mucha incertidumbre |
| > 8 | Se divide | Demasiado grande |
La votación en refinement importa — el contexto de quien ya trabajó en algo y la experiencia de los seniors tiene peso. Si hay diferencia mayor a 3 puntos entre votos, se discute. Ahí es donde salen las dependencias y riesgos que nadie vio.
Capacidad
- Velocity histórica (promedio últimos 3 sprints) como tope
- Commitment al 80% de la capacidad
- Buffer de 20% para interrupciones
- WIP limit: máximo 2 tickets por persona
Composición target del sprint
- Mínimo 50% features
- Máximo 25% bugs
- Máximo 15% interrupciones
Estos números son una guía, no una regla rígida. Se ajustan según el contexto del squad y el momento.
Sistema de priorización
Para el backlog (en refinement)
Score = (Revenue Impact × Confidence) / Effort
- Revenue Impact (1-5) = qué tanto afecta ingresos
- Confidence (1-5) = qué tan claro está el scope
- Effort (1-5) = esfuerzo estimado
| Ticket | Revenue Impact | Confidence | Effort | Score | Prioridad |
|---|---|---|---|---|---|
| Fix crash en Payout Service | 4 | 5 | 2 | 10 | P1 |
| Migrar endpoint | 2 | 5 | 3 | 3.3 | P2 |
| Feature de reportes | 3 | 3 | 5 | 1.8 | P3 |
Para el sprint
- P0: Incidentes de producción → interrumpe sprint, se atiende ya
- P1: Revenue directo → entra al próximo sprint
- P2: Mejoras → backlog priorizado
- P3: Nice to have → backlog
Para lo que llega fuera de planning
- P0: Producción caída → interrumpe sprint
- P1: Cliente bloqueado → mismo día
- P2: Todo lo demás → va al backlog, se prioriza en el próximo planning
P0 y P1 entran en el 20% de buffer que se reserva en el sprint para interrupciones.
Fixes de proceso
Entrada de trabajo
- Todo request entra por un canal único
- El EM hace triage el mismo día
- Si es urgente (P0/P1): entra al sprint actual
- Si no es urgente: va al backlog para el próximo planning
Scoping
- Tickets sin criterios de aceptación no entran a sprint
- Ticket mayor a 8 puntos se divide
- Dependencias identificadas antes de planning
Escalaciones
- Ingeniero → Senior/EM: cuando está bloqueado o necesita una decisión técnica
- Senior/EM → CTO: cuando hay riesgo de negocio (cliente afectado, revenue en peligro)
Gestión de outages
- Postmortem sin culpa dentro de 48 horas
- Template: qué pasó, timeline, impacto, causa raíz, acciones a tomar
- Compartir aprendizajes en la retro de ingeniería
- Seguimiento de las acciones hasta que se cierren
Releases
- Diagnosticar arquitectura y deuda técnica de los proyectos
- Mejorar la forma de probar los releases — QA por los mismos desarrolladores del flujo completo
- Validar salidas a producción durante 15-30 minutos
- Crear alertas de comportamiento y errores en los servicios
Reporting
Semanal al CTO
- Status: On Track / At Risk / Blocked
- Métricas vs targets
- Decisiones que necesitan input
- Pronóstico de las próximas 2 semanas
Fin de sprint a interesados del negocio
- Qué se completó
- Qué se movió y por qué
- Próximo sprint
Mensual
- Review de OKRs
- Planificación de capacidad del siguiente mes
- Ajustes basados en aprendizajes
Targets de mejora con DORA Metrics
Para saber si estás mejorando necesitas targets claros. DORA Metrics es un framework del equipo de DevOps Research and Assessment de Google que clasifica el rendimiento de los equipos de ingeniería en cuatro niveles.
Benchmark DORA
| Métrica | Elite | High | Medium | Low |
|---|---|---|---|---|
| CFR | <5% | 5-10% | 10-15% | >15% |
| MTTR | <1h | <1 día | 1d-1 semana | >1 semana |
| Deploy Frequency | Múltiples/día | Diario-semanal | Semanal-mensual | Mensual+ |
| Lead Time | <1h | 1d-1 semana | 1 semana-1 mes | 1-6 meses |
Targets para esta organización
| Métrica | Actual | Target 30d | Target 90d | Objetivo |
|---|---|---|---|---|
| CFR Payout Service | 23% (Low) | 15% | <10% | Low → Medium → High |
| CFR Split Engine | 9% (High) | 8% | <5% | High → Elite |
| Flow Eff. Payouts | 13% | 20% | >30% | Reducir tiempo de espera |
| Flow Eff. Payments Core | 27% | 30% | >35% | Más tiempo productivo |
| Cycle Time P75 Payouts | 19.7d | 14d | <10d | Que quepa en un sprint |
| Cycle Time P75 Payments Core | 10.2d | 9d | <8d | Margen en sprint |
| Sprint Completion | ~60% | 70% | >80% | Predictibilidad |
| % Interrupciones | ~30% | 20% | <15% | Proteger roadmap |
Salud del equipo y cultura
Las métricas miden el sistema. Pero detrás del sistema hay personas. Si no cuidas al equipo, ninguna métrica mejora.
Mes 1 — escuchar y diagnosticar
- 1:1 con cada ingeniero para conocerlos
- Identificar riesgo de burnout, especialmente en Payouts (2 personas con 57% de trabajo reactivo)
- Implementar “Maker Time” — bloques de 4 horas sin reuniones para que los desarrolladores puedan concentrarse
Mes 2-3 — actuar
- Tech talks opcionales para compartir conocimiento
- Compartir aprendizajes entre squads
- Evaluar si las mejoras están funcionando con datos concretos
- Proponer siguientes pasos basados en lo aprendido
Career ladder
Un equipo necesita saber hacia dónde puede crecer. Sin un career ladder claro, la retención se vuelve un problema.
Niveles
| Nivel | Scope Técnico | Scope Impacto | Scope Liderazgo |
|---|---|---|---|
| Junior (L1) | Tareas definidas, código guiado | Feature individual | Aprende de otros |
| Mid (L2) | Features completas, diseño con guía | Squad | Mentee activo, pide feedback |
| Senior (L3) | Sistemas end-to-end, define el approach | Multi-squad | Mentor, toma decisiones técnicas |
| Staff (L4) | Arquitectura organizacional, estrategia técnica | Empresa | Multiplicador, define el estándar de contratación |
Dimensiones de evaluación
- Technical Excellence — calidad del código, decisiones arquitectónicas, conocimiento del dominio
- Delivery — cumplimiento, predictibilidad, capacidad de destrabar
- Teamwork & Communication — colaboración, documentación, comunicación clara
- Business Acumen — entender el impacto de negocio de las decisiones técnicas
Implementación
- Evaluar a cada ingeniero para saber dónde está
- Definir roles claros por nivel
- Identificar qué le falta a cada persona para crecer
- Armar un plan de desarrollo individual, coordinado con People, Finanzas y el CTO para evaluar presupuesto, condiciones y tiempos
Este es un primer approach con contexto reducido. Al entrar en la organización y conocer de cerca a los equipos, los procesos y la cultura, puedes ajustar cada parte de este plan. Pero como punto de partida, ya te da una estructura para pasar del diagnóstico a la acción.
La clave no es seguir el plan al pie de la letra — es tener un sistema que te permita medir, ajustar y mejorar de forma continua.
Si quieres profundizar en las métricas que usé como referencia, revisa el framework DORA.