Checklist FinOps 2026: 14 acciones para reducir tu factura cloud 30%
Checklist FinOps probado en campo para equipos de ingeniería en AWS, GCP, Azure o Kubernetes. Acciones concretas, ordenadas por ROI.
- finops
- optimizacion-costos
- kubernetes
- aws
- gcp
La mayoría de las facturas cloud sangran dinero en lugares que nadie mira. Pods de Kubernetes ociosos, instancias EC2 sobredimensionadas, almacenamiento sin tags, entornos de dev corriendo 24/7 que nadie usa — cada equipo que onboardeamos encuentra entre 25 y 40% de desperdicio en la primera semana.
Este es el checklist que usamos internamente y le recomendamos a cada cliente. Está ordenado por ROI por hora de trabajo de ingeniería, no por lo bonito que suena en charlas de conferencia.
Quick wins (esta semana)
1. Tagueá todo y luego forzalo
Sin tags no podés hacer cost allocation, ni chargeback, ni siquiera saber quién es dueño de qué. Hacé que team, env y service sean obligatorios en cada recurso via SCP/Org Policy/Azure Policy. Los recursos sin tags deberían fallar al crearse — no generar un ticket que nadie va a leer.
2. Matá volúmenes y snapshots huérfanos
Volúmenes EBS desconectados y snapshots de más de 90 días de instancias ya terminadas son desperdicio puro. Un cliente encontró $18k/mes en snapshots EBS de runners de CI dados de baja hace dos años.
3. Apagá los entornos de dev por la noche
Si tu dev/staging corre 168 horas a la semana en lugar de ~50, estás pagando 3.4× más de lo necesario. AWS Instance Scheduler, GCP Recommender o una Lambda de 30 líneas lo arreglan.
4. Right-size del overprovisioning evidente
Buscá instancias bajo 10% de CPU sostenido por 14+ días. Bajá un tier. Sin magia, sin ML — solo CloudWatch + una planilla.
Mejoras estructurales (este trimestre)
5. Comprometete a Savings Plans / Committed Use Discounts
Si tu carga steady-state es predecible los próximos 12 meses, no comprar Savings Plans o CUDs es dejar entre 30 y 60% sobre la mesa. Empezá con un plan de 1 año, sin upfront, compute-flexible, que cubra ~60% del baseline. El resto va on-demand.
6. Llevá las cargas stateless a Spot / Preemptible
Batch jobs, runners de CI, workers async, training de ML — todos andan perfecto en Spot/Preemptible al 60–90% de descuento. Usá Karpenter en EKS o pools Spot en GKE Autopilot.
7. Configurá bien los requests de Kubernetes
La mayoría de los equipos sobre-piden CPU/memoria 3–5×, lo que destruye la eficiencia de bin-packing e infla el conteo de nodos. Corré Vertical Pod Autoscaler en modo recomendación por dos semanas y ajustá los requests a P95 + 20% de buffer.
8. Adoptá una estrategia de almacenamiento por tiers
S3 Standard para data caliente, S3 Standard-IA después de 30 días, Glacier después de 90 días, Deep Archive después de 1 año. Usá Intelligent-Tiering cuando los patrones de acceso son impredecibles. La misma lógica aplica a GCS y Azure Blob.
9. Auditá el tráfico de egress
Cross-AZ, cross-region y egress a internet son los killers silenciosos. Buscá servicios charlatanes en AZs distintas, picos de NAT Gateway, y replicación cross-region que activaste y olvidaste.
Gobernanza (este año)
10. Construí una métrica de costo unitario
Costo por cliente, por request, por GB procesado — elegí una. Sin métrica unitaria no podés saber si los costos crecieron porque desperdiciaste o porque el negocio creció.
11. Mostrale a cada ingeniero su propio costo
Un mensaje semanal de Slack con el spend cloud de cada equipo cambia el comportamiento más rápido que cualquier política. Bonus: mostrar costo por métrica unitaria al lado del $ crudo.
12. Pronosticá y presupuestá por equipo
Los proveedores cloud no te dan buen forecasting out-of-the-box. Construilo vos o usá una plataforma FinOps — pero no vueles a ciegas. Detección de anomalías solo te ayuda después de que ya pasó.
13. Hacé revisiones de costo mensuales
Misma cadencia que las revisiones de seguridad. 30 minutos por team lead, repasando:
- Top 10 movimientos de costo MoM
- Recursos nuevos que se ven raros
- % de cobertura de Reserved y % de waste
14. Elegí una plataforma, no cinco
La mayoría de los equipos terminan con 2–3 dashboards (nativo del cloud + un SaaS + uno casero) y no miran ninguno. Consolidá en una sola plataforma FinOps que cubra tus clouds, exponga la data cruda y se integre con tu alerting.
Dónde encaja Lumicost
Los pasos 1–4 son higiene y no necesitan herramienta. Los pasos 5–14 se benefician de automatización: forecasting, allocation, detección de anomalías, recomendaciones, chargeback. Eso es exactamente lo que hace Lumicost — sobre GCP, AWS, Azure y Kubernetes, con IAM Role solo lectura y setup en 5 minutos. Hay plan gratis para validar los hallazgos antes de comprometerte.
Elegí tres items de esta lista, mandalos este mes, medí el impacto. Después volvé por los siguientes tres.