Checklist FinOps 2026: 14 acciones para reducir tu factura cloud 30%

Checklist FinOps probado en campo para equipos de ingeniería en AWS, GCP, Azure o Kubernetes. Acciones concretas, ordenadas por ROI.

Por Equipo de Ingeniería Lumicost15 de enero de 20264 min de lectura

finops
optimizacion-costos
kubernetes
aws
gcp

La mayoría de las facturas cloud sangran dinero en lugares que nadie mira. Pods de Kubernetes ociosos, instancias EC2 sobredimensionadas, almacenamiento sin tags, entornos de dev corriendo 24/7 que nadie usa — cada equipo que onboardeamos encuentra entre 25 y 40% de desperdicio en la primera semana.

Este es el checklist que usamos internamente y le recomendamos a cada cliente. Está ordenado por ROI por hora de trabajo de ingeniería, no por lo bonito que suena en charlas de conferencia.

Quick wins (esta semana)

1. Tagueá todo y luego forzalo

Sin tags no podés hacer cost allocation, ni chargeback, ni siquiera saber quién es dueño de qué. Hacé que team, env y service sean obligatorios en cada recurso via SCP/Org Policy/Azure Policy. Los recursos sin tags deberían fallar al crearse — no generar un ticket que nadie va a leer.

2. Matá volúmenes y snapshots huérfanos

Volúmenes EBS desconectados y snapshots de más de 90 días de instancias ya terminadas son desperdicio puro. Un cliente encontró $18k/mes en snapshots EBS de runners de CI dados de baja hace dos años.

3. Apagá los entornos de dev por la noche

Si tu dev/staging corre 168 horas a la semana en lugar de ~50, estás pagando 3.4× más de lo necesario. AWS Instance Scheduler, GCP Recommender o una Lambda de 30 líneas lo arreglan.

4. Right-size del overprovisioning evidente

Buscá instancias bajo 10% de CPU sostenido por 14+ días. Bajá un tier. Sin magia, sin ML — solo CloudWatch + una planilla.

Mejoras estructurales (este trimestre)

5. Comprometete a Savings Plans / Committed Use Discounts

Si tu carga steady-state es predecible los próximos 12 meses, no comprar Savings Plans o CUDs es dejar entre 30 y 60% sobre la mesa. Empezá con un plan de 1 año, sin upfront, compute-flexible, que cubra ~60% del baseline. El resto va on-demand.

6. Llevá las cargas stateless a Spot / Preemptible

Batch jobs, runners de CI, workers async, training de ML — todos andan perfecto en Spot/Preemptible al 60–90% de descuento. Usá Karpenter en EKS o pools Spot en GKE Autopilot.

7. Configurá bien los `requests` de Kubernetes

La mayoría de los equipos sobre-piden CPU/memoria 3–5×, lo que destruye la eficiencia de bin-packing e infla el conteo de nodos. Corré Vertical Pod Autoscaler en modo recomendación por dos semanas y ajustá los requests a P95 + 20% de buffer.

8. Adoptá una estrategia de almacenamiento por tiers

S3 Standard para data caliente, S3 Standard-IA después de 30 días, Glacier después de 90 días, Deep Archive después de 1 año. Usá Intelligent-Tiering cuando los patrones de acceso son impredecibles. La misma lógica aplica a GCS y Azure Blob.

9. Auditá el tráfico de egress

Cross-AZ, cross-region y egress a internet son los killers silenciosos. Buscá servicios charlatanes en AZs distintas, picos de NAT Gateway, y replicación cross-region que activaste y olvidaste.

Gobernanza (este año)

10. Construí una métrica de costo unitario

Costo por cliente, por request, por GB procesado — elegí una. Sin métrica unitaria no podés saber si los costos crecieron porque desperdiciaste o porque el negocio creció.

11. Mostrale a cada ingeniero su propio costo

Un mensaje semanal de Slack con el spend cloud de cada equipo cambia el comportamiento más rápido que cualquier política. Bonus: mostrar costo por métrica unitaria al lado del $ crudo.

12. Pronosticá y presupuestá por equipo

Los proveedores cloud no te dan buen forecasting out-of-the-box. Construilo vos o usá una plataforma FinOps — pero no vueles a ciegas. Detección de anomalías solo te ayuda después de que ya pasó.

13. Hacé revisiones de costo mensuales

Misma cadencia que las revisiones de seguridad. 30 minutos por team lead, repasando:

Top 10 movimientos de costo MoM
Recursos nuevos que se ven raros
% de cobertura de Reserved y % de waste

14. Elegí una plataforma, no cinco

La mayoría de los equipos terminan con 2–3 dashboards (nativo del cloud + un SaaS + uno casero) y no miran ninguno. Consolidá en una sola plataforma FinOps que cubra tus clouds, exponga la data cruda y se integre con tu alerting.

Dónde encaja Lumicost

Los pasos 1–4 son higiene y no necesitan herramienta. Los pasos 5–14 se benefician de automatización: forecasting, allocation, detección de anomalías, recomendaciones, chargeback. Eso es exactamente lo que hace Lumicost — sobre GCP, AWS, Azure y Kubernetes, con IAM Role solo lectura y setup en 5 minutos. Hay plan gratis para validar los hallazgos antes de comprometerte.

Elegí tres items de esta lista, mandalos este mes, medí el impacto. Después volvé por los siguientes tres.