Blog/01
FinOps

Dlaczego rachunek za infrastrukturę chmurową rośnie, choć nic się nie zmieniło?

5 min czytania

Reserved Instances, zombie resources i 5 innych pułapek kosztowych, które pochłaniają budżety polskich firm - i jak je wykryć, zanim przepłacisz kolejny miesiąc.

Ruch na aplikacji stabilny, liczba klientów bez zmian - a rachunek za AWS poszedł w górę o 35%. Jak to możliwe? To jeden z najczęstszych scenariuszy, z którymi trafiają do nas klienci. I prawie zawsze ma to samo wyjaśnienie: chmura kosztuje nie wtedy, gdy ją używasz, ale wtedy, gdy jej nie zarządzasz.

1. Zombie resources - zasoby, które żyją własnym życiem

Każda firma w chmurze ma "zombie": snapshoty EBS z 2019 roku, woluminy EBS odłączone od dawno usuniętych instancji, Elastic IP bez przypisanej maszyny, load balancery bez backendu. Każdy z nich kosztuje kilka dolarów miesięcznie - razem mogą stanowić 8–15% rachunku za infrastrukturę AWS.

AWS nie wyłącza zasobów za Ciebie. Jeśli ktoś postawił instancję EC2 "na chwilę na testy" i zapomniał ją usunąć, płacisz za nią non-stop. W jednym z naszych audytów znaleźliśmy środowisko dev/staging, które pochłaniało 40% budżetu całej infrastruktury - a używali go dwa razy w miesiącu.

Typowy udział zombie resources
8–15%

rachunku to zasoby nieużywane lub całkowicie zapomniane. Pierwsze, co sprawdzamy w Cloud Checku.

2. On-demand na stabilnych workloadach - najdroższy błąd

On-demand to najdroższy model rozliczenia AWS. Jeśli Twoja baza danych działa 24/7 i nikt nie kupił Reserved Instances ani Savings Plans - płacisz 30–60% więcej niż powinineś. Reserved Instances to zobowiązanie 1 lub 3-letnie w zamian za obniżkę nawet o 60%. Savings Plans daje większą elastyczność co do typu instancji.

3. Right-sizing - płacisz za moc, której nie używasz

Instancja c5.2xlarge z utilization na poziomie 8% CPU to pieniądze wyrzucone w błoto. Right-sizing to analiza metryk CPU, RAM i sieci z ostatnich 30–90 dni i dopasowanie rozmiaru instancji do realnego profilu obciążenia. AWS Compute Optimizer robi część roboty automatycznie - ale rekomendacje trzeba wdrożyć. Sami z siebie się nie wykonają.

4. Data transfer - koszt ukryty w architekturze

Ruch między strefami dostępności (AZ) w AWS kosztuje. Ruch do internetu kosztuje. Aplikacja, której mikroserwisy rozmawiają między sobą przez różne AZ bez powodu, generuje koszty transferu, których nikt nie uwzględnił w budżecie.

💡

Co możesz zrobić teraz: Wejdź w AWS Cost Explorer → zakładka "Data Transfer". Jeśli transfer inter-AZ lub outbound to więcej niż 10% rachunku, warto przejrzeć topologię sieciową.

5. S3 - warstwy przechowywania nie skonfigurowane

S3 Standard to najdroższa warstwa. Dane, do których sięgasz raz w roku, powinny trafić do S3 Glacier lub S3 Intelligent-Tiering. Lifecycle Policies automatyzują przenoszenie danych między warstwami.

6. NAT Gateway - brama płatna z każdej strony

NAT Gateway to wygodne rozwiązanie, ale drogie: płacisz za przetworzony ruch plus godziny działania. W wielu architekturach instancje w prywatnych subnetach mogłyby komunikować się przez VPC Endpoints zamiast przez NAT.

Jak to wykryć?

Cost Explorer, Trusted Advisor i Compute Optimizer - wszystkie dostępne w konsoli AWS. Problem w tym, że same narzędzia nie wystarczą - potrzebujesz kogoś, kto wie, co z ich wynikami zrobić.

Chcesz wiedzieć, za co płacisz?

60-minutowy Cloud Check - bezpłatnie. Top 5 znalezisk z konkretnymi liczbami.

NastępnyInfrastructure as Code: dlaczego "click-ops" to pułapka na wzrost