Skalowanie i niezawodnosc
18 pojęć w 8 podgrupach, z prostymi definicjami i źródłami.
Przeglądaj kategorię
Dystrybucja danych
Dystrybucja obciazenia
Mechanizmy niezawodnosci
Zdolność systemu do dalszego poprawnego działania mimo wystąpienia awarii części jego komponentów.
Automatyczne przejęcie funkcji uszkodzonego komponentu przez element zapasowy w celu zachowania ciągłości działania usługi.
Celowe powielanie krytycznych komponentów lub danych, tak aby awaria jednego elementu nie spowodowała utraty funkcji całego systemu.
Miary niezawodnosci
Odsetek czasu, w którym system jest sprawny i gotowy do poprawnej obsługi żądań, zwykle wyrażany w procentach (np. liczbą dziewiątek).
Właściwość systemu zaprojektowanego tak, by utrzymywać ciągłość działania na uzgodnionym poziomie przez wysoki odsetek czasu, minimalizując przestoje.
Strategie skalowania
Automatyczne dostosowywanie liczby aktywnych instancji obliczeniowych do bieżącego obciążenia na podstawie zdefiniowanych metryk i progów.
Zwiększanie wydajności systemu przez dodanie zasobów (CPU, RAM) do pojedynczej maszyny obsługującej obciążenie.
Zwiększanie wydajności systemu przez dodawanie kolejnych jednostek (węzłów, instancji) obsługujących obciążenie, zamiast wzmacniania pojedynczej maszyny.
Umowy poziomu uslug
Umowa o poziomie usługi (Service Level Agreement) — formalne zobowiązanie dostawcy wobec klienta dotyczące poziomu dostępności lub wydajności, z konsekwencjami za niedotrzymanie.
Wskaźnik poziomu usługi (Service Level Indicator) — mierzalna metryka opisująca rzeczywistą jakość usługi, np. opóźnienie czy odsetek poprawnych żądań.
Cel poziomu usługi (Service Level Objective) — docelowa wartość wskaźnika niezawodności, którą system ma osiągnąć w danym okresie.
Wlasciwosci skalowania
Zdolność systemu do dynamicznego zwiększania i zmniejszania przydzielonych zasobów w odpowiedzi na zmienne zapotrzebowanie, blisko proporcjonalnie do obciążenia.
Zdolność systemu do utrzymania wydajności przy wzroście obciążenia poprzez proporcjonalne dodawanie zasobów.
Wzorce odpornosci
Celowe ograniczanie funkcjonalności lub jakości usługi pod obciążeniem albo przy częściowej awarii, by zachować dostępność funkcji krytycznych.
Kontrolowanie maksymalnej liczby żądań przyjmowanych przez usługę w jednostce czasu w celu ochrony przed przeciążeniem i nadużyciami.
Wzorzec, który po wykryciu serii błędów zależnej usługi czasowo przerywa do niej wywołania, zapobiegając kaskadowej awarii i pozwalając na regenerację.
Pozostałe grupy — Chmura, DevOps i SRE
Chcesz wykorzystać AI w swojej firmie?
Wdrażamy chatboty, agentów głosowych i automatyzacje dla MŚP. Pierwsza konsultacja jest bezpłatna.
Bezpłatna konsultacja