Load Shedding: Melindungi Sistem dari Kelebihan Beban dengan Menolak Permintaan

Load shedding adalah teknik proteksi yang secara sengaja menolak sebagian permintaan ketika sistem mencapai batas kapasitas, mencegah kegagalan total (cascading failure) yang dapat terjadi jika semua permintaan tetap diproses dengan performa yang sangat buruk. Implementasi load shedding menggunakan mekanisme seperti queue length monitoring, di mana permintaan ditolak jika antrian melebihi ambang batas, dan priority-based shedding yang menolak permintaan non-kritis terlebih dahulu sambil tetap memproses permintaan prioritas tinggi. Dalam sistem berbasis queue, pendekatan “fast fail” yang segera mengembalikan error 503 atau 429 lebih baik daripada membiarkan permintaan menumpuk menyebabkan timeout di seluruh sistem. Load shedding sering dikombinasikan dengan circuit breaker yang membuka sirkuit ketika downstream service gagal, mencegah permintaan mencapai service yang sudah dalam kondisi tidak sehat. Tantangan load shedding adalah menentukan threshold yang tepat, karena terlalu agresif menolak permintaan dapat mengurangi kapasitas yang sebenarnya masih tersedia, sementara terlalu longgar tidak memberikan perlindungan yang cukup.