Зафиксирован инцидент в работе сервиса

Обновляется
HTTP 500 · degraded · medium

Внутренняя ошибка сервера

Часть запросов завершается с кодом 500. Команда обслуживания работает над восстановлением. Текущая попытка пользователя не была выполнена, посетителю рекомендуется повторить действие позднее.

Сбой обнаружен в подсистеме обработки запросов на узле app-04.lan. Остальные компоненты функционируют в штатном режиме. Затронуто примерно 7-12% запросов к endpoint /api/data и /api/order.

Уровень инцидента классифицируется как средний. Прогноз восстановления — в течение 15-20 минут от момента открытия инцидента.

Что попробовать Обновите страницу через минуту. Если ошибка сохраняется — попробуйте позднее. Никаких изменений настроек браузера или сети не требуется.

Сводные метрики инцидента

Код ответа
500
Ошибок · 5 мин
218
Доля 5xx
7.4%
Затронуто узлов
1/10
Длительность
7мин
Retry-After
90сек

Хронология обновлений инцидента

Идентифицирована причинаСбой обнаружен в подсистеме обработки запросов на узле app-04.lan. Запущен процесс изоляции узла от ротации балансировщика. Трафик переключается на резервные узлы app-01 и app-02.
Расследование причиныПрирост ошибок 5xx, мониторинг подал сигнал тревоги. Дежурная команда обслуживания подключена к расследованию. Анализируются журналы приложения и системные метрики.
Открыт инцидентУровень: средний. Затронут endpoint /api/v1. Создана запись в системе учёта инцидентов под номером INC-2026-05-20-018.
Первое срабатывание мониторингаПревышен порог 5% от общего числа запросов с кодами 5xx в течение трёх минут подряд. Автоматический алерт направлен дежурной команде.
Штатная работа сервисаДоля ошибок 5xx ниже 0.5% от общего трафика. Все узлы кластера в состоянии operational. Время отклика p99 в пределах нормы.

Состояние компонентов инфраструктуры

edgeoperational
gateway-01operational
gateway-02operational
app-01.lanoperational
app-02.lanoperational
app-03.lanelevated load
app-04.landown
cache-01operational
cache-02operational
db-masteroperational
db-replicaoperational
queueoperational

Журнал обновлений

Изоляция проблемного узла в работе

Узел app-04.lan исключён из ротации балансировщика. Трафик переключён на резервные узлы app-01 и app-02. Идёт процесс перезапуска службы на проблемном узле.

Дежурная команда подключена расследование

Расследование начато. Открыт инцидент INC-2026-05-20-018. Прогнозируемое время до полного восстановления — 15-20 минут.

Срабатывание мониторинга обнаружено

Автоматический алерт подал сигнал. Превышен порог 5% от общего числа запросов с кодами 5xx в течение трёх минут.

Технические идентификаторы

request id0xc214-9821-44ef
trace id2c8f1e7b4a092d3c
span id4f8c2a01ed
edge nodeedge-11 · sof
upstreamapp-04.lan (изолирован)
методPOST /api/v1/order
protocolHTTP/2 · TLS 1.3
cipherAEAD-AES128-GCM-SHA256
nginx1.25.3
retry-after~ 90 сек
open since2026-05-20 06:41 UTC
incident idINC-2026-05-20-018