|
@@ -0,0 +1,65 @@
|
|
|
|
|
+# Логгирование и контроль за деградацией системы
|
|
|
|
|
+
|
|
|
|
|
+## Фронтенд
|
|
|
|
|
+
|
|
|
|
|
+Фронтэнд представлен на сервере только статическими файлами. Необходимо отслеживать только работоспособность nginx.
|
|
|
|
|
+
|
|
|
|
|
+При текущих ресурсах и настройках деградация маловероятна, и возможно только, если сервер не обслуживать более года.
|
|
|
|
|
+
|
|
|
|
|
+Достаточно следить за общей телеметрией сервера.
|
|
|
|
|
+
|
|
|
|
|
+## Бэкэнд
|
|
|
|
|
+
|
|
|
|
|
+Бэкэнд-сервис требует наблюдения.
|
|
|
|
|
+
|
|
|
|
|
+На данный момент наблюдение можно разделить на два направления:
|
|
|
|
|
+
|
|
|
|
|
+* Контроль логов и ошибок сервиса.
|
|
|
|
|
+* Общий контроль телеметрии сервера.
|
|
|
|
|
+
|
|
|
|
|
+### Контроль логов и ошибок сервиса
|
|
|
|
|
+
|
|
|
|
|
+Сервис ведет логирование по каждому микросервису в отдельности и общее на случай сбой узла.
|
|
|
|
|
+
|
|
|
|
|
+Логирование дублируется и ведется по разным уровням важности:
|
|
|
|
|
+ * сообщения уровня информация, внимание, ошибка - пишутся в stdout и доступны из journalctl
|
|
|
|
|
+ * сообщения уровня внимание, ошибка - пишутся дополнительно в логи в папке сервиса
|
|
|
|
|
+
|
|
|
|
|
+Папки внутренних логов
|
|
|
|
|
+ * /home/services/profimall_api/logs/logs - общие ошибки
|
|
|
|
|
+ * /home/services/profimall_api/logs/* - по микросервисам в отдельности
|
|
|
|
|
+
|
|
|
|
|
+На данный момент достаточно просматривать логи из journalctl для profimall_api на предмет наличия ошибок в работе сервиса.
|
|
|
|
|
+Внутренние логи используются для поиска этой ошибки разработчиками.
|
|
|
|
|
+
|
|
|
|
|
+При необходимости можно подключить внешние сервиса контроля ошибок. (Задача для системного администратора)
|
|
|
|
|
+
|
|
|
|
|
+### Общий контроль телеметрии сервера
|
|
|
|
|
+
|
|
|
|
|
+По состоянию общей телеметрии сервера можно сделать выводы об общей деградации системы.
|
|
|
|
|
+
|
|
|
|
|
+Основные признаки деградации:
|
|
|
|
|
+* Постоянное использование ЦП более чем на 60-70%
|
|
|
|
|
+* Загруженность ОЗУ более чем на 70%
|
|
|
|
|
+* Загруженность ПЗУ более чем на 80%
|
|
|
|
|
+
|
|
|
|
|
+Проверка ОЗУ
|
|
|
|
|
+
|
|
|
|
|
+free -h
|
|
|
|
|
+
|
|
|
|
|
+Проверка ЦП
|
|
|
|
|
+
|
|
|
|
|
+top -i
|
|
|
|
|
+
|
|
|
|
|
+Проверка ЦП и ОЗУ
|
|
|
|
|
+
|
|
|
|
|
+htop
|
|
|
|
|
+
|
|
|
|
|
+Проверка ПЗУ
|
|
|
|
|
+
|
|
|
|
|
+df -h
|
|
|
|
|
+
|
|
|
|
|
+При необходимости можно подключить сервисы мониторинга и дашбордов: Prometheus, Grafana.
|
|
|
|
|
+Реализовать информирование о превышении параметров и тд. (Задача для системного администратора)
|
|
|
|
|
+
|
|
|
|
|
+[Назад](../index.md)
|