Основы дизайна систем: логирование, мониторинг, предупреждения

Логирование

Со временем ваша система будет собирать много данных. Большая часть этих данных чрезвычайно полезна. Она может дать вам представление о состоянии вашей системы, ее производительности и проблемах. Это также может дать вам ценную информацию о том, кто использует вашу систему, как они ее используют, как часто, какие части используются более или менее и так далее.

Эти данные важны для аналитики, оптимизации производительности и улучшения продукта. Это также чрезвычайно ценно для отладки, не только при входе в консоль во время разработки, но и для поиска ошибок в тестовой и производственной средах. Таким образом, журналы также помогают в отслеживании и аудите.

Ключевой прием, который следует помнить при ведении журнала, - это рассматривать его как последовательность последовательных событий, что означает, что данные становятся данными временного ряда, а инструменты и базы данных, которые вы используете, должны быть специально разработаны для помощи в работе с такими данными.

Мониторинг

Это следующий шаг после логирования. Он отвечает на вопрос «Что мне делать со всеми этими данными журнала?». Вы отслеживаете и анализируете это. Вы создаете или используете инструменты и сервисы, которые анализируют эти данные и предоставляют вам информационные панели или диаграммы или другие способы понимания этих данных в удобочитаемой форме.

Сохраняя данные в специализированной базе данных, предназначенной для обработки такого рода данных (данных временных рядов), вы можете подключать другие инструменты, созданные с учетом этой структуры данных и намерений.

Предупреждения (Alerting)

Когда вы ведете активный мониторинг, вам также следует установить систему, которая будет предупреждать вас о важных событиях. Точно так же, как предупреждение о том, что цены на акции превышают определенный потолок или ниже определенного порога, определенные показатели, которые вы наблюдаете, могут требовать отправки предупреждения, если они становятся слишком высокими или слишком низкими. Время отклика (задержка) или ошибки и сбои являются хорошими показателями для настройки предупреждений, если они превышают «приемлемый» уровень.

Ключ к хорошему ведению журнала и мониторингу - обеспечение того, чтобы ваши данные были достаточно согласованными с течением времени, поскольку работа с противоречивыми данными может привести к отсутствию полей, которые затем нарушат аналитические инструменты или уменьшат преимущества ведения журнала.


Читайте также:

Комментарии

Популярные сообщения из этого блога

Язык поисковых запросов в Graylog

Хэш-таблица: разрешение коллизий

Нормальные формы, пример нормализации в базе данных