— это сервис, который даёт возможность понимать, что происходит со сложной веб-системой — автоматические детальные и осмысленные дашборды с графиками позволят разобраться в неочевидном поведении подсистем проекта.
Мониторинг производится не за счет периодических проверок сайта из разных мест, а установкой агента на сервера и сбором статистики, метрик изнутри системы.
Автоматическое определение многих популярных сервисов Nginx, MySQL, Postgresql, JVM, Redis, Memcached, RabbitMQ — с автоматической конфигурацией и автоматическими графиками и дашбордами для этих сервисов.
Глубокая и детальная статистика про многие аспекты системы:
по каждому процессу в системе: потребление cpu, памяти, disk io, треды, файловые дескрипторы;
по каждому сетевому сервису: количество соединений на этот порт с каждого входящего IP, разбивка их по статусам TCP, а так же статистика по исходящим соединениям;
по access логам Nginx — количество медленных и быстрых ответов сервера с разбивкой по url, количество ответов с заданным HTTP status'ом и прочее.
Детальная статистика по запросам в базу данных, по внутреннему состоянию базы.
Данные в формате metrics 2.0 — http://metrics20.org, над ними можно совершать операции на языке запросов — можно складывать, делить метрики друг на друга, объединять их в группы и аггрегировать внутри групп max, min, sum, avg, применять оконные функции типа «максимум за последний пять минут / час»
Уведомления по SMS, Email, Slack и другие интеграции.