Supervision
La supervision repose sur Prometheus 🡕 (métriques), Grafana 🡕 (tableaux de bord) et Loki 🡕 (journaux). Elle est organisée par zone : un hôte collecte, les autres exposent leurs métriques.
Les rôles
Section intitulée « Les rôles »| Rôle | Qui | Quoi |
|---|---|---|
| Collecteur | Hôte avec prometheus (+ monitoring, + loki) | Métriques & alertes, tableaux de bord, journaux |
| Nœud supervisé | Hôtes tagués monitoring-node | node-exporter (métriques système) |
| Source de logs | Hôtes sous Caddy | Alloy pousse les journaux d’accès |
prometheus (métriques + alertes) et monitoring (Grafana) sont deux services
distincts sur le même hôte ; Grafana requiert Prometheus. Le détail du
fonctionnement est dans
Monitoring & Alertes.
La supervision est un service. Sur le collecteur :
services: prometheus: # métriques + alertes (requis par monitoring) monitoring: domain: "stats" # → stats.<zone>.domain.tld- Les nœuds à superviser reçoivent le tag
monitoring-nodede leur zone. lokisuitmonitoring: les logs Caddy sont collectés automatiquement dès que Caddy et monitoring sont actifs.
Réglages utiles
Section intitulée « Réglages utiles »| Option | Effet | Défaut |
|---|---|---|
prometheus.retentionTime | Rétention des métriques Prometheus | 30d |
monitoring.isNode | Fait de l’hôte un nœud supervisé | suit le tag |
monitoring.kioskTarget | Tableau de bord affiché à la racine | node-exporter |