Aller au contenu

Supervision

La supervision repose sur Prometheus 🡕 (métriques), Grafana 🡕 (tableaux de bord) et Loki 🡕 (journaux). Elle est organisée par zone : un hôte collecte, les autres exposent leurs métriques.

Diagram
RôleQuiQuoi
CollecteurHôte avec prometheus (+ monitoring, + loki)Métriques & alertes, tableaux de bord, journaux
Nœud superviséHôtes tagués monitoring-nodenode-exporter (métriques système)
Source de logsHôtes sous CaddyAlloy pousse les journaux d’accès

prometheus (métriques + alertes) et monitoring (Grafana) sont deux services distincts sur le même hôte ; Grafana requiert Prometheus. Le détail du fonctionnement est dans Monitoring & Alertes.

La supervision est un service. Sur le collecteur :

etc/config.yaml
services:
prometheus: # métriques + alertes (requis par monitoring)
monitoring:
domain: "stats" # → stats.<zone>.domain.tld
  • Les nœuds à superviser reçoivent le tag monitoring-node de leur zone.
  • loki suit monitoring : les logs Caddy sont collectés automatiquement dès que Caddy et monitoring sont actifs.
OptionEffetDéfaut
prometheus.retentionTimeRétention des métriques Prometheus30d
monitoring.isNodeFait de l’hôte un nœud supervisésuit le tag
monitoring.kioskTargetTableau de bord affiché à la racinenode-exporter