Supervision

La supervision repose sur Prometheus 🡕 (métriques), Grafana 🡕 (tableaux de bord) et Loki 🡕 (journaux). Elle est organisée par zone : un hôte collecte, les autres exposent leurs métriques.

Les rôles

Rôle	Qui	Quoi
Collecteur	Hôte avec `prometheus` (+ `monitoring`, + `loki`)	Métriques & alertes, tableaux de bord, journaux
Nœud supervisé	Hôtes tagués `monitoring-node`	`node-exporter` (métriques système)
Source de logs	Hôtes sous Caddy	Alloy pousse les journaux d’accès

prometheus (métriques + alertes) et monitoring (Grafana) sont deux services distincts sur le même hôte ; Grafana requiert Prometheus. Le détail du fonctionnement est dans Monitoring & Alertes.

Activer

La supervision est un service. Sur le collecteur :

    services:
      prometheus:              # métriques + alertes (requis par monitoring)
      monitoring:
        domain: "stats"        # → stats.<zone>.domain.tld

Les nœuds à superviser reçoivent le tag monitoring-node de leur zone.
loki suit monitoring : les logs Caddy sont collectés automatiquement dès que Caddy et monitoring sont actifs.

Réglages utiles

Option	Effet	Défaut
`prometheus.retentionTime`	Rétention des métriques Prometheus	`30d`
`monitoring.isNode`	Fait de l’hôte un nœud supervisé	suit le tag
`monitoring.kioskTarget`	Tableau de bord affiché à la racine	node-exporter