Always On : Supervision des Groupes de Disponibilité
Compteurs et indicateurs clés à surveiller pour les Groupes de Disponibilité Always On de SQL Server.
Les Groupes de Disponibilité Always On (AG) de SQL Server permettent d’assurer une haute disponibilité et une récupération d’urgence pour les bases de données critiques. Une supervision proactive est essentielle pour garantir la stabilité et la performance de ces environnements.
Disponibilité des Réplicas
| Compteur | Objet | Description |
|---|
| Database Replica State | Availability Replica (SQLServer:Availability Replica) | État du réplica (1=En bonne santé, 2=En cours de synchronisation, etc.). |
| Synchronization Health | Database Replica (SQLServer:Database Replica) | État de synchronisation des bases de données (0=Non synchronisé, 1=Synchronisé, 2=En cours de synchronisation). |
Latence de Synchronisation
| Compteur | Objet | Description |
|---|
| Log Send Queue (KB) | Database Replica (SQLServer:Database Replica) | Taille de la file d’attente d’envoi des logs (en Ko). Une valeur élevée indique un retard de synchronisation. |
| Redo Queue (KB) | Database Replica (SQLServer:Database Replica) | Taille de la file d’attente de relecture des logs (en Ko). Une valeur élevée peut indiquer un goulot d’étranglement sur le réplica secondaire. |
| Estimated Recovery Time (ms) | Database Replica (SQLServer:Database Replica) | Temps estimé pour la récupération en cas de basculement. |
| Compteur | Objet | Description |
|---|
| Bytes Received/sec | Availability Replica (SQLServer:Availability Replica) | Débit de données reçu par le réplica secondaire. |
| Bytes Sent/sec | Availability Replica (SQLServer:Availability Replica) | Débit de données envoyé par le réplica principal. |
| Flow Control Time (ms) | Database Replica (SQLServer:Database Replica) | Temps passé en contrôle de flux (en ms). Une valeur élevée peut indiquer des problèmes de réseau ou de performance. |
Utilisation des Ressources
| Compteur | Objet | Description |
|---|
| CPU Usage (%) | Processor (SQLServer:Processor) | Utilisation CPU par SQL Server. |
| Memory Grants Pending | SQLServer:Memory Manager | Nombre de demandes de mémoire en attente. |
| Disk Read/Write Latency (ms) | PhysicalDisk (SQLServer:PhysicalDisk) | Latence des lectures/écritures sur le disque. |
Connexions et Transactions
| Compteur | Objet | Description |
|---|
| Transactions/sec | Databases (SQLServer:Databases) | Nombre de transactions par seconde. |
| Active Transactions | Databases (SQLServer:Databases) | Nombre de transactions actives. |
| Log File(s) Used Size (KB) | Databases (SQLServer:Databases) | Taille utilisée des fichiers de log. |
Alertes Recommandées
- Seuil critique pour Log Send Queue : > 100 Mo pendant plus de 5 minutes.
- Seuil critique pour Redo Queue : > 50 Mo pendant plus de 5 minutes.
- Latence de synchronisation : > 30 secondes.
- Temps de récupération estimé : > 1 minute.
Références