Supervision informatique, vers une disponibilité 100%

Aymeric LIBEAU

CONSULTANT SENIOR

supervision-monitoring-roomDirigeants et DSI-CTO doivent avoir l’obsession de la disponibilité de leurs services en ligne. L’un, car cela rentre dans la satisfaction client; l’autre, car il est un levier de création de valeurs et sans la disponibilité l’effet est inverse. Viser les 100% de disponibilité ne doit pas être un voeux pieux mais se traduire par des actions à plusieurs niveaux.

Un environnement adapté

Une solution disponible à 100% sans attention n’est qu’une illusion, il faut traiter l’exigence à différents niveaux :
  • Continuité Internet  : S’assurer de la résilience des opérateurs télécom (BGP, multi-homing) pour supporter la rupture de liens
  • Redondance matériel : S’assurer qu’il n’y a pas de SPF (Single Point of Failure). La redondance doit être partout
  • Architecture robuste : S’assurer que l’intégration des briques logiques aient été faites dans un contexte permettant la montée en charge
Si par défaut, l’ensemble de ces ressources (internet, matériel, logiciel) ne sont pas stables ou ne convergent pas pour assurer une très haute disponibilité, c’est le point de départ pour suivre un chemin vers la disponibilité 100%.
Sur la recherche de cette très haute disponibilité, la première étape consiste donc à mettre en oeuvre un monitoring d’applications, d’infrastructure avec des mesures de disponibilité et de charge sur l’ensemble de ces ressources et la mise en place de l’outillage adapté.

Une supervision efficace et adaptée

La mise en place d’un service de monitoring ne peut se limiter à la mise en place d’outils. Avec une redondance à tous les niveaux, la défaillance d’équipements est amortie. Mais l’imprévisible existera toujours et il faut pourtant répondre à ces cas. L’outil permet d’alerter pour une intervention immédiate. Le processus suivant peut donc être implémenté :
  • Prise en compte de l’alerte du système de supervision (arrêt de la sirène hurlante)
  • Dispatch de l’incident vers la bonne équipe / ressource
  • Exécution de la procédure prévue pour le problème identifié
  • Intervention d’un expert si le problème n’est pas connu dans les procédures (et documentation si nécessaire)
Cette approche en niveaux permet d’assurer une intervention efficace. Evidemment dans des environnements plus modestes, tous ces niveaux peuvent sembler injustifiés mais cette approche de bonnes pratiques ITIL limite les erreurs.
Pour optimiser ces pratiques de supervision, il faut bien connaître les pratiques de ces usagers / clients pour une disponibilité adaptée aux bonnes plages horaires d’utilisation. Pourquoi assurer une disponibilité H24/J7 quand le service est utilisé dans des usages de bureaux. Mais ce n’est pas systématiquement le cas.

Internaliser ou Externaliser ?

L’organisation d’une supervision fréquemment rencontrée consiste à assurer des interventions dans la plage HO (heures ouvrées) et une organisation « Best effort » en mode astreinte pour le reste du temps (nuit et week-end). Mais le mode « Best Effort » (rémunéré ou pas) a ses limites. Le choix entre monter une équipe pour assurer le HNO (heures non ouvrées) et l’externalisation dépend de plusieurs critères. Pour une monitoring H24 / J7, l’externalisation est rapidement incontournable :
  • La supervision n’est pas le cœur de métier de l’entreprise.
  • Les activités supervisées touchent peu à la confidentialité.
  • Les services stables permettent de contenir le budget de monitoring avec une organisation mutualisée.
  • Le transfert de l’effort de supervision interne en pilotage de l’externalisation est nécessaire.

Le modèle d’externalisation flexible me parait le plus adapté pour répondre à l’imprévisible et à une bonne gestion des risques :

  • Une équipe externalisée connaît les services et leur criticité
  • L’externalisation peut ne porte que sur le HNO
  • Pour les absences imprévues ou les périodes de vacances, l’équipe externe peut assurer le relai sur le HO

Confiance dans un partenaire

Que cela soit pour du monitoring cloud public , de serveurs, d’applications, d’une infrastructure ou du ménage des bureaux, une externalisation ne peut pas se faire sans confiance. Attention, il faut prendre quelques précautions pour éviter la confiance aveugle :
  • Bien délimiter les périmètres de responsabilité et les processus au sein d’un PQP (Plan Qualité Projet).
  • Avoir une attention particulière au contrat et à la clause de réversibilité.
  • Assurer une communication et un pilotage réguliers pour maintenir la proximité.
  • Mettre en place de l’authentification individuelle sur les systèmes pour une traçabilité des opérations.
 Quelle entreprise pourrait se targuer aujourd’hui qu’une indisponibilité de son système d’information ou de services en ligne n’a pas de conséquences sur son activité ou son image de marque ? Et cela ne va pas aller en s’arrangeant. Le 100% devient de plus en plus un objectif et les derniers centièmes sont difficiles à atteindre.

Dans une démarche de continuité des services, Pentalog apporte à ses clients des services d’accompagnement dans la mise en place de services robustes ainsi que des services de supervision flexibles avec une équipe mutualisée.

Contactez-moi afin que l’on puisse échanger rapidement sur les solutions possibles à vos exigences.

Tag: plateforme de services digitaux, Supervision, supervision cloud, supervision informatique