Quelles actions un décideur Cloud & Opérations doit-il mener pour relever les défis de l’année 2023 ?
Avis d'experts
02 février 2023
Nous avons identifié les défis, nous avons examiné les tendances, concentrons-nous maintenant sur ce que nous devrions faire !
ACTION N°1
Évoluer vers la détection et l’anticipation des nouveaux besoins de l'entreprise
Le plus important pour les responsables Cloud & Opérations c’est qu’ils doivent être proactifs : ils doivent faire évoluer leurs capacités pour détecter et anticiper les besoins de l’entreprise. Et pour cela, il est crucial de se concentrer sur l’agilité.
- L’agilité
L’agilité devrait être un objectif aussi important que la gestion des performances, la disponibilité ou le coût de possession, qui sont des mesures typiques sur lesquelles de nombreux responsables informatiques sont objectivés. L’une des façons de consacrer l’agilité est d’utiliser la méthode du sprint back log : c’est une technique où vous prenez une tâche complexe et la décomposez en petits morceaux. Ces tâches complexes sont alors livrées de manière agile, souvent dans un statut de MVP (Minimum Viable Product).
- La gestion des risques
Nous devons gérer les risques de manière proactive, nous devons avoir une visibilité en temps réel sur nos actifs. C’est à cela que servent la supervision, l’observabilité et les fonctions SRE. Mais ces techniques ne se suffisent pas à elles seules. En effet, nous commençons à voir des organisations s’intéresser aux pratiques d’ingénierie du chaos. C’est une manière proactive d’ingérer les erreurs dans votre environnement pour tester vos systèmes. Un exemple concret a été publié par American Airlines sur leurs pratiques de SRE et d’ingénierie du chaos, où, dans le cadre d’un test de résistance, ils ont découvert que le délai d’attente avant défaillance de la base de données supposé être de 6 secondes, a finalement duré 5 minutes. Voilà ce qu’on peut découvrir en effectuant des tests de régression et de charge appropriés.
- Optimisation des coûts
Nous devons optimiser les coûts, nous commençons à voir un intérêt croissant et précoce pour l’usage d’infrastructures facturées à la consommation, non seulement dans les environnements de cloud public, mais aussi On-Premises et en colocation.
- Plateformes et produits
Enfin, les équipes informatiques doivent se concentrer sur leurs plateformes avec un changement de mindset : réfléchir produit et non plus service. En effet, nous devons avoir la capacité de lancer de nouvelles fonctionnalités pour ces produits, de manière agile.
- La télémétrie permet aux responsables Cloud & Opérations de favoriser la « détection »
La télémétrie est l’un des moyens de détecter la demande de l’entreprise. Mais avant d’en arriver à la télémétrie, nous devons nous rappeler que le moyen le plus efficace de détecter l’activité reste de communiquer avec les différentes équipes. Nous devons établir des liens avec les responsables métiers, nous devons travailler avec des équipes rapprochées qui opèrent au sein d’unités commerciales, nous devons avoir des comités communs avec eux. Rien ne remplace le contact humain. Mais en l’absence de contact humain, la télémétrie et l’observabilité peuvent être d’une grande aide.
Qu’est-ce que l’observabilité en premier lieu ? L’observabilité est la pratique qui examine les métriques externes d’un système (mesures, traces et logs) pour en évaluer la santé interne. Comme un examen médical, le patient décrit ses symptômes et le médecin d’établir un diagnostic.
Nous vivons dans un monde de données. De ce fait, il existe une énorme quantité de données de télémétrie à notre disposition via des logs et des fichiers de paramètres qui peuvent être exploités pour comprendre et évaluer la santé de nos applications et systèmes. D’autant plus, si nous combinons les données de télémétrie avec le Machine Learning, nous pourrions être beaucoup plus proactifs en termes de fourniture de services spécifiques par localisation, en termes d’amélioration des prévisions capacitaires, ou en termes de sécurité et de performances adéquates dans nos environnements.
ACTION N°2
Retenir les talents
Nous devons minimiser les facteurs de répulsion ou de départ et maximiser les facteurs d’attraction. En particulier, devenir beaucoup plus flexible sur le mode et les lieux de travail et s’assurer que nous répondions aux attentes des employés actuels ou des employés potentiels.
Nous devons également investir dans les technologies de prochaine génération afin d’attirer les talents. Au-delà de la rémunération -évidemment la rémunération reste très importante – les employés recherchent de la formation, du mentorat, ils cherchent à travailler pour des organisations très collaboratives, pour des organisations où il y a peu de bureaucratie. Nous avons la capacité d’attirer des talents en nous concentrant sur ces domaines : favoriser les opportunités, favoriser la liberté, favoriser la croissance.
ACTION N°3
Maturer l’automatisation pour booster l'innovation
Enfin, nous devons nous concentrer sans relâche sur l’automatisation. Il ne s’agit pas seulement de « plus d’automatisation » mais surtout de la façon dont nous pensons l’automatisation. Nous devons faire mûrir l’automatisation dans tous les domaines : ITSM, opérations, infrastructures réseau.
Une méthode simple que nous pourrions appliquer pour installer l’automatisation dans nos organisations est de délimiter des périmètres : des domaines clés où nous avons besoin d’un seuil minimal d’automatisation, par exemple les helpdesk ou le provisionning d’infrastructure. Nous pouvons nous fixer comme objectif d’être à 80 % d’automatisation d’ici fin 2023. Ensuite, il y a les domaines en maturation de l’automatisation, par exemple nous voulons avoir un outil d’automatisation commun à l’ensemble de l’environnement informatique hybride. Il conviendra de se fixer un objectif d’être à 40 à 50 % de cette uniformisation dans un an. Enfin, identifier d’autres domaines émergents comme AIOps, pour lesquels on souhaiterait lancer des projets en 2023.
La clé ici est que nous avons besoin d’un plan pour faire mûrir notre automatisation : définir des objectifs clairs au sein de l’organisation.
Trois gains recherchés avec l’automatisation de l’infrastructure
La principale raison pour laquelle les organisations automatisent est l’efficacité : elles veulent limiter l’intervention humaine, elles veulent limiter les erreurs souvent causées par les êtres humains. Elles veulent augmenter le libre-service et consacrer les ressources aux initiatives plus stratégiques. Une fois l’efficacité atteinte, les organisations vont se concentrer sur la productivité, l’amélioration continue, comment réduire les erreurs et augmenter la satisfaction des clients. Et l’objectif final est de réduire les coûts, de pouvoir le faire moins cher, de pouvoir réduire les dépenses et de réduire les effectifs en réaffectant les ressources aux fonctions à plus grande valeur.
CONCLUSION
Réussir sa mission en tant que leader cloud & opération
Le métier des équipes cloud & opérations ne sera pas mort de sitôt. En effet, ces équipes sont bien plus nécessaires aujourd’hui que jamais auparavant.
Mais pour que les dirigeants et les organisations cloud & opérations soient pertinents, nous devons nous concentrer sur les activités et les résultats métiers. Nous devons nouer des relations plus étroites avec eux et nous devons utiliser la technologie et la télémétrie pour devancer les besoins commerciaux.
Nous devons nous concentrer sur l’attraction des bons talents et les retenir au sein de l’organisation au-delà de l’objectif de rémunération.
Enfin, nous devons nous concentrer en permanence sur l’automatisation comme moyen d’innover au sein de nos équipes.
Auteur
Saber LAABIDI, Senior Manager
Notre practice CIO Advisory and Agility
A propos de Magellan Consulting
Magellan Consulting est le catalyseur de la transformation digitale de ses clients en les accompagnant dans le changement profond de leurs métiers et de leurs socles technologiques pour aborder les nouveaux business modèles, la transition sociétale, énergétique et écologique.