J’ai (Emmanuel Bernard) la direction technique d’une équipe chez Red Hat dont la mission est de monter une offre de Kafka As A Service (<https://red.ht/TryKafka>). J’aimerai vous partager les expériences acquises et de tout ce que l’on a du apprendre en chemin.
On discutera de la production non pas d’une application ou d’un produit mais d’une plateforme faisant tourner des milliers d’instances pour d’autres. Et cela change tout. Un peu dans le code, mais surtout dans tous les systèmes qui supportent ce code et dans la culture des équipes. Je parlerai de l’architecture que l’on a mis en place et pourquoi. Je parlerai aussi de Site Reliability Engineer, de Standard Operating Procedure, de Control Plane, de SLA, de blast radius, de voisins bruyants et d’euthanasie de chat (chaque instance perdue c’est comme si un chaton mourrait, c’est mal!).
Nous ne sommes qu'au début de ce chemin, c’est un retour d’expérience plus qu’un guide magique de bonnes pratiques. Après cette présentation, vous aurez une perspective sur les points saillants d’une plateforme de service et de voir votre prod d'une autre façon.