DraftKings marque un touchdown avec PagerDuty

PagerDuty image

Taille: 1 000+

Industrie: Médias et divertissement

Emplacement: Boston, Massachusetts

Client depuis : 2013

DraftKings est une société de divertissement sportif numérique et de jeux vidéo qui stimule l'esprit de compétition des amateurs de sport. L'entreprise gère des fantasy sports quotidiens, un service de paris sportifs et un casino, offrant aux fans la possibilité de miser sur leur équipe favorite.

La croissance du marché du jeu vidéo aux États-Unis entraîne une concurrence accrue. DraftKings s'efforce de développer les offres les plus performantes, les plus fiables et les plus centrées sur le client, tout en se développant rapidement sur de nouveaux marchés, comme la place de marché des jetons non fongibles (NFT). Josh Engels, directeur de la gestion des problèmes chez DraftKings, est chargé de fournir un environnement stable pour garantir la meilleure expérience aux fans. La priorité est de développer la résilience en fournissant un cadre de gestion des incidents permettant aux équipes de DraftKings de gérer leurs propres problèmes. « De nombreux changements interviennent en arrière-plan à mesure que nous grandissons rapidement et que nous nous implantons sur de nouveaux marchés. Nous devons garantir notre stabilité et offrir une expérience client exceptionnelle », a déclaré Engels.

Graphic that shows: Issues proactively identified by internal stakeholders is above 90%; Mean time to respond is under 30 minutes; A highly available platform translates to fan loyalty.

Attention aux pics de Gronk

Les week-ends de football constituent un test crucial pour la plateforme. Les jours de match, un flux constant d'utilisateurs de fantasy sélectionnent leurs compositions avant le coup d'envoi. Dès le premier touchdown, DraftKings constate ce qu'ils appellent un « Gronk Spike ». Les fans ouvrent et actualisent leurs applications, doublant souvent le trafic sur la plateforme et sollicitant l'infrastructure. Pour éviter toute perte de revenus, l'entreprise doit garantir la disponibilité et la stabilité de la plateforme malgré le chaos constant des jours de match. « Le jeu vidéo est un marché hautement concurrentiel », explique Engels. « Si un client n'a pas accès à notre service, il se tournera immédiatement vers un concurrent. »

Durant ses premières années, DraftKings s'appuyait sur quelques personnes clés connaissant son infrastructure pour surveiller activement les systèmes et résoudre les problèmes. Ces personnes étaient rivées à leurs ordinateurs portables, les transportant toute la journée, souvent distraites par leurs autres responsabilités. À mesure que l'entreprise se développait et que le nombre d'utilisateurs de la plateforme augmentait, le nombre d'équipes et de services augmentait également. Engels a déclaré : « Personne ne souhaite surveiller manuellement les systèmes 24 h/24 et 7 j/7 via un tableau de bord. Nous voulons être alertés en cas d'incident. »

La complexité croissante de la gestion technologique a entraîné une lassitude et un épuisement professionnel chez les ingénieurs. Il était difficile de trouver du temps pour travailler sur de nouveaux projets, ceux qui permettraient à DraftKings de garder une longueur d'avance sur la concurrence. Engels a expliqué : « Nous devons aider les équipes à comprendre pourquoi elles reçoivent des alertes et où se situent ces tendances, afin qu'elles puissent consacrer plus de temps à l'innovation. »

Utiliser PagerDuty pour rationaliser les opérations et générer des améliorations

Les équipes de DraftKings ont adopté un modèle de propriété des services , chaque ligne de produits étant responsable de l'écriture de son propre code et de son support en production. Ces équipes opéraient selon le cadre de gestion des incidents de l'équipe de gestion des problèmes, avec PagerDuty comme outil de gestion. plateforme d'opérations numériques PagerDuty a fourni une visibilité sur tous les systèmes et a permis à DraftKings de gérer rapidement les incidents et de réduire les problèmes récurrents.

DraftKings a intégré ses principaux systèmes de surveillance à PagerDuty et a mis en place des plannings et des politiques d'escalade. Les équipes n'avaient plus besoin de se déplacer avec un ordinateur. Désormais, la bonne personne était avertie en cas de problème, offrant ainsi flexibilité et liberté aux équipes. Engels a expliqué : « Avec PagerDuty, lorsqu'un service rencontre un problème, nous savons exactement qui doit le résoudre et où se fait la communication. Cela nous a permis de développer considérablement l'activité. »

Lors du déploiement des services par les équipes, tout est intégré à PagerDuty. Afin de réduire les tâches manuelles et répétitives, une infrastructure en tant qu'outil logiciel de code (IaC) est utilisée pour la configuration initiale et l'intégration. Chaque fois qu'un nouveau service est déployé, il est automatiquement créé dans PagerDuty et met en place les intégrations spécifiques requises. Cela permet à DraftKings de standardiser les services. listes de services Au sein de PagerDuty. Engels a commenté : « On peut consulter dans PagerDuty les services dont nous disposons et leurs propriétaires. C’était difficile à gérer dans une entreprise en pleine croissance. La clarté sur la propriété des services a été un autre avantage considérable de PagerDuty. »

La gestion des problèmes utilise PagerDuty pour assurer la stabilité et la disponibilité du produit pour les clients. Les rapports PagerDuty fournissent des indicateurs permettant d'identifier les tendances, par exemple en cas de nombreux incidents liés à une fonctionnalité particulière. Ces données permettent de communiquer avec l'ensemble de l'entreprise, jusqu'au directeur technique, pour fournir des informations sur l'état des incidents, le délai moyen de résolution et les accords de niveau de service. Engels explique : « Les indicateurs nous permettent de prendre des décisions et d'apporter des améliorations à l'ensemble de l'organisation. »

Le manuel PagerDuty

DraftKings a implémenté PagerDuty pièces de réponse Pour les incidents majeurs : situations où le nombre d'alertes reçues est trop important pour être géré par une seule personne, ou où plusieurs personnes reçoivent des alertes concernant un problème. Par exemple, si un incident majeur survient chez Sportsbook dimanche, le système d'intervention fera appel à un ingénieur clé possédant une expertise métier sur l'ensemble de l'infrastructure comme responsable de l'incident. Le système d'intervention peut également organiser une visioconférence spécifique à l'incident, à laquelle les intervenants peuvent participer via PagerDuty. Cela permet une résolution rapide des incidents lors des moments les plus critiques de DraftKing.

En cas de panne, DraftKings utilisera également des jeux de réponse pour alerter les clients au plus vite. L'équipe Expérience Client est prévenue et peut réagir immédiatement en affichant une bannière dans l'application et en diffusant des messages sur les réseaux sociaux. Cela améliore l'expérience des fans en les tenant informés de la situation. Si un client est le premier à signaler un problème, l'équipe Expérience Client utilise PagerDuty. intégration de messagerie électronique pour créer un incident et notifier les bonnes équipes.

«PagerDuty nous aide à identifier les problèmes avant les clients… PagerDuty nous a vraiment rendus plus efficaces en tant qu'entreprise. »

– Josh Engels , Responsable de la gestion des problèmes chez DraftKings

Avantages avec PagerDuty

Avec PagerDuty, DraftKings a amélioré la résilience de ses ingénieurs et la stabilité de sa plateforme. Les ingénieurs n'ont plus besoin de transporter leurs ordinateurs portables et les Gronk Spikes sont sous contrôle grâce à PagerDuty qui orchestre la réponse adéquate à chaque fois.

Depuis la mise en œuvre de PagerDuty, DraftKings a bénéficié de :

    • Expérience client et fidélisation. DraftKings gagne des fans sur un marché concurrentiel en maintenant une plateforme hautement disponible et en communiquant de manière proactive lorsque des problèmes surviennent.
    • Gestion des incidents. Le cadre de gestion des problèmes, y compris la plate-forme PagerDuty pour les opérations numériques et un modèle de propriété de service, garantit que la bonne personne est informée et peut résoudre rapidement les incidents.
    • Innovation. Les ingénieurs peuvent se concentrer sur le développement des gammes de produits sans être distraits ni épuisés par la surveillance active de l’infrastructure.
    • Configuration flexible. Outre l'intégration aux systèmes de surveillance, les équipes peuvent également intégrer les outils utilisés pour leur gamme de produits spécifique et définir des calendriers et des politiques adaptés à leurs besoins. Tout cela est simplifié grâce à une infrastructure en tant que code.
    • Prise de décision basée sur les données : DraftKings utilise les rapports PagerDuty pour apprendre et améliorer ses opérations. Le temps moyen de réparation (MTTR) est désormais inférieur à 30 minutes, et le taux de détection proactive des problèmes par les parties prenantes internes dépasse 90 %, ce qui représente une amélioration significative.
    • Communication améliorée. PagerDuty permet une communication au sein de l'entreprise pour une réponse rapide, y compris l'ingénierie, l'expérience client et les principales parties prenantes de l'entreprise.

DraftKings s'efforce d'offrir la meilleure expérience possible aux fans tout en restant compétitif et en captant un maximum d'actions de paris. Engels a déclaré : « PagerDuty nous permet d'identifier les problèmes avant les clients. DraftKings a des exigences strictes en matière de disponibilité et de service, et dépasse désormais constamment ses objectifs. PagerDuty nous a vraiment aidés à gagner en efficacité en tant qu'entreprise. »

Où placer le prochain pari ?

DraftKings continuera de privilégier la santé de l'équipe. L'équipe de gestion des problèmes prévoit d'explorer les solutions de PagerDuty. Intelligence événementielle , notamment la réduction intelligente du bruit, afin de minimiser le nombre d'alertes reçues par les ingénieurs d'astreinte lors d'un incident. En supprimant les interruptions, les intervenants peuvent se concentrer sur la résolution des problèmes encore plus rapidement, ce qui permet à DraftKings de gagner du temps et de l'argent. L'entreprise a également mené des recherches. communication avec les parties prenantes pour fournir des informations sur l'état de l'entreprise et son impact en temps réel et réduire l'afflux de questions aux équipes d'ingénierie.

Pour en savoir plus sur la manière dont PagerDuty aide les entreprises à transformer leurs opérations numériques, visitez www.pagerduty.com/customers pour plus d'informations et Commencez un essai gratuit de 14 jours aujourd'hui .