Panne OVH : sites hors-ligne et latence, l’hébergeur de nouveau en galère
OVH a connu une nouvelle soirée mouvementée ce mercredi 6 décembre 2017. Pour améliorer ses infrastructures suite à la panne géante survenue le 9 novembre 2017, l'hébergeur devait réaliser des travaux de maintenance, qui n'ont même pas pu commencer à cause d'un bug software qui a provoqué la mise hors-ligne et une forte latence pour de nombreux sites.
OVH a connu de nouveaux dysfonctionnements lors de la soirée du mercredi 6 décembre 2017, causant une latence anormale sur de nombreux sites. Comme lors de l'énorme panne OVH qui avait mis des millions de sites hors ligne, son PDG Octave Klaba nous a tenu au courant de l'évolution de la situation sur Twitter. Mais le ras-le-bol de certains clients est de plus en plus perceptible.
Encore une panne chez OVH
L'incident est bien moins grave que celui survenu un mois plus tôt et en est intimement lié, selon Octave Klaba. “Le 9 novembre, nous avons rencontré un gros problème sur notre réseau optique à Roubaix. Le problème était lié à un bug software sur les équipements que nous utilisons qui a provoqué l'effacement de la configuration“, explique le patron d'OVH. “Depuis, nous avons mis à jour les équipements sur tout notre réseau. Aussi pour éviter que ce type de bug ne provoque plus jamais un souci, nous avons décidé de diviser les clusters en trois sur le site de Roubaix. [En cas] de bug , la configuration impacterait uniquement 30% de trafic”, précise-t-il. D'ailleurs, cette panne du 9 novembre va coûter cher à OVH, l’hébergeur devant rembourser des millions d’euros à ses clients.
Sauf que cette étape ne s'est pas passée comme prévue. La maintenance devait débuter à 23h , mais les équipes d'OVH ont constaté lors de sa préparation que la configuration avait encore disparu à 20h20 et que “tous les liens ont été à nouveau down “. Un autre bug qui a causé la suppression de la base de données sur la dernière version software donc. La plupart des sites concernés ne sont pas restés longtemps hors-ligne, mais une forte latence a été constatée. Un ralentissement qui s'explique par le fait que le trafic passait pendant un moment par Paris-Gravelines-Amsterdam-Roubaix au lieu de faire directement Paris-Roubaix.
C’est UP. On freeze la maintenance de cette nuit pour comprendre pourquoi la configuration disparaît alors qu’on utilise la derniere version du software .. Désolé !
— Octave Klaba (@olesovhcom) 6 décembre 2017