Panne Facebook causée par une seule erreur

Accueil > Blog web Tunisie > High-Tech > Panne Facebook causée par une seule erreur


Cause Panne de Facebook, Instagram, WhatsApp et Messenger

La panne de Facebook du 04 octobre 2021– qui a supprimé Facebook, Messenger, Instagram et WhatsApp ainsi que le service principal – est à cause d’une erreur des propres ingénieurs réseau de l’entreprise.

L’erreur a conduit à l’inaccessibilité de tous les services de Facebook, avec une analogie la comparant à une défaillance des services de « contrôle du trafic aérien » pour le trafic réseau…

Nous avons rendu compte ce Lundi de l’échec massif.

Il est progressivement apparu que le problème du pouvait concerner le DNS. Les serveurs de noms de domaine qui indiquent aux appareils quelles adresses IP utiliser pour accéder aux services. Mais on ne savait pas exactement ce qui s’était passé, et s’il s’agissait d’un piratage externe, d’une action malveillante d’un initié, ou à cause une erreur catastrophique.

Facebook a maintenant admis dans un article de blog qu’il s’agissait d’une erreur.

Nos équipes d’ingénieurs ont appris que les changements de configuration sur les routeurs backbone qui coordonnent le trafic réseau entre nos centres de données ont causé des problèmes qui ont interrompu cette communication. Cette perturbation du trafic réseau a eu un effet en cascade sur la façon dont nos centres de données communiquent, entraînant l’arrêt de nos services.

Il a fallu beaucoup de temps pour résoudre le problème. Car les systèmes inaccessibles comprenaient les serveurs et les outils que les ingénieurs utiliseraient normalement pour résoudre le problème à distance. Les rapports suggèrent que les employés de niveau inférieur devaient accéder physiquement aux centres de données. Puis s’appuyer sur les instructions étape par étape d’ingénieurs plus expérimentés afin de réparer l’erreur. Pour compliquer les choses, l’indisponibilité des réseaux signifiait que les systèmes d’accès aux portes de Facebook étaient également hors ligne, empêchant physiquement l’accès.

Comment comprendre la panne de Facebook

Nous aurons sans doute toute l’histoire avec le temps sur la cause de la panne facebook. Mais le consensus qui se dégage est que le problème était un mélange de configuration de serveur de nom de domaine (DNS) et de protocole de passerelle frontière (BGP).

La meilleure analogie que j’ai vue est de considérer le trafic réseau comme des avions. Votre appareil veut voler vers Facebook.com. Votre avion doit d’abord connaître les coordonnées GPS de l’aéroport de destination. C’est-à-dire l’adresse IP à laquelle il doit se connecter. Il obtient cette information en demandant à un DNS, qui lui dit que Facebook.com est situé à (par exemple) 66.220.144.0.

Mais arriver à la destination finale, le serveur réel qui peut effectuer la tâche que vous voulez faire, repose sur une sorte de système de contrôle du trafic aérien pour le trafic réseau, et c’est le BGP. Le BGP indique à votre appareil quelle route suivre à travers les différents serveurs en route vers votre destination finale.

Il semble que Facebook ait complètement perdu ses systèmes BGP. Il n’y avait donc aucun moyen pour Facebook de dire aux appareils comment atteindre leur destination. Et cela incluait les propres ingénieurs de Facebook atteignant les systèmes dont ils avaient besoin pour réparer l’erreur.

De plus, une source bien informée suggère qu’il n’y avait aucun problème avec le DNS de Facebook en soi. C’était plutôt que la perte de BGP signifiait qu’il n’y avait aucun moyen d’atteindre les serveurs de noms de domaine de l’entreprise.

La panne a des implications énormes

S’il ne s’agissait que de personnes incapables de publier des vidéos de chats pendant quelques heures. Ce serait une chose (mais, allez, qu’est-ce que la vie sans vidéos de chats ?). Mais WhatsApp est effectivement un élément essentiel de l’infrastructure de communication dans de nombreux pays. Couramment utilisé pour la communication entre les patients et les médecins, par exemple, et utilisé par beaucoup pour les paiements.

La panne prolongée a attiré l’attention sur la vulnérabilité du monde entier aux défaillances de cette nature.

Par exemple, des millions de personnes comptent sur les serveurs DNS de Google pour atteindre tous les serveurs de la planète. Imaginez que ces serveurs tombent en panne pendant une période prolongée. Cela n’affecterait pas seulement les consommateurs, cela perturberait le commerce et les infrastructures critiques. Production en usine, transport de flotte, vente au détail… les travaux.

Le monde entier dépend de manière critique d’un nombre relativement restreint de serveurs. Ce qui pourraient tous être mis hors ligne par une erreur du genre de celle qui s’est produite ici. Il faut beaucoup réfléchir à la façon dont nous prévenons une panne d’Internet beaucoup plus importante à l’avenir.

À vous

Réservez votre nom de domaine et choisissez la solution d’hébergement de site web en Tunisie qui vous convienne.




Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *



back to Top