Nieuws

Facebook: wat gebeurde er in hemelsnaam?

07 oktober 2021

Toen Facebook afgelopen maandag 4 oktober plotseling niet meer reageerde, voelde dat voor sommigen als het einde van de wereld. Anderen voelden zich misschien opgelucht, het is tenslotte maar een sociaal netwerk, toch? De Facebook-familie was onbereikbaar: Facebook, Messenger, WhatsApp en Instagram lagen eruit. Twitter bleef overeind en vermeed daarmee een terugkeer naar de vroege jaren 2000. Maar wat is er die nacht eigenlijk gebeurd met de Facebook-familie?

Wereldwijd werd heel wat gegist en geschreven over de oorzaak van de outage. Het aantal mogelijke verklaringen was talrijk. Je las theorieën over bugs, een opzettelijke uitval en inmenging van buitenaf... De mogelijke verklaringen - talrijk. Alles van bugs tot opzettelijke uitval tot inmenging van buitenaf werd getheoretiseerd. Het antwoord lijkt veel alledaagser te zijn. Zoals Santosh Janardhan, de VP van Infrastructuur bij Facebook, uitlegt: "Tijdens een routineonderhoud werd een commando uitgestuurd om de beschikbaarheid van de wereldwijde backbone-capaciteit te beoordelen. Die legde onbedoeld alle verbindingen in ons backbone-netwerk plat. Daardoor werden Facebook-datacenters wereldwijd effectief losgekoppeld. Onze systemen zijn ontworpen om dit soort commando's na te kijken en dit soort fouten te voorkomen, maar een bug in de audittool zorgde ervoor dat het commando niet gestopt werd."

Maar waarom viel dan alles uit? Alle datacenters van Facebook zijn onderling met elkaar verbonden. Een van de taken van die datacenters is om de weg te wijzen naar de verschillende applicaties van Facebook. Dat heet een Border Gateway Protocol (BGP): een routing protocol dat je browser de weg toont naar een bepaald IP-adres . Door de fout bij Facebook werden de netwerkadvertenties bij Facebook uit het BGP gehaald. Daardoor werden alle datacentra van Facebook losgekoppeld van het internet. Wat volgde, leek op een onbedoelde DDOS-aanval. Aangezien apps en vele consumenten een "error" niet konden aanvaarden. Dit probleem trof internetproviders over de hele wereld, terwijl de technici bij Facebook er alles aan deden om een oplossing te vinden.

Uiteindelijk duurde de aanval maar een paar uur. Het had veel erger kunnen zijn en de technici die het probleem oplosten, verdienen lof voor hun snelheid. Toch legde het een "single point of failure" probleem bloot waar Facebook in de toekomst ongetwijfeld aan zal werken. 

Dit alles toont aan hoe onderling afhankelijk onze wereld is geworden: een "routineonderhoud" in Californië- veroorzaakte problemen en ernstig financieel verlies, van restaurants in Delhi tot modemerken in Ierland.