AWS-avbrott påminner oss om att internets öde vilar i händerna på ett fåtal

AWS-avbrott påminner oss om att internets öde vilar i händerna på ett fåtal

Vid den tiden driver vi webbplatser från personliga och företagsservrar, ofta placerade i våra hem och kontor. När internet växte byggde vi serverrack, platser och datacenter. Men med tiden har företag och tjänster av alla storlekar laddat av serveroffren till tredje part, eller som de nu kallas, molntjänster.

Logiken är sund. Vi bor i hus, men vi bygger inte fysiskt våra hus. Handlingen att betjäna och utveckla webbplatser är inte avgörande för den tjänst de tillhandahåller. Tja, det är som om det inte finns någon tjänst utan servrar. Men servern körs genom API:er, skript och andra algoritmer och program som utvecklats av företaget för att ge dig saker som din Netflix-ström, dina Coinbase-plånbokskontodetaljer eller nästa potentiella Tinder-användare.

Möjligheten hos molntjänster som Amazon Web Services (AWS) och Microsoft Azure att skala upp snabbt (eller skala ner efter behov) gör det till ett smart affärsbeslut för företag av alla storlekar. Man vet till exempel aldrig när ett litet företag blir ett stort företag och när det måste betjäna tio användare samtidigt istället för femhundra.

Detta är den uppenbara fördelen med molnbaserade webbtjänster. Nackdelen är vad som hände den här veckan med AWS.

AWS-fel

Enorma bitar av AWS föll isär tisdagseftermiddagen. AWS Health-instrumentpanelen ger en bra översikt över det nästan 7 timmar långa avbrottet. I bakgrunden var det inte, åtminstone enligt Amazon, en attack, hack eller denial of service attack (DDoS). Det var ett par API:er som inte skötte sig i en massiv tjänsteindustri.

Vi lever alla i rädsla för en större DDoS-attack eller en attack som kommer att bryta mot dessa system (faktiskt alla system vi är beroende av) och få dem på knä, men det gör det sällan. När Cloudflare gick ner XNUMX accepterades det initialt som en attack på deras system. Vi upptäckte dock snabbt att det helt enkelt var en dålig mjukvaruimplementering, främst ett mänskligt misstag.

Även med AWS-avbrottet i vad Amazon kallar "US-EAST-1-regionen", har effekten varit betydande och utbredd. Detta har känts på konsumentinriktade plattformar som Disney+ och, naturligtvis, Amazon.com och vissa Alexa-tjänster.

När jag postade den aktuella på Twitter, uppskattade jag hur många människor som praktiskt taget slog huvudet i ansiktet och utbrast, "Därför var jag ute!"

Det slog mig att många av dessa användare inte hade någon aning om att AWS låg bakom deras föredragna användare och affärssystem. Utöver detta har ingen det exakta antalet (förutom Amazon), men färska rapporter hävdar att AWS betjänar miljontals människor. Microsofts Azure rapporterar också miljontals användare och de flesta av Fortune XNUMX-företagen. Google Cloud har stora namn som Verizon, NewsCorp och Facebook.

Måste något förändras?

Utbredd användning av molntjänster är inte en dålig sak, men brist på information kan leda till förvirring och fingeravtryck, som killen som inte kunde ändra kommandona på sitt system och fick flera felmeddelanden som skyllde sina system på en tredjepartsleverantör. som AWS).

Kombinationen av molnsystemens omfattande räckvidd och den allmänna bristen på realtidsinformation och feedback för berörda tjänstekunder är anledning till oro. Omfattningen av varje blackout är säkert oroande, särskilt med tanke på att nästa är oundviklig.

Förbi är de dagar då någons serverrack skulle misslyckas och webbplatsen skulle misslyckas. Vi har nu små avbrott i stora molnsystem som AWS, Axure och Cloudflare som orsakar en tsunami av avbrott.

Någon på Twitter frågade: "Vad hände med skalning och lastbalansering?" "Det är en bra fråga. AWS är byggt på hundratals separata molnserverkluster och erbjuder massor av redundans, skalning och lastbalansering. Och återigen, ibland räcker det inte. Komplexa system kan uppträda fel och är särskilt ömtåliga för programvaruuppdateringar som kan kollidera med föråldrad kod På grund av det faktum att så kraftfulla och distribuerade som alla dessa molntjänster är, inklusive AWS, så är de fortfarande programmerade, drivs och underhålls av felbara människor.

Så hur kan vi bättre utbilda allmänheten och, ännu viktigare, isolera AWS, Azure, Cloudflare och andra från den här typen av misslyckanden, som inte bara resulterar i nedskjutna webbplatser och tjänster, utan snarare i förlust av miljontals människor? Amerikanska dollar?

Det kanske är dags att ta ett steg tillbaka och undersöka molnsystemens integritet och säkerhet, på exakt samma sätt som vi övervakar vattensystem. Ingen av dem är för stor för att misslyckas, verkar det som, men alla är för viktiga för att skadas, kränkas eller förloras.