Il downtime di S3 rilancia le strategie multi-cloud

Quattro ore di downtime per S3 ed altri serivizi AWS riaprono il dibattito sull'affidabilità del cloud e delle strategie "single cloud".

AWS S3 downtime

Aggiornamento 3/3/2017. E’ stato l’errato inserimento di un parametro a causare il disservizio di fine Febbraio. Si può parlare quindi di “errore umano”. Post ufficiale Amazon.

Nella giornata di ieri Simple Storage Service (S3) ed altri servizi Amazon sono rimasti inutilizzabili per diverse ore. La problematica ha colpito nello specifico il data center della popolare region US-East-1 (Nord Virginia), una delle infrastrutture “storiche” del vasto network AWS.

La gravità della situazione è stata indirettamente confermata dalle tempistiche di risoluzione del guasto, circa 4 ore (dalle 9:45 AM PST alle 2:08 PM PST, dalle 18:45 in poi ora italiana), e direttamente dall’impossibilità della stessa Amazon, in un primo momento, di aggiornare lo stato dei servizi nella dashboard AWS – operazione effettuata intorno a mezzogiorno.

Il disservizio ha causato vistosi rallentamenti e/o mandato direttamente offline numerosi portali/servizi. La lista dei brand coinvolti è lunga e mostra l’importanza ricoperta dal provider e dalla region US-East-1 nell’economia statunitense. Citeremo solo alcuni nomi: Docker, Imgur, Quora, Expedia, Citrix, Yahoo, Mailchimp, Chef, Airbnb. Come è possibile constatare dal breve elenco, il downtime ha coinvolto un eterogeneo gruppo di attività. Anche diversi dispositivi IoT hanno avuto seri problemi – sono stati menzionati i device prodotti da Nest.

Le movimentate ore dei tecnici AWS presso il data center in Virginia sono state impiegate anche per ripristinare altri servizi della compagnia: Elastic File System, Elastic Load Balancing, Simple Email Service, Relational Database Service, Lambda, Elastic MapReduce, Elastic Beanstalk.

Le reazioni della Rete tra sarcasmo e riflessioni

AWS tweet

Una dei tanti tweet inviati durante le ore di downtime

Le reazioni al downtime AWS sono state varie. Diversi tweet e news dedicate “all’odissea AWS” hanno ironizzato anche sul downtime di portali utilizzati solitamente per monitorare la disponibilità di altri siti (Is It Down Right Now e DownDetector). I portali The Whir e Data Center Knowledge hanno raccolto una curiosa selezione di tweet inviati da aziende/utenti interessati dai disservizi e da portali specializzati: si va dalla presa in giro/sdrammatizzazione fino alla classica lamentela.

Ma vi è stato anche il tempo per riflettere sull’accaduto. Una delle conclusioni più prevedibili è il potenziale rischio derivante dall’impiego di strategie “single-cloud” (Snapchat, dopo aver dichiarato di appoggiarsi alla sola Google Cloud Platform, ha causato più di qualche preoccupazione tra gli investitori): indipendentemente dalla percentuale di uptime garantita, si potrà sempre verificare qualche imprevisto. Il trend è stato evidenziato da diversi studi ed avvenimenti come il downtime di Amazon spingeranno sempre più aziende a valutare strategie multi-region e multi-cloud.

Al momento Amazon non ha rilasciato alcuna dichiarazione ufficiale in merito alle cause dell’incidente (aggiorneremo eventualmente il post).

Fonti: 1,2,3

 

 

Facci sapere cosa ne pensi!

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *