Jump to content
Sign in to follow this  
tecnolive

Serverplan Cloud down già da 2 ore

Recommended Posts

Ciao a tutti,

 

Stiamo riscontrando downtime nella struttura cloud di serverplan già da 2 ore. Non risponde più nulla, nemmeno la loro interfaccia di gestione cloud.

I tecnici non ci danno nessun dettaglio sulla problematica....

 

Qualcuno sa qualcosa ?

Share this post


Link to post
Share on other sites

Non ho una VM, sono su uno shared fatto sul loro cloud, facendo un paio di tracert direi nodo #2.. uhm, fortuna che non c'è roba importante :cartello_lol:

Share this post


Link to post
Share on other sites

Per sfortuna noi abbiamo un software molto importante con centinaia di clienti che lo utilizzano. Adesso faccio una recensione completa xkè è da molto xkè lo utilizziamo da un paio di mesi, ma praticamente è più offline che online.

Share this post


Link to post
Share on other sites

beh, sul loro sito c'e' scritto che hanno ridondanza dei server, quindi presuppongo che nel caso di guasto di uno dei nodi, il sistema automaticamente avrebbe dovuto avviare la vm su un altro nodo.

 

andrebbe capito, quindi, perche' non ha funzionato l'alta affidabilita' che paventano.

 

ti linko una cosa interessante scritta da GrG:

Design for Failure. | Giorgio (GrG) Bonfiglio

 

in sostanza, bisogna tenere presente che le infrastrutture possono morire e che bisogna cercare di tamponare facendo da se' l'alta affidabilita'.

 

ricordo di un problema analogo in seeweb in cui ha preso fuoco lo chassis dei blade: il loro sistema di alta affidabilita' ha cosi' fallito e i clienti son rimasti con le VM spente per un po' di ore.

Share this post


Link to post
Share on other sites
beh, sul loro sito c'e' scritto che hanno ridondanza dei server, quindi presuppongo che nel caso di guasto di uno dei nodi, il sistema automaticamente avrebbe dovuto avviare la vm su un altro nodo.

 

andrebbe capito, quindi, perche' non ha funzionato l'alta affidabilita' che paventano.

 

Quoto e straquoto, il problema è che mi sa che di ridondanza non hanno proprio nulla... e comunque non dicono neppure il motivo per cui l'HA non ha funzionato.

 

Se vuoi ti faccio leggere i ticket e sono davvero imbarazzanti ... il mese scorso oltre 6 ore e passa di down complessive.... allora al ticket ci rispondono che non aveva funzionato il live-migration e che dovevano capire qual'era stato il problema.

 

Ci fu una notte che il loro sistema fu down altre 2 ore piene e noi, non avendo il controllo del downtime abbiamo perso dei dati XML molto importanti.

 

Ieri dopo 3 ore di down gli abbiamo chiamato e abbiamo chiesto la motivazione per cui non si era attivato un altro nodo, sapete cosa ci hanno risposto ? ..... "perchè nel vostro nodo c'è stato un problema" ..... secondo voi è una risposta questa ?. Gli abbiamo chiesto info circa il loro sistema di cloud, e ci hanno risposto "il problema è stato risolto" ..... che non centra proprio nulla con la domanda.

 

Ripeto, è tutto documentato tramite il loro ticket system, se volete vi faccio leggere i ticket in privato, giusto per farsi 4 risate....

 

C'è gente che dice di aver avuto anche 7 ore di down con la loro piattaforma cloud, ma non entro nel merito e nemmeno mi interessa, però sinceramente non pensavo che avevano tutti questi problemi visto e considerato che è valutato come uno dei migliori provider in Italia.

 

Da quando siamo nella loro cloud siamo stati più offline che online. E' davvero frustante come cosa.

Share this post


Link to post
Share on other sites
Quoto e straquoto, il problema è che mi sa che di ridondanza non hanno proprio nulla... e comunque non dicono neppure il motivo per cui l'HA non ha funzionato.

questo non lo sappiamo, dovrebbero far loro una postmortem analysis e magari rendere pubblico il problema, come fanno le aziende di un certo peso...

 

Se vuoi ti faccio leggere i ticket e sono davvero imbarazzanti ... il mese scorso oltre 6 ore e passa di down complessive.... allora al ticket ci rispondono che non aveva funzionato il live-migration e che dovevano capire qual'era stato il problema.

se ti va di girarmeli in privato sarei curioso di leggerli, si'.

 

Ci fu una notte che il loro sistema fu down altre 2 ore piene e noi, non avendo il controllo del downtime abbiamo perso dei dati XML molto importanti.

 

Ieri dopo 3 ore di down gli abbiamo chiamato e abbiamo chiesto la motivazione per cui non si era attivato un altro nodo, sapete cosa ci hanno risposto ? ..... "perchè nel vostro nodo c'è stato un problema" ..... secondo voi è una risposta questa ?. Gli abbiamo chiesto info circa il loro sistema di cloud, e ci hanno risposto "il problema è stato risolto" ..... che non centra proprio nulla con la domanda.

 

Ripeto, è tutto documentato tramite il loro ticket system, se volete vi faccio leggere i ticket in privato, giusto per farsi 4 risate....

a parte cambiare fornitore visto che non ti sei trovato bene, devi pensare a sviluppare l'applicazione in modo tale che sia resistente ad un down: potresti spalmare l'applicazione su piu' server e' fare in modo che funzioni indipendentemente da quale server viene contattato.

Share this post


Link to post
Share on other sites

Please sign in to comment

You will be able to leave a comment after signing in



Sign In Now
Sign in to follow this  

×