[Gfoss] [OT] NAS che manda in crash un server...è possibile?

a.furieri a lqt.it a.furieri a lqt.it
Dom 12 Giu 2016 20:46:59 CEST


On Sun, 12 Jun 2016 19:23:22 +0200, Giuseppe Naponiello wrote:
> Salve a tutti,
> so che sono nella lista sbagliata e vi giuro che mi scoccia scrivere 
> post
> OT ma, quando cerco risposte che non trovo altrove, so che qui 
> qualche buon
> consiglio lo raccatto sempre!!!
> La domanda è nell'oggetto, ora vi do qualche dettaglio in più!
> Ho un NAS Qnap da 8 bay, configurato con RAID6, ho montato una 
> cartella sul
> server principale (debian 8), mi serve per salvare i file che gli 
> utenti
> caricano, per fare un po' di backup, ecc.
> Ad un certo punto il serve va in down e nessuno accede più al 
> servizio web.
> Non ho accesso "fisicamente" all'hardware in quanto ospitati in un 
> CED da
> un'altra parte...i tecnici, dopo mia segnalazione, mi dicono che tre 
> dischi
> del NAS si sono rotti e questo ha mandato in crash anche il server, 
> senza
> dare altre spiegazioni un po' più dettagliate!!!!
> Confesso la mia ignoranza in materia ma mi sembra un po' strano visto 
> che
> già in un'altra occasione si erano rotti dei dischi del NAS e non era
> successo niente al server.
> Per completezza vi dico che mi erano arrivati messaggi di warning dal 
> NAS
> relativi al surriscaldamento di alcuni dischi...che forse ho 
> sottovalutato!
> Quindi, è possibile una situazione come quella che vi ho descritto?
> Se si, potete spiegarmi tecnicamente cos'è successo?
> E poi, secondo voi è normale che in nemmeno 2 anni è stato necessario
> cambiare 6 dischi?
> Grazie, e scusatemi ancora per l'OT ;)
>

e' praticamente impossibile che il software possa resistere
indenne ad un severo malfunzionamento hardware.
le conseguenze possono essere le più svariate ed hanno natura
intrinsecamente casuale e ben poco riproducibile, ma e' assolutamente
certo che un componente HW gravemente malfunzionante provocherà
danni piu' o meno seri.

strutture ridondanti come i RAID possono resistere ragionevolmente
a guasti che interessano una singola unità disco, ma franeranno
rovinosamente se il guasto colpisce direttamente l'elettronica di
controllo.
e comunque, anche gli schemi RAID più' sofisticati sono progettati
per  resistere ad un singolo malfunzionamento, che richiede
quindu sempre una immediata e tempestiva riparazione del guasto.
se arrivi ad accumulare ben tre malfunzionamenti simultanei
finisci ben al di la delle capacità di recupero di qualsiasi RAID.
ma anche un singolo chip di RAM malfunzionante puo' innescare
catene di eventi assolutamente perniciosi.

molto spesso, guasti di questa natura sono la diretta conseguenza
dell'uso di componenti esageratamente economici e di bassa
qualità, oppure derivano da un'installazione fisica gravemente
inadeguata, con un impianto elettrico fuori norma e/o con condizioni
termiche di costante surriscaldamento.

condizioni peraltro abbastanza comuni e tipiche di molte
situazioni "fai da te", in cui pare assolutamente ovvio e
naturale stipare tutti assieme numerosi server e relativi
apparati di rete all'interno di un angusto sgabuzzino delle
scope del tutto privo di ventilazione e sprovvisto di
aria condizionata.

un caso di questo genere di cui sono personalmente a
conoscenza fini' addirittura con un bell'incendio nel
cuore della notte che distrusse l'intero ufficio e che
mise seriamente a repentaglio la stessa stabilita'
strutturale dell'edificio.

insomma, la moderna elettronica e' sicuramente molto
affidabile, ma non puo' certo reistere alle scellerate
conseguenze di un'installazione errata in un ambienete
fisico del tutto inadeguato; le sale macchine "serie"
sono attrezzate in ben altro modo.

(oltre a qualche zilione di ulteriori possibili cause
piu' o meno improbabili ed imprevedibili che quando si
dice che la sfiga si accanisce ... vai un po' a sapere)

ciao Sandro


Maggiori informazioni sulla lista Gfoss