Atc Milano down


Io mi chiedo invece se questi backup ed il loro scambio con il servizio "titolare" vengano mai testati realmente creando un guasto critico (spengo il nodo di rete e vedo se il backup interviene) o si facciano solo test "soft" per non rischiare di bloccare tutto il sistema (dubito si possa organizzare un test reale su un sistema come l'ATC di mezza Italia, metti che poi svampa qualcosa? )..
 
Io mi chiedo invece se questi backup ed il loro scambio con il servizio "titolare" vengano mai testati realmente creando un guasto critico (spengo il nodo di rete e vedo se il backup interviene) o si facciano solo test "soft" per non rischiare di bloccare tutto il sistema (dubito si possa organizzare un test reale su un sistema come l'ATC di mezza Italia, metti che poi svampa qualcosa? )..

Di solito hai un team di incident management che testa queste cose (1 o 2 volte all'anno). Poi, sappiamo che alle nostre latitudini e' sempre meglio curare che prevenire, soprattutto se non hai ridondanza piena. Il guasto di internet del 2023 non ha insegnato niente mi sa, e mai insegnera' - l'importante e' fare caciara per 2/3 settimane e dimenticarsi delle azioni correttive, soprattutto nel pubblico. In aggiunta, l'estate e' alle porte quindi, se qualcuno deve fare qualcosa, se ne riparlera' a settembre. Del duemilamai.
 
Almeno prima capiamo se ci sia stata negligenza o colpa grave, sennò davvero non ha senso parlare di Just culture etc...
borders.jpg
Non sono un forcaiolo e ti prego di notare che il mio quote era unicamente riferito alla certezza della pena in Italia.
Che se a te risulta che esista allora viviamo in due paesi diversi.
Sul singolo caso non esprimo giudizi, osservo e vedo una nazione con l’AV ennesimamente ferma, rete autostradale con gente che brinda quando crolla un ponte, TPL al collasso etc etc…
Chiamiamolo qualunquismo se vuoi/volete, io mi sarei comunque rotto abbastanza i coglioni dell’andazzo. Per il quale , appunto, nessuno paga.
Ah si, il chiodo si!
 
Da articoli di stampa Tim dice che non è il solo provider, ma ce ne sono altri e che loro (Tim) non c’entrano. Vediamo cosa salta fuori.
Comunque si fa troppa cagnara: quando c’è di mezzo la tecnologia qualcosa può sempre andare storto. Non facciamone un dramma. Shampoo, bigodini…chiacchiere da parrucchiera…


Sent from my iPhone using Tapatalk
Spero ti renda conto, amico mio, che ci stiamo sempre più impregnando di assuefazione al “e vabbè, succede…”
E mi risulta, tanto per non essere tacciato di qualunquismo un tanto al chilo, che l’Italia sia costantemente tra le prime al mondo per ciò che non funziona e tra le ultime per ciò che funziona.
Poi oh, ai masochisti può anche piacere così eh, per carità !
 
Non sono un forcaiolo e ti prego di notare che il mio quote era unicamente riferito alla certezza della pena in Italia.
Che se a te risulta che esista allora viviamo in due paesi diversi.
Sul singolo caso non esprimo giudizi, osservo e vedo una nazione con l’AV ennesimamente ferma, rete autostradale con gente che brinda quando crolla un ponte, TPL al collasso etc etc…
Chiamiamolo qualunquismo se vuoi/volete, io mi sarei comunque rotto abbastanza i coglioni dell’andazzo. Per il quale , appunto, nessuno paga.
Ah si, il chiodo si!
Certezza della pena se siamo nel range giusto. Altrimenti mi aspetterei, eventualmente, dimissioni (o licenziamenti) a raffica e modifiche di sistema.
Che nessuno paghi, o meglio: si assuma la responsabilità (accountability) e faccia fagotto siamo d'accordo, in Italia campa cavallo... ( a partire dal ministro).
Perché la Just Culture, no blame policy etc... sono un po' come la democrazia: bisogna difenderli ad ogni costo, anche a costo di noi stessi.
 
Ultima modifica:
Io insisto che per evitare il lassismo sul lavoro non servono licenziamenti e crocifissioni, ma sono necessari shampate e tensione continua sul risultato, se si crea il clima evvabbe' siamo i mejo chissefrega chisseimporta avrai tutta la linea gerarchica lassista fino al piu' umile esecutore. Tra pene feroci e scazzo totale ci sono vie di mezzo. Anzi sono le vie di mezzo che incentivano una corretta cultura del lavoro. Pero' in questo caso non sappiamo probabilmente non c'e' scazzo ed e' stato comunque un fenomeno difficilmente prevedibile, gli errori sono umani e la sfortuna capita. Pero' cazziare sul serio gli interessati non uccide nessuno anzi magari fa si che non resti ucciso nessuno se si spengono i sistemi dove ci sono meno margini di recupero. Ogni riferimento ad altri importanti attori dell'industria aereospaziale non e' del tutto casuale. Anzi anche altri settori, con primarie assicurazioni che dovrebbero dare senzaione di assoluta solidita', che gli crolla l'insegna sul grattacielo in una giornata di sole manco un temporale.

Comunque quel comunicato stampa non e' piaciuto.
 
Spero ti renda conto, amico mio, che ci stiamo sempre più impregnando di assuefazione al “e vabbè, succede…”
E mi risulta, tanto per non essere tacciato di qualunquismo un tanto al chilo, che l’Italia sia costantemente tra le prime al mondo per ciò che non funziona e tra le ultime per ciò che funziona.
Poi oh, ai masochisti può anche piacere così eh, per carità !
Non ho detto questo: ho detto che al momento sono tutte chiacchiere da parrucchiera tra chi cerca a tutti i costi subito e i forcaioli.
Dimmi tu se per ogni tech failure in UA ci sono cambi di fornitori o licenziamenti di massa.

Come molti hanno detto, aspettiamo il report.
Oh, poi val bene dire anche che in Italia son tutti ct e ignegneri in telco....
 
  • Like
Reactions: Paolo_61
servirebbe avere almeno il doppio carrier. ma per davvero perché a volte tu compri da due fornitori, ma poi sotto sotto ti trovi in alcuni punti della rete la stessa terza parte :)
E' quello che spiegavo a un mio cliente: tu puoi avere anche ventordici connessioni di backup, ma se tutte arrivano allo stesso armadio, che poi viene buttato giù da un camion in manovra (successo veramente con un altro cliente)...
 
  • Like
Reactions: BrunoFLR and RMI
Non ho detto questo: ho detto che al momento sono tutte chiacchiere da parrucchiera tra chi cerca a tutti i costi subito e i forcaioli.
Dimmi tu se per ogni tech failure in UA ci sono cambi di fornitori o licenziamenti di massa.

Come molti hanno detto, aspettiamo il report.
Oh, poi val bene dire anche che in Italia son tutti ct e ignegneri in telco....
Per ogni tech failure che possa essere cagionato da imperizia, superficialità, negligenza o ripetitività?
Garantito .
La differenza è nel “being fired” rispetto al “machissenefrega”

EDIT: aggiungo che in una lunga serie di verifiche/test/learning interni dobbiamo sottoscrivere piu' clausole, dove le violazioni "...may lead up and to job termination"
 
Ultima modifica:
o non c'era un'effettiva ridondanza fisica e logica delle reti, oppure problema della lan interna
 
Come scritto in altro 3d, il modello di ridondanza deve essere corretto.

Se hai anche 10 wan in failover/link aggregation ma sono tutte collegate alla stessa power supply o il router e' unico se la sciura ti stacca la spina ramazzando si spengono tutte.

Se hai due motori e metti carburante marcio o va in blocco il software, la probabilita' di anomalia contemporanea dei due non e' quella che hai calcolato.

Esempi scemi ma non del tutto casuali.
 
  • Like
Reactions: East End Ave
Come scritto in altro 3d, il modello di ridondanza deve essere corretto.

Se hai anche 10 wan in failover/link aggregation ma sono tutte collegate alla stessa power supply o il router e' unico se la sciura ti stacca la spina ramazzando si spengono tutte.

Se hai due motori e metti carburante marcio o va in blocco il software, la probabilita' di anomalia contemporanea dei due non e' quella che hai calcolato.

Esempi scemi ma non del tutto casuali.

In soldoni, quindi, ci servono:

1. Piu' criceti a far girare la ruota
2. Piu' ruote (e criceti) connesse alla dinamo
3. Piu' dinamo con corollario di ruote e criceti


:D
 
I singoli elementi che se si rompono fanno fallire tutto in informatica si chiamano "single point of failure". Sarebbe bene che non ce ne fossero, che tutto fosse almeno doppio. Pero' io tendo a vederla da informatico. Comunque gli shuttle avevano 5 computer. 4 di questi lavoravano in parallelo e si controllavano tra loro. Il quinto usava un software diverso sviluppato separatamente ed era in grado di sostituire i primi 4.
 
  • Like
Reactions: 13900
Dare la colpa a TIM e' facile, conoscendo bene le sue dinamiche
Dubito che che il controllo aereo del nord Italia si sia bloccato perche' le vespe hanno fatto il nido in un box di connessione
 
Di solito hai un team di incident management che testa queste cose (1 o 2 volte all'anno). ..

Ok, ma questi test sono realistici o vengono addolciti per non trovarsi con un vero down del servizio?

Esempio.. per testare il generatore diesel prendo ed apro brutalmente l'interruttore di alimentazione o avvio prima il gruppo e poi gli passo la parte di utenze meno sensibili, giusto per vedere se regge il carico?
 
Ok, ma questi test sono realistici o vengono addolciti per non trovarsi con un vero down del servizio?

Esempio.. per testare il generatore diesel prendo ed apro brutalmente l'interruttore di alimentazione o avvio prima il gruppo e poi gli passo la parte di utenze meno sensibili, giusto per vedere se regge il carico?
Non ho mai fatto queste cose ma quando lavoravo dentro infra le vedevo indirettamente. Di solito funzionava cosi': dopo un'attenta analisi per capire cosa poteva andare in down, il team faceva cose abbastanza "brute", ad esempio staccare una fibra per simulare un taglio o staccare una spina per simulare mancanza di corrente. La mia esperienza nel campo e' quindi limitata pero' se lo scopo e' di simulare un problema, addolcire la situazione non e' lo scenario ideale perche' non rispecchierebbe la realta'.