I problemi succedono a tutti, storia di SeeWeb

Scrivo velocemente questo post, anche se sono “impicciato” nei miei soliti viaggi, ma non volevo lasciare cadere nel vuoto questa cosa.
Non so se lo sapete, ma SeeWeb -uno dei piu’ grandi housing/hosting provider italiani- ha avuto un disservizio piuttosto “pesante” il 18 Gennaio in uno dei datacenter. La marketing manager di SeeWeb ha spiegato in un post l’accaduto:
https://blog.seeweb.it/a-quanti-anni-corrispondono-34-anni-ibm/
Giusto per evitare possibili fraintendimenti, premetto che conosco personalmente sia il proprietario di SeeWeb e alcuni dei suoi tecnici senior, ma non sono in alcun modo coinvolto nella società, ne ho rapporti se non di amicizia e come cliente.
Ho sentito tantissime critiche rivolte a SeeWeb ed alcuni dei suoi tecnici in modo personale (o peggio attacchi), sia sui social networks che in varie discussioni.
Come sapete, ho contribuito a molti progetti di grosse dimensioni, fino ad arrivare a gestire centinaia di migliaia di sistemi, e vi posso assicurare che shit happens, ovvero i casini accadono. Punto.
A tutte queste persone che hanno criticato vorrei far gentilmente notare che e’ facile puntare il dito verso qualcun altro senza non aver mai “rischiato” in prima persona, ne aver gestito un servizio, soprattutto a gente che al massimo avrà gestito qualche decina di server nella sua vita (se va bene).
L’unica cosa che posso imputare a SeeWeb e’ stata l’ingenuita’ di aver creduto ad un vendor. E’ una classica cosa che vedo fare, ovvero “tanto mi supporterà qualcuno”. E infatti IBM li ha supportati e ne sono venuti fuori, ma una SAN e’ comunque un single point of failure sullo storage. Ridondato quanto vuoi, se vanno giu’ entrambe le controller, ti ritrovi in questi pasticci. E vi assicuro che non sono gli unici e non solo con IBM.
Quello su cui invece vorrei far riflettere sono due cose, ovvero i vendor e i clienti.
Da una parte i vendor sono sempre piu’ legati al mercato e poco al prodotto. Una volta aver comprato IBM (o HP, Dell, Hitachi,….) significava comprare della qualità. Per chi lavora in un vendor non e’ una sorpresa, purtroppo si sa che si sono dovuti piegare alle dinamiche del mercato, ovvero non e’ il prodotto o il cliente che comanda, e’ Wall Street. Si aspettano ritorni ogni quarter o fiscal year, quindi c’e’ la corsa a “tirare fuori” sul mercato nuovi prodotti/servizi, a scapito di capire se questi prodotti sono veramente pronti per essere immessi sul mercato. Complice il fatto che molte cose siano fatte in software, spesso ho sentito dire nei vendor “lo sistemiamo dopo con un update” o con una fix hardware after market. E succedono danni come quelli successi a SeeWeb (disclaimer: non ho i dati tecnici e quindi non posso discutere il caso). Spesso quindi i problemi vengono risolti dai clienti stessi e dai ragazzi del supporto del vendor che solitamente sono volenterosi, insieme al supporto L3 (chi scrive il codice), che sempre più soffrono questa pressione.
Dall’altra parte vorrei fare riflettere i clienti. Esiste il tipo del cliente che non e’ del mestiere, posso capire che probabilmente ha comprato e non aveva esattamente gli strumenti per decidere. Questo cliente e’ nel caso che anche se va giu’ qualcosa magari non ti importa più di tanto, oppure se e’ pensa che sia critico per proprio business consiglio di affidarvi ad un vero consulente (e non quelli che fanno le “supercazzole”). Il caso diverso e’ invece quel tipo di cliente -o peggio al consulente del cliente- che ha delegato troppo all’infrastruttura e a terze parti, scordandosi che i problemi possono capitare a tutti, anche ad Amazon o Microsoft, oppure per far contento il cliente per “risparmiare” perche’ non c’e’ budget. Ultimo caso, il cliente ha una infrastruttura non critica per il proprio business e mette dove costa di meno, e anche se va giu’ ”sticazzi”.
Qualsiasi sia il caso, e’ sempre bene tenere in tasca un “Piano B”, che sia un piano di Business Recovery o Business Continuity dipende dal tipo di business che un’azienda abbia e che servizi sta erogando. Anche se un eventuale down non e’ critico per il proprio business, e’ bene sempre avere una copia off-site vendor-neutral dei propri dati, anche nel caso il service provider abbia gravi inconvenienti (mi ricordo una volta un camion entrato in datacenter con enormi danni). A fronte di qualsiasi danno, temporaneo o prolungato, il cliente ha sempre la possibilità di aspettare o decidere di ripristinare i propri sistemi anche da un altra parte. Se invece e’ uno dei clienti che ha bisogno dei propri sistemi sempre “up”, allora vi consiglio di avere una strategia multi-cloud (anche active-active) con le applicazioni che siano in grado di replicare i dati in maniera istantanea.
Non e’ difficile avere un piano di Business Recovery o Continuity, ne ci sono costi enormi, soprattutto se pensate a quanto vi costerebbe un down. La gestione del rischio e’ una forma mentis che purtroppo pochi hanno, cosa che ahime’ anche il caso di SeeWeb ha dimostrato.

2020-01-24