Il ripristino informatizzato degli impianti complessi

Disaster recovery

La maggiore complessità degli impianti e il crescente ricorso a soluzioni di automazione sofisticate fanno sì che i guasti dei sistemi automatizzati possano influire sulla produzione esattamente come un disastro fisico. Inoltre, la maggiore complessità delle stesse soluzioni di automazione rende le operazioni di ripristino di un impianto un obiettivo sempre più impegnativo da raggiungere. Per far fronte a questa situazione, la software house statunitense Pas ha deciso di associare i suoi servizi di consulenza indipendente ad un nuovo prodotto software con funzioni estese di disaster recovery per i sistemi di automazione.

Oggi, le tecnologie di automazione industriale all'avanguardia comprendono sistemi molto diversi tra loro come Dcs, plc, Sis e programmi per la creazione di database storici, progettati separatamente per compiere lavori specifici e in un secondo momento integrati fra loro per interagire costantemente e provvedere al buon funzionamento degli impianti. Questi sistemi sono in continua evoluzione, in quanto si tratta di piattaforme che partecipano al continuo miglioramento dei processi produttivi. Pertanto, il valore dei tempi di ingegnerizzazione e del lavoro di configurazione e gestione delle modifiche spesso supera il costo del sistema vero e proprio. La conservazione di queste risorse è fondamentale per poter ripartire entro tempi brevi in caso di disastro.

Sovente le procedure di disaster recovery sono complicate dal fatto che i singoli sistemi vengono gestiti da enti diversi di uno stesso stabilimento. Ad esempio, i programmi e le procedure di backup variano in base ai reparti, quindi è difficile garantire immagini di ripristino sincronizzate per tutti i singoli sistemi in caso di disastro. Dato l'elevato grado di integrazione e interoperabilità, il ripristino dei singoli sistemi a partire da immagini non sincronizzate potrebbe comportare problemi di riavvio, ritardi e spese aggiuntive.

Esempi concreti

In previsione dell'arrivo di un uragano, una delle maggiori compagnie petrolchimiche americane decise di spegnere il sistema Dcs di uno dei propri siti per ridurre i danni in caso di inondazione. Senza che i responsabili del sito ne fossero a conoscenza, il sistema di backup del Dcs era disattivato da un anno. Durante il riavvio dell'impianto, emerse che tutte le modifiche apportate al Dcs nell'ultimo anno erano andate perse, ed occorsero centinaia di ore di lavoro per analizzare la documentazione di gestione delle modifiche in modo da ricostruire il database. Il risultato furono perdite di produzione per oltre una settimana.

L'elaborazione di un programma di disaster recovery

La strategia di disaster recovery dei sistemi di automazione riveste enorme importanza, quindi deve essere pianificata con attenzione. Se i programmi di disaster recovery riguardano condizioni tra cui rientrano anche le calamità naturali come quella appena descritta, non dobbiamo dimenticare che nella maggior parte dei casi il loro intervento è richiesto per situazioni piuttosto banali. Perdite dai tetti, fulmini, incidenti ed errori umani che vanno ad influire sui sistemi di automazione sono eventi abbastanza frequenti, ma pianificando adeguatamente le situazioni più gravi sarà possibile affrontare anche le condizioni meno drammatiche.
Si potrebbe pensare che i principi sui cui basare una strategia di disaster recovery per le risorse informatiche (server, workstation, mainframe) riguardino totalmente i Dcs e simili risorse di automazione. Non è esattamente così. Anche se molte parti di un Dcs possono basarsi su una tecnologia informatica standard, la struttura e le configurazioni sottostanti presentano differenze sostanziali che richiedono attenzioni particolari. I sistemi di controllo industriale moderni, per la maggior parte con sistema operativo Windows, contengono configurazioni proprietarie molto diverse a seconda del marchio. Per questa ragione, richiedono metodi e interfacce particolari per la comunicazione, il backup dei dati e il ripristino dei sistemi in tempo reale. Naturalmente, i sistemi di automazione di vecchia generazione presentano sfide ancora più difficili, in quanto spesso funzionano con sistemi operativi completamente chiusi.
Nella maggior parte delle aziende il settore informatico è responsabile delle strategie di ripristino e backup per quanto concerne le risorse convenzionali. Tuttavia, data la loro complessità e specificità, le strategie di disaster recovery dei sistemi di automazione sono solitamente gestite da ingegneri specializzati nel campo. Pertanto, tra le responsabilità che riguardano le risorse informatiche e quelle dei sistemi di controllo esiste di solito una linea di demarcazione che talvolta corrisponde all'interfaccia tra la rete di controllo del processo e la rete aziendale. Per pianificare la gestione dei guasti è importante individuare questa linea.

Dcs, la differenza si nasconde nei dettagli

A prima vista tutti i sistemi di controllo moderni, a prescindere dalla casa che li produce, condividono caratteristiche come l'architettura e il sistema operativo. Le differenze diventano evidenti e significative sono analizzandoli nei particolari. Un programma di disaster recovery dettagliato impone quindi di conoscere profondamente i sistemi di controllo utilizzati. Se le fasi necessarie a creare un programma di disaster recovery per le risorse di automazione sono lineari e adattabili a ogni tipo di sistema, le competenze che occorrono per sviluppare un programma davvero adeguato sono molto specifiche.

L'implementazione di un programma di disaster recovery

Quella che ha sviluppato Pas è una metodologia completa in cinque fasi che permette di elaborare, pianificare e mettere in atto una solida strategia di disaster recovery. Le cinque fasi comprendono: Valutazione del sito e inventario delle risorse di automazione; Studio del processo di acquisizione e ripristino dei dati; Configurazione e collaudo del processo di acquisizione e ripristino dei dati; Implementazione del processo di acquisizione e ripristino dei dati; Monitoraggio, mantenimento e controllo del sistema.

Per mettere in pratica un programma di disaster recovery, innanzitutto il team di Pas esamina tutte le risorse di automazione di uno stabilimento e genera un piano di ripristino specifico per il sito. Il piano include tutti i dettagli dei processi di backup e ripristino, oltre a una procedura di ripristino completa per tutti i sistemi di automazione dello stabilimento. La raccolta e l'archiviazione dei dati sono quindi programmate in base alle specifiche esigenze di ciascun sistema utilizzando il software Integrity.
Fanno parte del programma di disaster recovery anche misure essenziali finalizzate a proteggere e convalidare i dati di ripristino man mano che il sistema si evolve. Si definisce quindi un processo di change management per il disaster recovery, che si associa a una convalida della procedura eseguita a intervalli regolari per garantire costantemente la corretta esecuzione del programma. Il software Integrity archivia immagini di backup sia on-site sia a distanza, e ne verifica regolarmente l'integrità per garantirne il corretto funzionamento. Questo consente di riavviare gli impianti in modo rapido, ripristinandone la condizione precedente l'emergenza.
Mettere in atto un programma di disaster recovery completo e garantire l'acquisizione e l'aggiornamento di tutti i dati può essere un processo complesso e impegnativo. Per fortuna, disastri della portata di uragani e inondazioni sono rari, ma gli errori e gli incidenti sono sempre in agguato. Per questo occorre essere preparati.

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome