Nonostante molte aziende stiano cercando di capitalizzare sulle opportunità offerte dall’AI, spesso vengono ostacolate dalle loro infrastrutture IT tradizionali, che non sono adatte ai carichi di lavoro imposti dalla nuova tecnologia. La soluzione è quella di adottare strategie di Cloud Adjacent Storage: ce ne parla Ian Botbyl, Senior Manager, Product Marketing e Gabriel Chapman Director, Storage Solutions di Equinix.
Che cos’è il Cloud Adjacent Storage?
Quali sono i requisiti per sostenere i carichi di lavoro AI? Dipende dalla fase di maturità del modello: quella di addestramento richiede un’enorme capacità di calcolo e disponibilità di GPU, mentre quella di inferenza richiede una latenza molto bassa.
Esiste una strategia che soddisfa entrambi i requisiti: il Cloud Adjacent Storage. Si tratta di una soluzione che permette l’archiviazione distribuita dei dati, interconnettendo le basi di dati in prossimità di più fornitori di cloud in tutto il mondo.
Così facendo è possibile sfruttare i servizi cloud on demand, senza i costi e la flessibilità limitata che potrebbero derivare dall’utilizzo di servizi di immagazzinaggio cloud-native. In questo modo, il Cloud Adjacent Storage è in grado di offrire le prestazioni necessarie per supportare i carichi di lavoro dell’IA senza sacrificare privacy e controllo sui dati.
Il Cloud Adjacent Storage fa per voi? Ecco i 5 punti da tenere in considerazione
Come tutte le nuove tecnologie IT, il Cloud Adjacent Storage richiede una considerazione approfondita dei requisiti di adozione per essere implementato al meglio.
Valutare i requisiti dei dati
I dati sono esigenti. Richiedono spazio di archiviazione adeguato e sicuro, e metodi di accesso veloci e resilienti. Una soluzione di Cloud Adjacent Storage per l’AI efficace deve tenere in considerazione tutti questi fattori e soddisfarli.
Inoltre, è importante tenere in considerazione le caratteristiche specifiche dei carichi di lavoro dell’IA, che possono variare da azienda ad azienda, e da modello a modello. Nonostante la necessità di una bassa latenza sia un dato di fatto, bisogna sempre domandarsi: quanto bassa deve essere? Solo una volta attribuiti valori specifici ai requisiti geografici e di latenza sarà possibile prendere decisioni informate riguardo la posizione dell’immagazzinaggio rispetto alle fonti di dati e ai luoghi di elaborazione.
Pianificare un’integrazione perfetta
L’implementazione del Cloud Adjacent Storage richiede un collegamento solido e sicuro non solo con i vari cloud provider, ma anche con l’impianto in loco e le edge locations. Ciò significa che è essenziale integrarlo nell’infrastruttura ibrida esistente causando il minor numero possibile di interruzioni.
Infatti, il Cloud Adjacent Storage funziona solo se i dati possono circolare liberamente tra i diversi ambienti. Uno dei passi più importanti è proprio pensare come configurare correttamente la propria rete per far sì che i dati si spostino da un punto all’altro, evitando qualsiasi tipo di intoppo come colli di bottiglia che potrebbero esacerbare la latenza, e quindi limitare l’efficacia dei modelli AI.
Una soluzione semplice da impostare e utilizzare è quella di una rete virtuale, in quanto consente di impostare o riconfigurare rapidamente le connessioni in qualsiasi momento.
Ma non basta pensare a come trasferire i dati: bisogna anche sapere quali dati immagazzinare e come farlo, dato che i dati prodotti e ingeriti dai modelli AI sono destinati ad aumentare in modo esponenziale. Da questo punto di vista, l’integrazione di funzionalità di compressione e deduplicazione dei dati nel proprio ambiente di Cloud Adjacent Storage può aiutare a ridurre il carico di archiviazione e quindi a evitare che l’infrastruttura AI si sovraccarichi.
Infine, è sempre vantaggioso affidarsi a fornitori di storage e infrastrutture digitali che abbiano una comprovata interoperabilità, per assicurarsi una transizione il meno onerosa possibile. In molti casi, infatti, i può continuare a utilizzare i sistemi esistenti di altri partner, anziché ricostruirli da zero.
Garantire sicurezza e conformità
Uno dei problemi più evidenti nell’adozione di soluzioni basate su intelligenza artificiale è quello della perdita di proprietà dei dati. Infatti, se dati sensibili vengono utilizzati per addestrare un modello AI, si rischia che le informazioni aziendali contenute potrebbero essere esposte a chiunque utilizzi il modello in futuro, compresi i concorrenti.
Anche qui, il Cloud Adjacent Storage ci dà una mano. Infatti, questa soluzione supporta l’obiettivo di una AI completamente privata offrendo un ambiente riservato e single-tenant per archiviare i dati derivanti dall’intelligenza artificiale.
Per mantenere un approccio sicuro e privato, è necessario lavorare con un fornitore che offra funzionalità di sicurezza avanzate, tra cui una crittografia robusta per i dati a riposo, politiche di controllo dell’accesso sicure, audit di sicurezza regolari per garantire che i dati rimangano protetti nel tempo e capacità di mitigazione di ransomware e DDoS.
La soluzione della rete virtuale, citata in precedenza, torna utile in questo frangente, in quanto permette di spostare il traffico tra le fonti di dati AI, l’infrastruttura di archiviazione e le sedi di elaborazione in maniera sicura.
Ottimizzare le prestazioni
L’obiettivo dell’implementazione del Cloud Adjacent Storage, lo ripetiamo, è quello di trovare le posizioni giuste per ridurre la latenza e accelerare l’elaborazione dei dati per le applicazioni AI.
Una delle caratteristiche dello storage è che ha una relazione ciclica con il successo dell’AI. Infatti, è necessario un sistema di immagazzinamento ad alte prestazioni per supportare i casi d’uso dell’AI, alcuni dei quali possono aiutare a ottimizzare ulteriormente le funzioni dello storage. Facciamo un esempio: gli algoritmi di AI possono aiutare a prevedere quali sono i dataset a cui si accede più frequentemente e quindi a spostarli automaticamente sui livelli di storage più veloci.
Inoltre, per avere una soluzione di Cloud Adjacent Storage efficace, è essenziale ridurre la latenza e ottimizzare le prestazioni nell’intero ambiente AI, non solo da e verso il cloud. Questo significa mantenere lo storage vicino e perfettamente connesso all’infrastruttura per tutti i carichi di lavoro AI, indipendentemente dal fatto che il carico si trovi nel cloud, nel core on-premise o nel digital edge.
Non dimentichiamo che l’ambiente AI è in continua evoluzione, quindi l’ottimizzazione delle prestazioni non deve essere un’operazione sporadica. È necessario monitorare regolarmente lo storage nel corso del tempo e modificarlo in base alle esigenze per continuare a ottenere il livello di prestazioni richiesto dall’ambiente AI.
Considerare scalabilità e flessibilità
Lo storage dei dati stesso deve essere flessibile e scalabile, in modo da potersi adattare ai requisiti imposti dalla quantità crescente di dati creati e richiesti dai modelli AI.
Inoltre, bisogna considerare la compatibilità delle soluzioni di storage adottate con le altre tecnologie: l’utilizzo di una strategia Cloud Adjacent Storage apre infatti le porte all’adozione di nuove soluzioni più avanzate. Prepararsi per tempo a questa evenienza può risparmiare molte fatiche ai team IT dell’azienda.
Ultima, ma sicuramente non meno importante, considerazione è quella della sostenibilità. Collaborare con un partner di infrastrutture digitali che offra le più recenti innovazioni in materia di sostenibilità dei data center può aiutare a implementare l’infrastruttura AI in modo pulito ed efficiente. Citiamo, ad esempio, l’utilizzo del raffreddamento a liquido nei data center, che consente di ottenere la maggiore densità di elaborazione necessaria per carichi di lavoro impegnativi come l’AI, senza dover sacrificare l’efficienza per ottenerla.
Per maggiori informazioni sulle soluzioni di Cloud Adjacent Storage, vi invitiamo a visitare il sito web di Equinix.
- Mittica, Gabriele (Autore) - Nash, Phil, Peters, Sven, Poccia, Danilo (Narratori)