In occasione del Computex del 2024, in corso di svolgimento a Taipei, Intel ha svelato una serie di innovazioni tecnologiche e architettoniche destinate a rivoluzionare l’ecosistema dell’intelligenza artificiale (AI).
Queste tecnologie, che spaziano dai data center e il cloud fino ai dispositivi personali, promettono di potenziare notevolmente la capacità di calcolo, migliorare l’efficienza energetica e ridurre i costi operativi, permettendo agli utenti di sfruttare al massimo le potenzialità dell’AI.
In un arco temporale di soli sei mesi, Intel è passata dal rilascio dei processori Xeon di quinta generazione all’innovativo componente della famiglia Xeon 6; dall’anteprima degli acceleratori AI Gaudi alla realizzazione di un sistema GenAI, che offre formazione e inferenza AI a costi contenuti e con prestazioni elevate. E poi ancora dall’introduzione dei processori Intel Core Ultra, che hanno inaugurato l’era degli AI PC, ai nuovi dispositivi client, il cui lancio è previsto entro l’anno.
La piattaforma Xeon 6
L’accelerazione della trasformazione digitale sta spingendo le aziende a modernizzare i propri data center. Le organizzazioni sono chiamate a ottimizzare i costi, perseguendo obiettivi di sostenibilità. Il tutto massimizzando l’efficienza spaziale e sviluppando nuove capacità digitali. La piattaforma Xeon 6 e la relativa gamma di processori sono stati concepiti per soddisfare queste necessità, con le varianti E-core e P-core progettate per supportare un’ampia varietà di applicazioni, dall’AI a compiti di elaborazione ad alte prestazioni per ambienti cloud scalabili. Entrambe le varianti sono basate su un’architettura compatibile con un ampio ecosistema di software e hardware.
Il primo modello della serie Xeon 6 a essere lanciato è l’Intel Xeon 6 E-core, conosciuto anche come Sierra Forest, già disponibile sul mercato. I processori Xeon 6 P-core, soprannominati Granite Rapids, sono attesi per il prossimo trimestre. Il processore Xeon 6 E-core si distingue per la sua alta densità di core e per le eccezionali prestazioni per Watt, garantendo un’elaborazione efficiente e un notevole risparmio energetico. Queste caratteristiche lo rendono ideale per carichi di lavoro intensivi, come le applicazioni cloud native e i servizi di rete.
In aggiunta, il Xeon 6 E-core offre vantaggi significativi in termini di densità, permettendo di consolidare i rack con un rapporto di 3 a 1 per carichi di lavoro di transcodifica multimediale, con un incremento delle prestazioni fino a 4,2 volte e un miglioramento dell’efficienza energetica fino a 2,6 volte rispetto ai processori Xeon di seconda generazione. Questo consente di ridurre il consumo energetico e lo spazio occupato nei rack, liberando risorse per progetti AI all’avanguardia.
Intel a Computex 2024: gli acceleratori Gaudi
A Computex 2024, Intel continua a spingere i confini dell’intelligenza artificiale con la sua architettura x86. Una soluzione che domina l’infrastruttura dei data center e serve come fondamento per l’integrazione dell’AI. Questo approccio garantisce interoperabilità e sfrutta i vantaggi di un ecosistema aperto di sviluppatori e clienti. I processori Intel Xeon, in combinazione con gli acceleratori AI Intel Gaudi, formano un sistema unificato ideale per i carichi di lavoro AI, offrendo una soluzione potente che si integra senza soluzione di continuità nell’infrastruttura esistente.
Difatti Intel Gaudi si posiziona come l’unica alternativa ai Nvidia H100, con benchmark MLPerf che attestano la sua efficacia nell’addestramento e nell’inferenza dei large language models (LLM). L’architettura Gaudi si distingue per le sue prestazioni di GenAI e per un rapporto costo-efficacia che favorisce la scelta, l’implementazione rapida e costi operativi ridotti. Un kit AI standard con otto acceleratori Intel Gaudi 2 ha un costo di 65.000 dollari USA. Si tratta di un terzo rispetto alle piattaforme concorrenti. Inoltre un kit con otto acceleratori Intel Gaudi 3 è offerto a 125.000 dollari USA, circa due terzi del costo delle alternative.
Intel Gaudi 3 promette miglioramenti significativi nelle prestazioni di formazione e inferenza per i principali modelli GenAI. Si stima che un cluster di 8.192 acceleratori Intel Gaudi 3 possa offrire un time-to-train fino al 40% più veloce. A ciò si aggiunge un throughput di training fino al 15% più veloce rispetto a un cluster Nvidia H100 di dimensioni equivalenti. In media, si prevede che Intel Gaudi 3 realizzi inferenze fino a 2 volte più veloci rispetto a Nvidia H100 su modelli LLM comuni come Llama-70B e Mistral-7B.
Una nuova architettura Lunar Lake
Infine, sempre nell’ambito dell’evento Computex 2024, Intel estende la sua offerta AI oltre i data center, raggiungendo l’edge e i PC. Con previsioni che vedono gli AI PC rappresentare quasi il 60% dei nuovi PC entro il 2027, Intel ha creato una piattaforma hardware e software ottimale, supportando oltre 500 modelli AI. L’architettura Lunar Lake, il processore di punta per i nuovi AI PC, promette un incremento del 40% della potenza SoC e più di tre volte la potenza di calcolo AI, con un focus sull’efficienza energetica per il segmento thin & light. Lunar Lake sarà disponibile nel terzo trimestre del 2024.
La nuova architettura Lunar Lake introduce nuovi Performance-core (P-core) ed Efficient-core (E-core), progettati per ottimizzare sia la potenza di calcolo che il consumo energetico. Vediamo le principali caratteristiche:
- Quarta Generazione di NPU Intel. La Neural Processing Unit (NPU) Intel di quarta generazione rappresenta un salto qualitativo nelle prestazioni AI, raggiungendo fino a 48 tera-operazioni al secondo (TOPS). Questo incremento, pari a quattro volte la potenza di calcolo della generazione precedente, si traduce in miglioramenti tangibili nell’esecuzione di applicazioni di GenAI.
- Battlemage. La GPU Battlemage è una novità assoluta che fonde due innovazioni: i core GPU Xe2 per la grafica e gli array Xe Matrix Extension (XMX) per l’intelligenza artificiale. I core GPU Xe2 offrono prestazioni grafiche e di gaming migliorate del 50% rispetto alla generazione precedente, mentre gli array XMX introducono un secondo acceleratore AI capace di raggiungere i 67 TOPS, garantendo un throughput eccezionale nella creazione di contenuti.
- Advanced Low-Power Island. Infine, l’innovativo cluster di calcolo Advanced low-power island gestisce le attività in background e di produttività con un’efficienza senza precedenti, estendendo notevolmente la durata della batteria dei laptop.
- SUONO RICCO E AVVOLGENTE: goditi un’esperienza audio migliorata con voci più nitide e bassi più profondi per un’esperienza Echo Dot immersiva.
- MUSICA E PODCAST: ascolta musica, audiolibri e podcast da Amazon Music, Audible, Apple Music, Spotify e molto altro, tramite wi-fi o Bluetooth.
- FELICE DI AIUTARTI: chiedi ad Alexa le previsioni del tempo, di impostare dei timer, di rispondere alle tue domande o semplicemente raccontarti barzellette.
- LA TUA CASA INTELLIGENTE, SEMPRE PIÙ SEMPLICE: controlla i dispositivi per Casa Intelligente compatibili con la tua voce o imposta routine per azioni basate sulla temperatura.
- MIGLIORI INSIEME: sincronizza più dispositivi Echo compatibili o associa Fire TV per la massima esperienza visiva.
Rimani aggiornato seguendoci su Google News!
Da non perdere questa settimana su Techbusiness
🥷 La situazione della cyberwarfare in Italia e nel mondo
🏢 Aruba consolida la sua presenza sul territorio con un nuovo data center a Roma
🧠 Intelligenza artificiale e non: generare un valore, ma per tutti
👗 La moda sostenibile cresce verso un'industria più responsabile ed etica
🎧 Ma lo sai che abbiamo un sacco di newsletter?
📺 Trovi Fjona anche su RAI Play con Touch - Impronta digitale!
💌 Risolviamo i tuoi problemi di cuore con B1NARY
🎧 Ascolta il nostro imperdibile podcast Le vie del Tech
💸 E trovi un po' di offerte interessanti su Telegram!