Amazon (NASDAQ:AMZN) Web Services (AWS) ha annunciato l'introduzione di nuovi server per data center dotati dei propri chip di intelligenza artificiale (AI), presentando una sfida al dominio di Nvidia nel settore. Apple Inc (NASDAQ:AAPL). è stata confermata come cliente, con l'intenzione di utilizzare questi nuovi chip Trainium2. L'unità cloud di AWS ha rivelato che questi server faranno parte di un massiccio supercomputer, che incorporerà centinaia di migliaia di chip. Questo annuncio è stato fatto martedì.
Questo supercomputer, alimentato dai chip Trainium2 di AWS, sarà utilizzato dalla startup di AI Anthropic come prima azienda a impiegare questa tecnologia. Anthropic è nota per la creazione di sistemi AI affidabili e interpretabili e sfrutterà la potenza computazionale per migliorare le capacità dei loro modelli AI.
Benoit Dupin, un dirigente di Apple, ha anche riconosciuto che il gigante tecnologico sta impiegando i chip Trainium2, segnalando un'adozione significativa della nuova offerta di AWS.
Matt Garman, CEO di AWS, ha inoltre rivelato che l'azienda sta già lavorando su Trainium3, la prossima evoluzione del loro chip AI, il cui debutto è previsto per il prossimo anno.
Le nuove istanze Amazon Elastic Compute Cloud (Amazon EC2), alimentate da AWS Trainium2, sono ora generalmente disponibili e introducono gli UltraServer Trn2. Questi UltraServer sono progettati per fornire prestazioni eccezionali ed efficienza dei costi per l'addestramento e la distribuzione di modelli AI contemporanei, inclusi i modelli linguistici di grandi dimensioni (LLM) e i modelli di base (FM).
Le istanze Trn2 promettono un miglioramento del 30-40% nel rapporto prezzo-prestazioni rispetto alle attuali istanze EC2 basate su GPU e vantano 16 chip Trainium2, offrendo 20,8 petaflop di picco di potenza di calcolo. Questo le rende ideali per gestire carichi di lavoro AI con miliardi di parametri.
Per compiti AI ancora più impegnativi, gli UltraServer Trn2 offrono un nuovo servizio EC2, con 64 chip Trainium2 interconnessi per un massimo di 83,2 petaflop di picco di potenza di calcolo. Questa configurazione quadruplica le capacità di calcolo, memoria e networking di una singola istanza, consentendo l'addestramento e la distribuzione dei più grandi modelli AI al mondo.
Il progetto collaborativo tra AWS e Anthropic, denominato Project Rainier, mira a costruire un EC2 UltraCluster di UltraServer Trn2, che diventerà il più grande cluster di calcolo AI al mondo una volta completato.
AWS ha anche evidenziato il prossimo chip Trainium3, che sarà prodotto utilizzando un processo a 3 nanometri, promettendo di quadruplicare le prestazioni degli attuali UltraServer Trn2.
Il kit di sviluppo software (SDK) AWS Neuron facilita l'ottimizzazione dei modelli AI per l'esecuzione su chip Trainium, supportando framework popolari come JAX e PyTorch, ed è integrato con l'hub di modelli Hugging Face, che ospita oltre 100.000 modelli.
Le istanze Trn2 sono attualmente disponibili nella regione AWS US East (Ohio), con piani per espandere la disponibilità ad altre regioni a breve. Nel frattempo, gli UltraServer Trn2 sono offerti in una fase di anteprima.
Questo articolo è stato generato e tradotto con il supporto dell'intelligenza artificiale e revisionato da un redattore. Per ulteriori informazioni, consultare i nostri T&C.