Cerebras WSE-2: il mega-processore a 7nm per l'AI ha 850.000 core e consuma 15kW

22 Aprile 2021 59

Cerebras è un'azienda californiana salita agli onori della cronaca lo scorso anno per aver annunciato il primo Wafer Scale Engine (WSE) da 400.000 core, sostanzialmente un mega-processore pensato per ambiti specifici come l'High Performance Computing (HPC) e l'Intelligenza artificiale. A distanza di meno di un anno, l'ambizioso progetto fa ora un netto balzo in avanti con il nuovo WSE2, un vero e proprio super-chip che, grazie a un processo produttivo aggiornato, riesce praticamente a surclassare il suo antenato.

Mentre la prima versione era costruita con tecnologia a 16nm, Cerebras WSE2 utilizza il processo produttivo a 7nm di TSMC, caratteristica che ha permesso agli ingegneri dell'azienda di raddoppiare il numero dei core e in modo vertiginoso le prestazioni.


Lo scopo di questa soluzione è quello di offrire un'alternativa ai cluster di GPU/CPU utilizzati come principale approccio in questi settori, ambiti dove le richieste in termini di risorse hardware sono in crescita costante. Per fare questo ovviamente c'è bisogno di un "processore" diverso di quelli a cui siamo abituati, soprattutto per quanto concerne dimensioni, architettura e soprattutto consumi.

Cerebras WSE2 è un chip con una superficie di 46.225 millimetri quadrati (215x215mm), riprendendo in questo senso le dimensioni del WSE1. La tecnologia a 7nm ha permesso però a Cerebras di portare il numero di transistor da 1.200 a 2.600 miliardi, integrando un totale di 850.000 core e ben 40GB di memoria SRAM on-chip.


Come potete notare dall'immagine sopra, miglioramenti sostanziali arrivano anche per il sottosistema memoria (bandwidth più che raddoppiata) e la velocità di interconnessione interna del chip, con valori a dir poco impressionanti. Ma quanto consuma questo chip?

La buona notizia è che questo sostanziale "upgrade" del WSE2 non prevede un aumento dei consumi rispetto a WSE1, nonostante questo per far funzionare un sistema del genere sono necessari 20kW, di questi solo 15kW sono destinati al mostruoso processore. Attualmente Cerebras WSE2 è disponibile a bordo del sistema CS-2 (maggiori dettagli nel VIA), una soluzione che troverà impiego in ambiti diversi, dalla ricerca, passando al settore energetico, farmaceutico e tutti quei settori dove è richiesta un'elevata capacità computazionale.


59

Commenti

Regolamento Commentando dichiaro di aver letto il regolamento e di essere a conoscenza delle informazioni e norme che regolano le discussioni sul sito. Clicca per info.
Caricamento in corso. Per commentare attendere...
Luca Brivio

In realtà uno dei punti di forza è proprio la possibilità di utilizzare automaticamente dei core e interconnessioni ridondanti (una piccola percentuale) nel caso di core non funzionanti, come accade nei chip di memoria.

Giovanni Giorgi

Con sicuramente costi di produzione impressionanti.
Con una piccola imperfezione butti l'intero wafer

Mik Loconte

ci gira crysis?

Er_Malmeta

A volte mi sa che e' meglio se scrivo in inglese.
Magari lo comprendete meglio :)
No scherzo. Sarebbe impossibile.

Davide

Figata pazzesca

deepdark

Prendilo a prezzo pieno.

Roundup

Quando usciranno smartphone con questo processore?

Repox Ray

Mi piacerebbe vederlo nel package e magari montato pure su pcb

ASpIDe2 PIdeAS2

Anche a me sembra strano..... consuma più energia di 10 forni elettrici messi a palla

Juanito82

i wafer vengono venduti per azienda, se la stessa azienda ha chippetti più piccoli forse potrebbe inserirli negli spazi "morti", però non sono sicuro che tecnicamente sia davvero fattibile, in genere le maschere si fanno per una sola tipologia di chip

gioboni

Temo anch'io, qanche se è uno spreco immane, però non so se sia conveniente e/o fattibile realizzare maschere litografiche multichip con architetture completamente differenti.

Juanito82

credo che taglino il quadrato al centro e buttino i 4 archi restanti, è un chip monoblocco

Juanito82

quindi ti hanno detto che per ottimizzare le rese si fanno chip tondi?

AcommonAlien

Ottima spiegazione, grazie!

gioboni

Beh dai alla fine si tengono circa 13000 core "di scorta" ed essendo così piccoli (sui 0,054mm^2 a core) ci sta che riescano ad avere una resa così elevata con un pp che ora è diventato abbastanza affidabile.
Piuttosto mi chiedo come venga utilzizato il resto del wafer: loro ne usano esattamente la metà (la parte centrale suppongo).

biggggggggggggg

Si loro è vero ma in realtà se levi i nodi di punta che sono solo una "piccola" parte del fatturato la concorrenza c'è eccome.

Ottoore

Un singolo core die di zen2/zen3 misura 75.75mm^2, 1/600 di questo sul medesimo processo produttivo.
L'assorbimento del core die di zen2/zen3 arriva ad oltre 100w per le cpu 3800x/3800xt/5800x. Quindi circa 1/150 del Cerebras WSE-2.

Sicuramente non useranno la dissipazione ad aria perché ci vorrebbe una massa gigantesca, sarebbe fisicamente possibile, con il liquido invece non avranno problemi.

NaXter24R

Intendo come leadership. Non hanno praticamente punti deboli. Un domani con nuovi player in gioco, chi te la fa fare di cambiare? Sti qua non stanno sbagliando un colpo

Ottoore

Direi di no: un singolo core die di zen2/zen3 misura 75.75mm^2, 1/600 di questo.
L'assorbimento del core die di zen2/zen3 arriva ad oltre 100w per le cpu 3800x/3800xt/5800x. Quindi circa 1/150 del Cerebras WSE-2.

Sicuramente non useranno la dissipazione ad aria perché ci vorrebbe una massa gigantesca, con il liquido invece non avranno problemi.

biggggggggggggg

Beh almeno si può dire che non impattano minimamente. Se non ricordo male producono 142k wafer al mese sui 7nm, questi probabilmente ne produrranno qualche decina l'anno (se va bene)

NaXter24R

L'unica cosa "triste" in tutto questo è che dietro c'è di nuovo TSMC. Ormai non li prende più nessuno

biggggggggggggg

What? Consumerà uguale ma sarà 8+8 core, altro che 850k tutti buoni

Scemo 3.0

Rumor dicono che includeranno il dissipatore stock Intel per raffreddarlo

Er_Malmeta

Preciso al mio aspirapolvere!

rsMkII

Uguale all'altro ma con una sorpresa.

biggggggggggggg

Si è incredibile, se non ricordo male all'inizio mettevano una tolleranza (in pratica degli extra-core) del 5%, poi hanno capito che bastava l'1.5% e col CS-2 sono riusciti ad avere uno yield del 100%.

Comunque, per capirci, questo è il mostro che serve per raffreddarlo.
https://uploads.disquscdn.c...

Er_Malmeta

Veramente me l'hanno detto all'universita'!
Quella vera! :D

Juanito82

non lo so, non ci sono mai andato ma immagino tu possa consigliarmi un'ottima sede per l'università della strada anche se preferirei quella della vita, sono un romantico ;)

faber80

spoiler del futuro intel 12k

Er_Malmeta

Si ho letto che pure gli iPhone fanno cosi'.

NaXter24R

Intendo proprio quello. Perchè comunque è parecchio grosso e immagino che serva un bel sistema per mantenere la temperatura su tutta quella superficie.
Per lo yield è allucinante. Sicuramente non si aspettavano nemmeno loro di averlo tutto funzionante, ma viste le dimensioni complimenti

Er_Malmeta

Mi pare un po' troppo scontato.

Er_Malmeta

Io mi chiedo dal 2007 come e' possibile che ogni anno la tecnologia migliori dell'80%.
Non sara' una delle solite cavolate che spara Apple per vendere?

biggggggggggggg

C'è un mega sistema a liquido sopra.

Inoltre, quanti ne hanno buttati prima di farne uno così grosso? Ho letto che è monolitico, quindi dovrebbe essere un solo wafer (liberi di correggermi)

Col CS-2 dicono di aver raggiunto uno yeild del quasi 100%. Praticamente ogni chip ha dei core ridondanti in modo che se non funziona una parte possono scollegare il core malfunzionante e collegarne uno buono di riserva.

Er_Malmeta

E' monolitico?
Quindi non e' neanche multithreading?

AcommonAlien

Suppongo che l'unico modo per raffreddarlo sia l'azoto liquido

biggggggggggggg

Ai ritmi attuali (che non credo verranno mantenuti a lungo) ammettendo che ogni anno a partire da adesso ogni GPU sia l'80% più veloce della precedente, ci vorrebbero 12 anni.
Il problema è che non basterebbe neanche lontanamente perchè non avrebbe tutta quella quella banda passante non potendo montare tutta quella memoria on-board. A meno che non si inventino un modo per raddoppiare la densità di SRAM a ogni PP, ogni anno (nella realtà se non erro migliora di un 20-30%)

Er_Malmeta

I wafer sono rotondi!
Quindi e' impossibile una resa del 100%.
Ma cosa vi insegnano a scuola?
Quando c'era intendo.

Er_Malmeta

E poi dicono in TV che siamo noi consumatori a sprecare le risorse!

Er_Malmeta

Pensa che l'M1 di Apple, che e' minuscolo, e' quasi piu' potente del mio C64!
Pero' neanche il mio C64 aveva la ventola.

Er_Malmeta

Ma io ho un alimentatore da 500W!
Allora sono a posto per sempre.

Er_Malmeta

Adesso ti bannano di sicuro! :D

Juanito82

hanno dichiarato una resa del 100% (e ci credo, non fosse così dovebbero buttare un wafer alla volta) ma la cosa impressionante è che ci riescono con meno del 1,5% di core "di scorta" sull'intero wafer.
vuol dire che la resa del 7nm TMSC su chip di dimensioni "consumer" è praticamente del 100%

Daniel

Sono il valore aggiunto il plus del blog.

Er_Malmeta

Accidenti. Ora siamo a 7,6 miliardi.
Qualcuno deve essere morto ultimamente! :D

Daniel

Siamo in 8 miliardi, 300 pezzi lego a testa. è abbastanza impressionante.

Er_Malmeta

Ma un trans-istor che forma ha?

Daniel

Come fai a immaginare quel numero di transistor bo

Er_Malmeta

Ma sono piezz' e core.

Er_Malmeta

Io vorrei vedere piu' articoli di ragazze.
Sono le piu' brave che ci sono.
Cancellate anche questo?

Samsung Galaxy Book Pro 360: le nostre prime impressioni

Samsung Galaxy Book e Galaxy Book Pro ufficiali: leggeri e veloci

Recensione MSI OPTIX MAG274R: è il monitor perfetto per giocare in FHD

Recensione Alimentatore Corsair RM1000x 80Plus Gold: look rinnovato, stessa qualità