Den største prosessoren som noensinne er bygd, pakker 1,2 billioner transistorer, etterlater topp-end Intel- og AMD-prosessorer og GPUer bak

Et selskap har klart å lage den største prosesseringsbrikken noensinne som langt overgår alt Intel eller AMD noensinne har produsert. Med vanvittige 1,2 billioner transistorer på silisiumplaten, er prosessoren den desidert største halvlederbrikken som noen gang er bygget. Selskapet bak prosessoren planlegger å dedikere brikken for å øke kunstig intelligens (AI).

Cerebras Wafer Scale Engine, laget av det nye kunstige intelligensfirmaet Cerebras Systems er den største halvlederbrikken som noen gang er bygget. Den sentrale prosesseringsenheten eller CPUen har 1,2 billioner transistorer, som er de mest grunnleggende og viktige elektroniske bryterne på silisiumchips. Den nylig produserte prosessoren av Advanced Micro Devices-prosessoren har 32 milliarder transistorer. Unødvendig å nevne, overstiger antall transistorer på Cerebras Wafer Scale Engine langt til og med topp-end AMD- og Intel-prosessorer og GPUer.

Cerebras Wafer Scale Engine er den største single-chip prosessoren som noen gang er bygget:

Cerebras WSE er en enorm 46.225 kvadratmillimeter av en silisiumskive som huser 400 000 AI-optimalisert, ikke-cache, ikke-overhead, beregningskjerner og 18 gigabyte lokalt, distribuert, superrask SRAM-minne som det eneste nivået i minnet hierarki. Til sammenligning måler den største NVIDIA GPU 815 kvadrat millimeter og pakker 21,1 milliarder transistorer. Enkel matematikk vil indikere at Cerebras WSE er 56,7 ganger større enn high-end NVIDIA GPU.

Cerebras WSEs minnebåndbredde er 9 petabyte per sekund. Med andre ord, verdens største prosessor kan skryte av 3000 ganger mer høyhastighets minne på chip og 10 000 ganger mer minnebåndbredde. Prosessorens kjerner er koblet sammen med et finkornet, all-hardware, on-chip mesh-tilkoblet kommunikasjonsnettverk. På grunn av den forenklede arkitekturen og den enorme formstørrelsen, kombinert med ultrahøy båndbredde, kan prosessoren levere en samlet båndbredde på 100 petabit per sekund. Enkelt sagt gjør Cerebras WSEs store antall kjerner, mer lokalt minne og et stoff med lav latens og høy båndbredde det til en ideell prosessor for å øke hastigheten på kunstig intelligensoppgaver.

Hvorfor lager ikke Intel og AMD slike spesialdesignede store CPUer og GPUer?

Intel, AMD og de fleste andre produsenter av silisiumbrikker vedta en helt annen og tradisjonell tilnærming. De ofte tilgjengelige kraftige GPUene og CPUene er faktisk en samling chips laget på toppen av en 12-tommers silisiumskive og behandles i en chipfabrikk i en batch. Cerebras WSE er derimot en enkelt chip sammenkoblet på en enkelt wafer. Enkelt sagt, alle 1.2 billioner transistorer på den største prosessoren jobber virkelig sammen som en eneste gigantisk silisiumchip.

Det er en ganske enkel grunn til at selskaper som Intel og AMD ikke investerer i så sinnsykt store silisiumplater. En enkelt silisiumplate har noen urenheter, som kan ha en kaskadeffekt og til slutt forårsake svikt. Chipmakere er godt klar over det samme og bygger prosessorene sine deretter. Derfor er det sanne utbyttet av silisiumplatene når det gjelder silisiumflis som fungerer pålitelig, ganske lavt. Med andre ord, hvis silisiumplaten bare har en enkelt chip, er sjansene for urenheter og svikt ganske høye.

Interessant, mens andre selskaper ikke har funnet ut en brukbar løsning, har Cerebras angivelig designet brikken til å være overflødig. Enkelt sagt, en urenhet vil ikke deaktivere hele brikken, bemerket Andrew Feldman, som medstifter Cerebras Systems og fungerer som administrerende direktør. “Designet fra grunnen av for AI-arbeid, inneholder Cerebras WSE grunnleggende innovasjoner som fremmer toppmoderne teknologi ved å løse flere tiår gamle tekniske utfordringer som begrenser chipstørrelser - for eksempel tilkobling på tvers av retikler, utbytte, strømforsyning og emballasje. Hver arkitektonisk beslutning ble tatt for å optimalisere ytelsen for AI-arbeid. Resultatet er at Cerebras WSE leverer, avhengig av arbeidsbelastning, hundrevis eller tusen ganger ytelsen til eksisterende løsninger til en liten brøkdel av kraftuttaket og plassen. ”

AI-oppgaver vil fortsette å kreve større sjetonger:

Den nye prosessoren er spesialbygd for å håndtere AI-oppgaver, hovedsakelig fordi større sjetonger behandler informasjon raskere, og gir svar på kortere tid. De fleste teknologibedrifter hevder at den grunnleggende begrensningen av dagens AI er at det tar for lang tid å trene modeller. Derfor prøver noen få teknologiledere å optimalisere AI-algoritmene for å stole på færre datasett. Imidlertid vil enhver god AI åpenbart bli bedre med større datasett. Å redusere treningstiden ved å øke CPU-størrelsen er en måte å øke prosessering og redusere treningstiden uten å gå på kompromiss med kvaliteten på resulterende AI.

Interprosessorens kommunikasjonsstoff som er distribuert på Cerebras WSE, er også enestående. 2D-mesh med lav latens, høy båndbredde, kobler alle 400 000 kjerner på WSE med til sammen 100 petabit per sekund båndbredde. I tillegg er kjernene på prosessoren Sparse Linear Algebra Cores (SLAC), som er optimalisert for nevrale nettverksberegningsprimitiver. Begge aspektene setter brikken langt foran for AI-oppgaver. Derfor er det lite sannsynlig at spillere vil kunne kjøpe den største og kraftigste CPU eller GPU for PCene sine.

Facebook Twitter Google Plus Pinterest