Der größte jemals gebaute Prozessor packt 1,2 Billionen Transistoren und lässt erstklassige Intel- und AMD-CPUs und -GPUs zurück
Ein Unternehmen hat es geschafft, den größten jemals verarbeiteten Chip zu entwickeln, der weit über alles hinausgeht, was Intel oder AMD jemals produziert haben. Mit wahnsinnigen 1,2 Billionen Transistoren auf dem Siliziumwafer ist der Prozessor mit Abstand der größte Halbleiterchip, der jemals gebaut wurde. Das Unternehmen hinter dem Prozessor plant, den Chip zur Steigerung der künstlichen Intelligenz (KI) einzusetzen.
Die Cerebras Wafer Scale Engine des neuen Unternehmens für künstliche Intelligenz Cerebras Systems ist der größte jemals gebaute Halbleiterchip. Die Zentraleinheit oder CPU verfügt über 1,2 Billionen Transistoren, die die grundlegendsten und wichtigsten elektronischen Ein- und Ausschalter aller Siliziumchips sind. Der kürzlich von Advanced Micro Devices hergestellte Prozessor verfügt über 32 Milliarden Transistoren. Unnötig zu erwähnen, dass die Anzahl der Transistoren in der Cerebras Wafer Scale Engine sogar AMD- und Intel-CPUs und -GPUs der Spitzenklasse bei weitem übertrifft.
Die Cerebras Wafer Scale Engine ist der größte jemals gebaute Single-Chip-Prozessor:
Der Cerebras WSE ist ein riesiger 46.225 Quadratmillimeter großer Siliziumwafer, auf dem 400.000 AI-optimierte Rechenkerne ohne Cache, ohne Overhead und 18 Gigabyte lokaler, verteilter, superschneller SRAM-Speicher als einzige Speicherebene untergebracht sind Hierarchie. Im Vergleich dazu misst die größte NVIDIA-GPU 815 Quadratmillimeter und packt 21,1 Milliarden Transistoren. Einfache Berechnungen zeigen, dass die Cerebras WSE 56,7-mal größer ist als die High-End-NVIDIA-GPU.
Die Speicherbandbreite des Cerebras WSE beträgt 9 Petabyte pro Sekunde. Mit anderen Worten, der weltweit größte Prozessor verfügt über 3.000-mal mehr Hochgeschwindigkeits-On-Chip-Speicher und 10.000-mal mehr Speicherbandbreite. Die Kerne des Prozessors sind mit einem feinkörnigen Kommunikationsnetzwerk verbunden, das ausschließlich aus Hardware und On-Chip-Mesh besteht. Aufgrund der vereinfachten Architektur und der enormen Chipgröße in Kombination mit einer extrem hohen Bandbreite kann der Prozessor eine Gesamtbandbreite von 100 Petabit pro Sekunde liefern. Einfach ausgedrückt, die große Anzahl von Kernen des Cerebras WSE, der größere lokale Speicher und die Struktur mit geringer Latenz und hoher Bandbreite machen ihn zu einem idealen Prozessor, um Aufgaben der künstlichen Intelligenz erheblich zu beschleunigen.
Warum stellen Intel und AMD nicht so maßgeschneiderte riesige CPUs und GPUs her?
Intel, AMD und die meisten anderen Hersteller von Siliziumchips einen völlig anderen und traditionellen Ansatz verfolgen. Die allgemein erhältlichen leistungsstarken GPUs und CPUs sind eine Sammlung von Chips, die auf einem 12-Zoll-Siliziumwafer erstellt und in einer Chipfabrik im Batch verarbeitet werden. Die Cerebras WSE hingegen ist ein einzelner Chip, der auf einem einzelnen Wafer miteinander verbunden ist. Einfach ausgedrückt, alle 1,2 Billionen Transistoren des größten Prozessors arbeiten wirklich als ein einziger riesiger Siliziumchip zusammen.
Es gibt einen ziemlich einfachen Grund, warum Unternehmen wie Intel und AMD nicht in solch wahnsinnig große Siliziumwafer investieren. Ein einzelner Siliziumwafer weist einige Verunreinigungen auf, die einen Kaskadeneffekt haben und schließlich zum Versagen führen können. Chiphersteller sind sich dessen bewusst und bauen ihre Prozessoren entsprechend. Daher ist die wahre Ausbeute der Siliziumwafer in Bezug auf Siliziumchips, die zuverlässig arbeiten, ziemlich gering. Mit anderen Worten, wenn der Siliziumwafer nur einen einzigen Chip hat, ist die Wahrscheinlichkeit von Verunreinigungen und Versagen ziemlich hoch.
Interessanterweise hat Cerebras seinen Chip Berichten zufolge redundant gestaltet, obwohl andere Unternehmen keine praktikable Lösung gefunden haben. Einfach ausgedrückt, eine Verunreinigung wird nicht den gesamten Chip deaktivieren, bemerkte Andrew Feldman, Mitbegründer von Cerebras Systems und CEO. „Das Cerebras WSE wurde von Grund auf für die KI-Arbeit entwickelt und enthält grundlegende Innovationen, die den Stand der Technik vorantreiben, indem jahrzehntealte technische Herausforderungen gelöst werden, die die Chipgrößen einschränken - wie z. B. Konnektivität zwischen den Absehen, Ausbeute, Leistungsabgabe und Verpackung. Jede architektonische Entscheidung wurde getroffen, um die Leistung für die KI-Arbeit zu optimieren. Das Ergebnis ist, dass der Cerebras WSE je nach Arbeitsbelastung das Hundert- oder Tausendfache der Leistung vorhandener Lösungen bei einem winzigen Bruchteil des Stromverbrauchs und des Platzbedarfs liefert. “
KI-Aufgaben werden weiterhin größere Chips verlangen:
Der neue Prozessor wurde speziell für KI-Aufgaben entwickelt, da größere Chips Informationen schneller verarbeiten und Antworten in kürzerer Zeit liefern. Die meisten Technologieunternehmen behaupten, dass die grundlegende Einschränkung der heutigen KI darin besteht, dass das Trainieren von Modellen zu lange dauert. Daher versuchen einige Technologieführer, ihre KI-Algorithmen so zu optimieren, dass sie auf weniger Datensätzen basieren. Eine gute KI wird jedoch mit größeren Datenmengen offensichtlich besser. Die Reduzierung der Trainingszeit durch Erhöhen der CPU-Größe ist eine Möglichkeit, die Verarbeitung zu beschleunigen und die Trainingszeit zu verkürzen, ohne die Qualität der resultierenden KI zu beeinträchtigen.
Die auf dem Cerebras WSE bereitgestellte Kommunikationsstruktur zwischen Prozessoren ist ebenfalls einzigartig. Das 2D-Netz mit geringer Latenz und hoher Bandbreite verbindet alle 400.000 Kerne auf der WSE mit insgesamt 100 Petabit pro Sekunde Bandbreite. Darüber hinaus sind die Kerne auf dem Prozessor Sparse Linear Algebra Cores (SLAC), die für Grundelemente zur Berechnung neuronaler Netze optimiert sind. Beide Aspekte bringen den Chip für KI-Aufgaben weit voran. Daher ist es unwahrscheinlich, dass Gamer die größte und leistungsstärkste CPU oder GPU für ihre PCs kaufen können.