Nvidia RT Cores vs. AMD Ray Accelerator – erklärt

Mit der ersten Generation von RTX-Grafikkarten im Jahr 2018 stellte Nvidia der Welt ein brandneues Feature vor, das die Spielelandschaft, wie wir sie kennen, verändern sollte. Die Grafikkarten der ersten Generation der RTX 2000-Serie basierten auf der neuen Turing-Architektur und brachten Unterstützung für Echtzeit-Raytracing in Spielen mit. Ray Tracing gab es bereits in professionellen 3D-Animations- und synthetischen Bereichen, aber Nvidia unterstützte das Echtzeit-Rendering von Spielen mit der Ray-Tracing-Technologie anstelle der traditionellen Rasterisierung, die bahnbrechend sein sollte. Rasterisierung ist die traditionelle Technik, mit der Spiele gerendert werden, während Ray Tracing komplexe Berechnungen verwendet, um genau darzustellen, wie Licht in der Spielumgebung wie im realen Leben interagieren und sich verhalten würde. Sie können mehr über Raytracing und Rasterisierung erfahren in diesem Inhaltsteil.

Im Jahr 2018 hatte AMD keine Antwort auf die RTX-Grafikkartenserie von Nvidia und ihre Raytracing-Funktionalität. Das Red Team war einfach nicht bereit für die innovative Einführung von Nvidia, was seinen Top-Angeboten gegenüber Team Green einen erheblichen Nachteil bescherte. Die AMD RX 5700 XT war eine fantastische Grafikkarte zum Preis von 399 US-Dollar, die mit der Leistung der 499 US-Dollar RTX 2070 Super mithalten konnte. Das größte Problem für AMD war jedoch die Tatsache, dass die Konkurrenz eine Technologie anbot, die sie nicht besaßen. Dies gepaart mit dem vielfältigen Funktionsumfang, der DLSS-Unterstützung, den stabilen Treibern und der insgesamt überlegenen Leistung verschafft den Nvidia-Angeboten einen erheblichen Vorteil, wenn es um die Turing- vs. RDNA-Generation geht.

AMD RX 6000 Serie mit Raytracing

Schneller Vorlauf bis 2020 und AMD hat den Kampf endlich zu den Top-Angeboten von Nvidia gebracht. AMD hat nicht nur die Unterstützung für Echtzeit-Raytracing in Spielen eingeführt, sondern auch 3 Grafikkarten herausgebracht, die mit den Top-Grafikkarten von Nvidia extrem konkurrenzfähig sind. Die AMD RX 6800, die RX 6800 XT und die RX 6900 XT liefern sich Kopf-an-Kopf-Rennen mit der Nvidia RTX 3070, RTX 3080 bzw. RTX 3090. AMD ist endlich wieder am oberen Ende der Produktpalette konkurrenzfähig, was auch für Verbraucher vielversprechende Neuigkeiten ist.

Aber auch für AMD sieht es nicht ganz positiv aus. Obwohl AMD die Unterstützung für Echtzeit-Raytracing in Spielen eingeführt hat, wurde ihre Raytracing-Leistung sowohl von Rezensenten als auch von den allgemeinen Verbrauchern lauwarm aufgenommen. Es ist jedoch verständlich, da dies AMDs erster Versuch mit Ray Tracing ist, daher wäre es ein wenig unfair, von ihnen zu erwarten, dass sie beim ersten Versuch die beste Ray Tracing-Leistung liefern. Es wirft jedoch Fragen zur Funktionsweise der Raytracing-Implementierung von AMD im Vergleich zu der Implementierung von Nvidia auf, die wir bei der Turing- und jetzt der Ampere-Architektur gesehen haben.

Nvidias Suite von RTX-Technologien

Der Hauptgrund, warum AMDs Versuch im Vergleich zu Nvidia nicht überwältigend zu sein scheint, ist, dass AMD im Wesentlichen mit Nvidia aufholen wollte und mehr oder weniger nur 2 Jahre Zeit hatte, um ihre Implementierung von Raytracing zu entwickeln und zu perfektionieren. Nvidia hingegen entwickelt diese Technologie schon viel länger, da sie an der Spitze des Produktstapels niemanden hatten, mit dem sie konkurrieren konnten. Nvidia lieferte nicht nur Raytracing-Unterstützung vor AMD, sondern verfügte auch über ein besseres Support-Ökosystem, das auf der Technologie basiert.

Nvidia hat seine RTX-2000-Grafikkartenserie mit Raytracing als Hauptfokus entwickelt. Dies zeigt sich im gesamten Design der Turing-Architektur selbst. Nvidia hat nicht nur die Anzahl der CUDA-Kerne vervielfacht, sondern auch spezielle dedizierte Raytracing-Kerne hinzugefügt, die als "RT-Kerne" bekannt sind und den Großteil der für Raytracing erforderlichen Berechnungen verarbeiten. Nvidia hat auch eine Technologie namens "Deep Learning Super Sampling oder DLSS" entwickelt, eine fantastische Technologie, die Deep Learning und KI verwendet, um Hochskalierungs- und Neuaufbauaufgaben durchzuführen und auch den Leistungsverlust von Raytracing zu kompensieren. Nvidia hat auch dedizierte „Tensor Cores“ in Karten der GeForce-Serie eingeführt, die bei Deep Learning und KI-Aufgaben wie DLSS helfen sollen. Darüber hinaus hat Nvidia auch mit Spielestudios zusammengearbeitet, um die kommenden Raytracing-Spiele für die dedizierte Nvidia-Hardware zu optimieren, damit die Leistung maximiert werden kann.

Nvidias RT-Kerne

RT- oder Raytracing-Kerne sind Nvidias dedizierte Hardware-Kerne, die speziell dafür entwickelt wurden, die Rechenlast zu bewältigen, die mit Echtzeit-Raytracing in Spielen verbunden ist. Die Bereitstellung spezialisierter Kerne für Raytracing entlastet die CUDA-Kerne, die dem Standard-Rendering in Spielen gewidmet sind, viel Arbeitslast, sodass die Leistung nicht zu sehr durch die Sättigung der Kernauslastung beeinträchtigt wird. RT-Cores opfern Vielseitigkeit und implementieren Hardware mit einer speziellen Architektur für spezielle Berechnungen oder Algorithmen, um höhere Geschwindigkeiten zu erreichen.

Die gebräuchlicheren Ray-Tracing-Beschleunigungsalgorithmen, die allgemein bekannt sind, sind BVH und Ray Packet Tracing, und das schematische Diagramm der Turing-Architektur erwähnt auch BVH (Bounding Volume Hierarchy) Transversal. Der RT Core wurde entwickelt, um die Befehle zu identifizieren und zu beschleunigen, die sich auf das Raytracing-Rendering in Spielen beziehen.

Laut Nvidias ehemaligem Senior GPU Architect Yubo Zhang:

Nvidia gibt auch im Turing Architecture White Paper an, dass RT-Cores mit fortschrittlicher Rauschunterdrückung, einer von NVIDIA Research entwickelten hocheffizienten BVH-Beschleunigungsstruktur und RTX-kompatiblen APIs zusammenarbeiten, um Echtzeit-Raytracing auf einer einzigen Turing-GPU zu erreichen. RT-Kerne durchqueren den BVH autonom und durch die Beschleunigung von Durchquerungs- und Strahlen-/Dreieck-Schnitttests entlasten sie den SM, sodass er einen anderen Scheitelpunkt, Pixel und Berechnungsschattierungsarbeiten verarbeiten kann. Funktionen wie BVH-Aufbau und -Umrüstung werden vom Treiber übernommen, und die Strahlerzeugung und das Shading werden von der Anwendung durch neue Arten von Shadern verwaltet. Dadurch können die SM-Einheiten andere grafische und rechnerische Arbeiten ausführen.

AMDs Ray-Beschleuniger

AMD ist mit seiner RX 6000-Serie in das Raytracing-Rennen eingetreten und hat damit auch einige Schlüsselelemente in das Architekturdesign von RDNA 2 eingeführt, die bei dieser Funktion helfen. Um die Raytracing-Leistung der RDNA 2-GPUs von AMD zu verbessern, hat AMD eine Ray-Accelerator-Komponente in sein Core Compute Unit Design integriert. Diese Strahlenbeschleuniger sollen die Effizienz der Standard-Recheneinheiten bei den mit Ray Tracing verbundenen Rechenlasten erhöhen.

Der Mechanismus hinter der Funktionsweise von Ray-Beschleunigern ist noch relativ vage, aber AMD hat einige Einblicke in die Funktionsweise dieser Elemente gegeben. Laut AMD haben diese Strahlbeschleuniger den ausdrücklichen Zweck, die Bounded Volume Hierarchy (BVH)-Struktur zu durchqueren und effizient Schnittpunkte zwischen Strahlen und Boxen (und schließlich Dreiecken) zu bestimmen. Das Design unterstützt vollständig DirectX Raytracing (Microsofts DXR), den Industriestandard für PC-Gaming. Darüber hinaus verwendet AMD einen Compute-basierten Denoiser, um die Spiegeleffekte von Raytracing-Szenen zu beseitigen, anstatt sich auf speziell entwickelte Hardware zu verlassen. Dies wird wahrscheinlich zusätzlichen Druck auf die Fähigkeiten der neuen Compute Units mit gemischter Genauigkeit ausüben.

Ray-Beschleuniger sind auch in der Lage, vier Bounded Volume-Box-Schnittpunkte oder einen Dreiecks-Schnittpunkt pro Takt zu verarbeiten, was viel schneller ist als das Rendern einer Raytraced-Szene ohne dedizierte Hardware. Der Ansatz von AMD hat einen großen Vorteil, nämlich dass die RT-Beschleuniger von RDNA 2 mit dem Infinity Cache der Karte interagieren können. Es ist möglich, eine große Anzahl von Bounded Volume Structures gleichzeitig im Cache zu speichern, so dass eine gewisse Last von Datenverwaltungs- und Speicherlesezellen genommen werden kann.

Hauptunterschied

Der größte Unterschied, der beim Vergleich der RT-Kerne und der Ray-Beschleuniger sofort offensichtlich wird, besteht darin, dass beide ihre Funktionen ziemlich ähnlich ausführen, die RT-Kerne jedoch dedizierte separate Hardwarekerne mit einer einzigen Funktion sind, während die Ray-Beschleuniger ein Teil von Acc sind die Standard-Recheneinheitenstruktur in der RDNA 2-Architektur. Darüber hinaus befinden sich Nvidias RT-Cores mit Ampere in der zweiten Generation mit vielen technischen und architektonischen Verbesserungen unter der Haube. Dies macht die RT-Core-Implementierung von Nvidia zu einer viel effizienteren und leistungsfähigeren Raytracing-Methode als die Implementierung von AMD mit den Ray-Beschleunigern.

Da in jede Recheneinheit ein einzelner Ray-Beschleuniger eingebaut ist, erhält der AMD RX 6900 XT 80 Ray-Beschleuniger, der 6800 XT 72 Ray-Beschleuniger und der RX 6800 60 Ray-Beschleuniger. Diese Zahlen sind nicht direkt mit den RT-Core-Zahlen von Nvidia vergleichbar, da es sich um dedizierte Kerne handelt, die für eine einzige Funktion entwickelt wurden. Die RTX 3090 bekommt 82 2^nd Gen RT-Kerne, die RTX 3080 bekommt 60 2^nd Gen RT Cores und die RTX 3070 bekommt 46 2^nd Gen RT-Kerne. Nvidia verfügt außerdem über separate Tensorkerne in all diesen Karten, die beim maschinellen Lernen und bei KI-Anwendungen wie DLSS helfen, über die Sie mehr erfahren können In diesem Artikel.

Zukünftige Optimierung

Es ist derzeit schwer zu sagen, was die Zukunft in Raytracing für Nvidia und AMD bereithält, aber man kann ein paar fundierte Vermutungen anstellen, indem man die aktuelle Situation analysiert. Zum Zeitpunkt des Schreibens hält Nvidia einen ziemlich deutlichen Vorsprung bei der Raytracing-Leistung im direkten Vergleich zu den Angeboten von AMD. Obwohl AMD einen beeindruckenden Start für RT hingelegt hat, liegen sie in Bezug auf Forschung, Entwicklung, Support und Optimierung immer noch 2 Jahre hinter Nvidia zurück. Nvidia hat sich bereits im Jahr 2020 die meisten Raytracing-Titel gesichert, um die dedizierte Hardware von Nvidia besser zu nutzen als das, was AMD zusammengestellt hat. Dies, kombiniert mit der Tatsache, dass Nvidias RT-Cores ausgereifter und leistungsfähiger sind als AMDs Ray-Beschleuniger, benachteiligt AMD in der aktuellen Ray-Tracing-Situation.

AMD macht hier jedoch definitiv nicht halt. AMD hat bereits angekündigt, an einer AMD-Alternative zu DLSS zu arbeiten, die massiv zur Verbesserung der Raytracing-Leistung beiträgt. AMD arbeitet auch mit Spielestudios zusammen, um kommende Spiele für ihre Hardware zu optimieren, was sich in Titeln wie GodFall und Dirt 5 zeigt, wo AMDs Karten der RX 6000-Serie überraschend gut abschneiden. Daher können wir erwarten, dass AMDs Raytracing-Unterstützung mit kommenden Titeln und der Entwicklung kommender Technologien wie der DLSS-Alternative immer besser wird.

Vor diesem Hintergrund ist die RTX-Suite von Nvidia zum Zeitpunkt des Schreibens einfach zu mächtig, um sie für jeden zu ignorieren, der nach ernsthafter Raytracing-Leistung sucht. Unsere Standard-Empfehlung für alle, die Raytracing für einen wichtigen Faktor bei der Kaufentscheidung halten, wird die neue RTX-3000-Grafikkartenserie von Nvidia gegenüber AMDs RX-6000-Serie sein. Dies könnte und sollte sich mit den zukünftigen Angeboten von AMD sowie mit Verbesserungen sowohl bei den Treibern als auch bei der Spieloptimierung im Laufe der Zeit ändern.

Letzte Worte

AMD ist mit der Einführung seiner RX 6000-Grafikkartenserie auf Basis der RDNA 2-Architektur endlich in die Raytracing-Szene aufgesprungen. Während sie die Karten der RTX 3000-Serie von Nvidia in direkten Raytracing-Benchmarks nicht schlagen, bieten die AMD-Angebote eine äußerst wettbewerbsfähige Rasterisierungsleistung und einen beeindruckenden Wert, der Spieler ansprechen kann, die sich nicht so sehr für Raytracing interessieren. AMD ist jedoch auf einem guten Weg, die Raytracing-Leistung mit mehreren wichtigen Schritten in schneller Folge zu verbessern.

Der Ansatz von Nvidia und AMD für Raytracing ist ziemlich ähnlich, aber beide Unternehmen verwenden dafür unterschiedliche Hardware-Techniken. Erste Tests haben gezeigt, dass die dedizierten RT-Cores von Nvidia die in den Compute Units selbst integrierten Ray-Beschleuniger von AMD übertreffen. Dies ist für den Endbenutzer möglicherweise kein großes Problem, ist jedoch für die Zukunft wichtig, da Spieleentwickler nun vor der Entscheidung stehen, ihre RT-Funktionen für einen der beiden Ansätze zu optimieren.