Notebookcheck Logo

AMD RDNA 4 architectuurdieptepunt: Een 64-CU monolithisch ontwerp met all-round verbeteringen op het gebied van computing, media encode-decode, ray tracing en AI

AMD RDNA 4 is gebouwd voor high-end gaming, ray tracing en ML workloads. (Afbeelding Bron: AMD)
AMD RDNA 4 is gebouwd voor high-end gaming, ray tracing en ML workloads. (Afbeelding Bron: AMD)
AMD ging in op verschillende belangrijke aspecten van RDNA 4, dat vandaag officieel wordt gelanceerd. RDNA 4, dat in de nieuwe Radeon RX 9070 XT en RX 9070 GPU's zit, maakt de volgende generatie game- en contentcreatie-ervaringen mogelijk met ondersteuning voor nieuwe ray tracing- en path tracing-functies, ML-gebaseerde upscaling met FSR 4 en nieuwe mogelijkheden voor het coderen en decoderen van video.

AMD bood een voorproefje rDNA 4 op CES 2025 en bevestigde de komst van de Radeon RX 9070 XT en de RX 9070, maar maakte tijdens de eigenlijke keynote niet eens een opmerking over de nieuwe architectuur.

Het bedrijf hield echter vol dat er snel meer informatie over RDNA 4 en de nieuwe Radeon GPU's zou volgen, en hier zijn we dan.

Vandaag onthult AMD RDNA 4 en de nieuwe Radeon RX 9070-serie GPU's. De RX 9070-serie zal vanaf 6 maart officieel verkrijgbaar zijn in de winkels en de prestatiebeoordelingen volgen een dag eerder.

AMD RDNA 4: Terug naar een monolithisch ontwerp

RDNA 4 bouwt voort op de doelen die AMD zichzelf had gesteld met RDNA 3. Volgens AMD is RDNA 4 ontworpen voor zwaardere gaming workloads met een focus op verbeterde rasterprestaties en efficiëntie.

Daarnaast zijn er de gebruikelijke verbeteringen aan de ray tracing-pijplijnen, samen met een hernieuwde focus op AI-mogelijkheden en media coderen/decoderen.

Prestatieverhoging van rekeneenheden van RDNA 2 naar RDNA 4. (Afbeelding Bron: AMD)
Prestatieverhoging van rekeneenheden van RDNA 2 naar RDNA 4. (Afbeelding Bron: AMD)

RDNA 3 zag de komst van een chiplet-ontwerp voor GPU's, geïnspireerd op Ryzen-processors. Hier zagen we de scheiding tussen de geheugencache dies (MCD's) en de graphics compute die (GCD).

Met RDNA 4 keert AMD echter terug naar het traditionele monolithische ontwerp. De componenten zijn in wezen hetzelfde, maar er zijn geen MCD-GCD interconnecties omdat het geheugen en de compute nu rechtstreeks met elkaar verbonden zijn door de Infinity Cache.

De RDNA 4 GPU, in dit geval de Radeon RX 9070 XT, heeft vier shader engines met elk acht workgroup processors (WGP's). Elke WGP bestaat uit in totaal acht compute units (CU's) voor een totaal van 64 CU's.

AMD zegt dat de nieuwe compute units nu capabeler zijn dan ooit en verbeterde ray tracing, dubbele piekdoorvoer en ondersteuning voor de nieuwste matrixversnellingsmogelijkheden met bredere ondersteuning voor numerieke indelingen mogelijk maken.

Nieuw in de RDNA 4 CU, en een die we al hebben gezien met de Tensor cores in de Ampere-architectuur van Nvidia, is ondersteuning voor gestructureerde sparsity, die snellere matrixbewerkingen mogelijk maakt, vooral in gevallen waarin veel van de gewichten nul zijn.

We krijgen ook verbeteringen aan het geheugensubsysteem te zien. De L2-cache wordt verhoogd van 6 MB in RDNA 3 naar 8 MB in RDNA 4, terwijl de Infinity Cache wordt geüpgraded naar 3e generatie, maar daalt van 96 MB in RDNA 3 naar 64 MB.

AMD blijft met de nieuwe generatie vertrouwen op GDDR6-geheugen. Zowel de RX 9070 XT als de RX 9070 bieden een 384-bits 16 GB GDDR6 geheugeninterface geklokt op 20 Gbps voor een effectieve bandbreedte van 640 GB/s. Dit is veel lager dan de 960 GB/s bandbreedte van RDNA 3, maar AMD zegt dat de videogeheugenspecificaties van RDNA 4 zorgvuldig gekozen zijn om huidige en toekomstige titels te ondersteunen.

RDNA 4 architectuur. (Afbeelding Bron: AMD)
RDNA 4 architectuur. (Afbeelding Bron: AMD)
RDNA 3 architectuur ter vergelijking. (Afbeelding Bron: AMD)
RDNA 3 architectuur ter vergelijking. (Afbeelding Bron: AMD)

Verbeterde media engine en hardware flip metering ondersteuning

Het coderen van video was een van de grootste valkuilen bij RDNA 3, en AMD belooft aanzienlijke verbeteringen in dit opzicht. Het bedrijf belooft grote verbeteringen in H.264 en AV1 codering en minder blocking artefacten voor dezelfde hoeveelheid data.

De verbeteringen hebben ook betrekking op videodecodering, met minder stroomverbruik en betere prestaties bij het decoderen van formaten zoals AV1 en VP9.

De Radiance Display Engine verbruikt nu veel minder stroom in FreeSync-configuraties met twee monitoren. Ook nieuw is ondersteuning voor hardware flip queue in Windows Display Driver Model (WDDM) 3.0 voor het afspelen van video.

Dit maakt CPU-bronnen vrij door frame scheduling over te hevelen naar de GPU. De MFG-technologie (Multi-frame Generation) in Nvidia Blackwell GPU's maakt ook gebruik van hardware flip-meting.

RDNA 4: Media-engine verbeteringen. (Afbeelding Bron: AMD)
RDNA 4: Media-engine verbeteringen. (Afbeelding Bron: AMD)
De Radiance Display Engine ondersteunt nu hardware flip-meting. (Afbeelding Bron: AMD)
De Radiance Display Engine ondersteunt nu hardware flip-meting. (Afbeelding Bron: AMD)

Een blik op de RDNA 4 rekeneenheid

In het begin verschilt de structuur van een RDNA 4 CU niet veel van wat we hebben gezien bij RDNA 3. Er zijn echter prestatie- en efficiëntieverbeteringen in elk van de CU-componenten.

WMMA (Wave Matrix Multiply Accumulate) bewerkingen zijn verbeterd om aan de eisen van de nieuwe hardware te voldoen. Scalerunits krijgen upgrades om Float32-bewerkingen te verwerken. De scheduler kan een grote computerwerklast opsplitsen en verwerken in gesplitste en benoemde barrières.

AMD zei dat RDNA 4 gebouwd is om tegemoet te komen aan de nieuwe renderingtechnieken die ontwikkelaars gebruiken in de games van vandaag. Hoewel upscaling in de mode is geweest, vereist effectieve path tracing ML-versnelling als onderdeel van het renderproces zelf en niet als bijzaak.

RDNA 4: Rekenmotor. (Afbeelding Bron: AMD)
RDNA 4: Rekenmotor. (Afbeelding Bron: AMD)
ML maakt nu deel uit van de kern van het renderproces. (Afbeelding Bron: AMD)
ML maakt nu deel uit van de kern van het renderproces. (Afbeelding Bron: AMD)

Straalversnellers in RDNA 4

RDNA 4 biedt 64 3e generatie straalversnellers in de RX 9070 XT. De structuur van een ray accelerator in RDNA 4 is gelijk aan die in RDNA 3, maar bevat een extra intersectie engine voor 2x het aantal ray box en ray triangle units.

Er is ook een speciale hardware ray transformator die het gebruik van shader instructies overbodig maakt, waardoor de ray traversal overhead geminimaliseerd wordt. Een 128 KB geheugen in elke dual CU houdt de ray stack vast voor efficiënte push- en sorteerbewerkingen.

RDNA 4 introduceert het concept van georiënteerde bounding boxes (OBB's) die BVH bounding boxes uitlijnen op de geometrie, waardoor vals-positieve straalinteracties worden geminimaliseerd in wat anders gewoon lege ruimte in een box is. AMD zegt dat deze aanpak de prestaties van ray traversal met wel 10% kan verbeteren.

Ook nieuw deze keer is ondersteuning voor ontspannen out-of-order geheugenaanvragen die de wachttijd voor golven die de high-level cache eerder hebben gemist, efficiënt vermindert. Dit verbetert niet alleen ray tracing, maar ook andere werklasten.

In RDNA 4 kunnen shaders dynamisch registers toewijzen, waardoor meer golven tijdens de vlucht kunnen worden verwerkt met een verbeterde geheugenlatentie.

Structuur van een RDNA 4 stralenversneller. (Afbeelding Bron: AMD)
Structuur van een RDNA 4 stralenversneller. (Afbeelding Bron: AMD)
RDNA 4 introduceert OBB's (Afbeelding Bron: AMD)
RDNA 4 introduceert OBB's (Afbeelding Bron: AMD)
RDNA 4 staat een meer ontspannen ordening van wave-aanvraagstromen toe. (Afbeelding Bron: AMD)
RDNA 4 staat een meer ontspannen ordening van wave-aanvraagstromen toe. (Afbeelding Bron: AMD)
RDNA 4 straalversnellers leveren 2x de ray traversal prestaties dan RDNA 3. (Afbeelding Bron: AMD)
RDNA 4 straalversnellers leveren 2x de ray traversal prestaties dan RDNA 3. (Afbeelding Bron: AMD)
RDNA 4 dynamische toewijzing van shader-registers. (Afbeelding bron: AMD)
RDNA 4 dynamische toewijzing van shader-registers. (Afbeelding bron: AMD)
 

Traceren van paden met RDNA 4

AMD-kaarten hebben in het algemeen moeite gehad met ray tracing, dus zelfs met RDNA 3-kaarten in het topsegment leek path tracing uitgesloten. RDNA 4 wil dat veranderen met ondersteuning voor neurale radiance caching, samen met een nieuw neuraal supersampling- en denoisingmodel.

AMD heeft geen exacte prestatiecijfers gegeven voor titels die path tracing ondersteunen, maar we zouden een idee moeten krijgen tijdens het beoordelen van deze kaarten.

RDNA 4 biedt verbeterde ondersteuning voor path tracing in games. (Afbeelding Bron: AMD)
RDNA 4 biedt verbeterde ondersteuning voor path tracing in games. (Afbeelding Bron: AMD)
Stap 1: Path tracing begint met 1 sample per pixel. (Afbeelding bron: AMD)
Stap 1: Path tracing begint met 1 sample per pixel. (Afbeelding bron: AMD)
Stap 2: Grid sampling en neurale radiance caching om het licht van de scène te benaderen. (Afbeelding Bron: AMD)
Stap 2: Grid sampling en neurale radiance caching om het licht van de scène te benaderen. (Afbeelding Bron: AMD)
Stap 3: Herstel de directe en globale verlichting. (Afbeelding Bron: AMD)
Stap 3: Herstel de directe en globale verlichting. (Afbeelding Bron: AMD)
Stap 4: Neurale supersampling en denoising. (Afbeelding Bron: AMD)
Stap 4: Neurale supersampling en denoising. (Afbeelding Bron: AMD)
 

AI-mogelijkheden gebouwd op Radeon en Instinct

AMD zei dat RDNA 4 speciale wiskundepijplijnen voor ML-acceleratie bevat die gericht zijn op hoge prestaties met smallere datatypes. Nieuw in RDNA 4 is ondersteuning voor FP8 en BF8 voor hoge prestaties en hoge precisie inferentie.

AMD demonstreerde SDXL 1.5 beeldgeneratie en liet zien hoe de RDNA 4 gebaseerde Radeon RX 9070 XT dubbele FP16 prestaties per CU biedt in vergelijking met de RDNA 3 gebaseerde RX 7900 XT.

Gebruikmakend van RDNA 4's nieuwe AI-mogelijkheden is FSR 4 een end-to-end pijplijn getraind op AMD GPU's. FSR 4 gebruikt FP8 voor optimaal gebruik van bandbreedte, prestaties en vermogen.

AMD toonde tot 3,7x fps verbeteringen met FSR 4 in combinatie met frame interpolatie en Radeon Anti-Lag met behoud van hoge beeldkwaliteit.

RDNA 4 biedt speciale wiskundige pijplijnen voor ML. (Afbeelding Bron: AMD)
RDNA 4 biedt speciale wiskundige pijplijnen voor ML. (Afbeelding Bron: AMD)
2x FP16-prestaties per CU vergeleken met RDNA 3. (Afbeelding Bron: AMD)
2x FP16-prestaties per CU vergeleken met RDNA 3. (Afbeelding Bron: AMD)
FSR 4 maakt gebruik van de FP8-mogelijkheden van RDNA 4. (Afbeelding Bron: AMD)
FSR 4 maakt gebruik van de FP8-mogelijkheden van RDNA 4. (Afbeelding Bron: AMD)
Aanzienlijke fps-boost met FSR 4 en frame-interpolatie bij 4K. (Afbeelding Bron: AMD)
Aanzienlijke fps-boost met FSR 4 en frame-interpolatie bij 4K. (Afbeelding Bron: AMD)

Bron(nen)

AMD Persbericht

Please share our article, every link counts!
Mail Logo
> Overzichten en testrapporten over laptops en mobieltjes > Nieuws > Nieuws Archief > Nieuws archieven 2025 02 > AMD RDNA 4 architectuurdieptepunt: Een 64-CU monolithisch ontwerp met all-round verbeteringen op het gebied van computing, media encode-decode, ray tracing en AI
Vaidyanathan Subramaniam, 2025-02-28 (Update: 2025-02-28)