AMD bood een voorproefje rDNA 4 op CES 2025 en bevestigde de komst van de Radeon RX 9070 XT en de RX 9070, maar maakte tijdens de eigenlijke keynote niet eens een opmerking over de nieuwe architectuur.
Het bedrijf hield echter vol dat er snel meer informatie over RDNA 4 en de nieuwe Radeon GPU's zou volgen, en hier zijn we dan.
Vandaag onthult AMD RDNA 4 en de nieuwe Radeon RX 9070-serie GPU's. De RX 9070-serie zal vanaf 6 maart officieel verkrijgbaar zijn in de winkels en de prestatiebeoordelingen volgen een dag eerder.
AMD RDNA 4: Terug naar een monolithisch ontwerp
RDNA 4 bouwt voort op de doelen die AMD zichzelf had gesteld met RDNA 3. Volgens AMD is RDNA 4 ontworpen voor zwaardere gaming workloads met een focus op verbeterde rasterprestaties en efficiëntie.
Daarnaast zijn er de gebruikelijke verbeteringen aan de ray tracing-pijplijnen, samen met een hernieuwde focus op AI-mogelijkheden en media coderen/decoderen.
Top 10 Testrapporten
» Top 10 Multimedia Notebooks
» Top 10 Gaming-Notebooks
» Top 10 Budget Gaming Laptops
» Top 10 Lichtgewicht Gaming-Notebooks
» Top 10 Premium Office/Business-Notebooks
» Top 10 Budget Office/Business-Notebooks
» Top 10 Workstation-Laptops
» Top 10 Subnotebooks
» Top 10 Ultrabooks
» Top 10 Notebooks tot €300
» Top 10 Notebooks tot €500
» Top 10 Notebooks tot € 1.000De beste notebookbeeldschermen zoals getest door Notebookcheck
» De beste notebookbeeldschermen
» Top Windows Alternatieven voor de MacBook Pro 13
» Top Windows Alternatieven voor de MacBook Pro 15
» Top Windows alternatieven voor de MacBook 12 en Air
» Top 10 best verkopende notebooks op Amazon
» Top 10 Convertible Notebooks
» Top 10 Tablets
» Top 10 Tablets tot € 250
» Top 10 Smartphones
» Top 10 Phablets (>90cm²)
» Top 10 Camera Smartphones
» Top 10 Smartphones tot €500
» Top 10 best verkopende smartphones op Amazon
RDNA 3 zag de komst van een chiplet-ontwerp voor GPU's, geïnspireerd op Ryzen-processors. Hier zagen we de scheiding tussen de geheugencache dies (MCD's) en de graphics compute die (GCD).
Met RDNA 4 keert AMD echter terug naar het traditionele monolithische ontwerp. De componenten zijn in wezen hetzelfde, maar er zijn geen MCD-GCD interconnecties omdat het geheugen en de compute nu rechtstreeks met elkaar verbonden zijn door de Infinity Cache.
De RDNA 4 GPU, in dit geval de Radeon RX 9070 XT, heeft vier shader engines met elk acht workgroup processors (WGP's). Elke WGP bestaat uit in totaal acht compute units (CU's) voor een totaal van 64 CU's.
AMD zegt dat de nieuwe compute units nu capabeler zijn dan ooit en verbeterde ray tracing, dubbele piekdoorvoer en ondersteuning voor de nieuwste matrixversnellingsmogelijkheden met bredere ondersteuning voor numerieke indelingen mogelijk maken.
Nieuw in de RDNA 4 CU, en een die we al hebben gezien met de Tensor cores in de Ampere-architectuur van Nvidia, is ondersteuning voor gestructureerde sparsity, die snellere matrixbewerkingen mogelijk maakt, vooral in gevallen waarin veel van de gewichten nul zijn.
We krijgen ook verbeteringen aan het geheugensubsysteem te zien. De L2-cache wordt verhoogd van 6 MB in RDNA 3 naar 8 MB in RDNA 4, terwijl de Infinity Cache wordt geüpgraded naar 3e generatie, maar daalt van 96 MB in RDNA 3 naar 64 MB.
AMD blijft met de nieuwe generatie vertrouwen op GDDR6-geheugen. Zowel de RX 9070 XT als de RX 9070 bieden een 384-bits 16 GB GDDR6 geheugeninterface geklokt op 20 Gbps voor een effectieve bandbreedte van 640 GB/s. Dit is veel lager dan de 960 GB/s bandbreedte van RDNA 3, maar AMD zegt dat de videogeheugenspecificaties van RDNA 4 zorgvuldig gekozen zijn om huidige en toekomstige titels te ondersteunen.
Verbeterde media engine en hardware flip metering ondersteuning
Het coderen van video was een van de grootste valkuilen bij RDNA 3, en AMD belooft aanzienlijke verbeteringen in dit opzicht. Het bedrijf belooft grote verbeteringen in H.264 en AV1 codering en minder blocking artefacten voor dezelfde hoeveelheid data.
De verbeteringen hebben ook betrekking op videodecodering, met minder stroomverbruik en betere prestaties bij het decoderen van formaten zoals AV1 en VP9.
De Radiance Display Engine verbruikt nu veel minder stroom in FreeSync-configuraties met twee monitoren. Ook nieuw is ondersteuning voor hardware flip queue in Windows Display Driver Model (WDDM) 3.0 voor het afspelen van video.
Dit maakt CPU-bronnen vrij door frame scheduling over te hevelen naar de GPU. De MFG-technologie (Multi-frame Generation) in Nvidia Blackwell GPU's maakt ook gebruik van hardware flip-meting.
Een blik op de RDNA 4 rekeneenheid
In het begin verschilt de structuur van een RDNA 4 CU niet veel van wat we hebben gezien bij RDNA 3. Er zijn echter prestatie- en efficiëntieverbeteringen in elk van de CU-componenten.
WMMA (Wave Matrix Multiply Accumulate) bewerkingen zijn verbeterd om aan de eisen van de nieuwe hardware te voldoen. Scalerunits krijgen upgrades om Float32-bewerkingen te verwerken. De scheduler kan een grote computerwerklast opsplitsen en verwerken in gesplitste en benoemde barrières.
AMD zei dat RDNA 4 gebouwd is om tegemoet te komen aan de nieuwe renderingtechnieken die ontwikkelaars gebruiken in de games van vandaag. Hoewel upscaling in de mode is geweest, vereist effectieve path tracing ML-versnelling als onderdeel van het renderproces zelf en niet als bijzaak.
Straalversnellers in RDNA 4
RDNA 4 biedt 64 3e generatie straalversnellers in de RX 9070 XT. De structuur van een ray accelerator in RDNA 4 is gelijk aan die in RDNA 3, maar bevat een extra intersectie engine voor 2x het aantal ray box en ray triangle units.
Er is ook een speciale hardware ray transformator die het gebruik van shader instructies overbodig maakt, waardoor de ray traversal overhead geminimaliseerd wordt. Een 128 KB geheugen in elke dual CU houdt de ray stack vast voor efficiënte push- en sorteerbewerkingen.
RDNA 4 introduceert het concept van georiënteerde bounding boxes (OBB's) die BVH bounding boxes uitlijnen op de geometrie, waardoor vals-positieve straalinteracties worden geminimaliseerd in wat anders gewoon lege ruimte in een box is. AMD zegt dat deze aanpak de prestaties van ray traversal met wel 10% kan verbeteren.
Ook nieuw deze keer is ondersteuning voor ontspannen out-of-order geheugenaanvragen die de wachttijd voor golven die de high-level cache eerder hebben gemist, efficiënt vermindert. Dit verbetert niet alleen ray tracing, maar ook andere werklasten.
In RDNA 4 kunnen shaders dynamisch registers toewijzen, waardoor meer golven tijdens de vlucht kunnen worden verwerkt met een verbeterde geheugenlatentie.
Traceren van paden met RDNA 4
AMD-kaarten hebben in het algemeen moeite gehad met ray tracing, dus zelfs met RDNA 3-kaarten in het topsegment leek path tracing uitgesloten. RDNA 4 wil dat veranderen met ondersteuning voor neurale radiance caching, samen met een nieuw neuraal supersampling- en denoisingmodel.
AMD heeft geen exacte prestatiecijfers gegeven voor titels die path tracing ondersteunen, maar we zouden een idee moeten krijgen tijdens het beoordelen van deze kaarten.
AI-mogelijkheden gebouwd op Radeon en Instinct
AMD zei dat RDNA 4 speciale wiskundepijplijnen voor ML-acceleratie bevat die gericht zijn op hoge prestaties met smallere datatypes. Nieuw in RDNA 4 is ondersteuning voor FP8 en BF8 voor hoge prestaties en hoge precisie inferentie.
AMD demonstreerde SDXL 1.5 beeldgeneratie en liet zien hoe de RDNA 4 gebaseerde Radeon RX 9070 XT dubbele FP16 prestaties per CU biedt in vergelijking met de RDNA 3 gebaseerde RX 7900 XT.
Gebruikmakend van RDNA 4's nieuwe AI-mogelijkheden is FSR 4 een end-to-end pijplijn getraind op AMD GPU's. FSR 4 gebruikt FP8 voor optimaal gebruik van bandbreedte, prestaties en vermogen.
AMD toonde tot 3,7x fps verbeteringen met FSR 4 in combinatie met frame interpolatie en Radeon Anti-Lag met behoud van hoge beeldkwaliteit.
Bron(nen)
AMD Persbericht