Notebookcheck Logo

Nvidia GeForce RTX 5090 wijkt af van RTX 3090 Ti en RTX 4090 vlaggenschip traditie, laat VRAM ECC vallen voor pro workloads

U kunt ECC-status niet langer omschakelen op de RTX 5090 Blackwell GPU
U kunt ECC-status niet langer omschakelen op de RTX 5090 Blackwell GPU
Nvidia heeft vreemd genoeg de optie verwijderd om VRAM ECC-status via het stuurprogramma in de RTX 5090 in te schakelen. Kaarten zoals de RTX 3090 Ti en RTX 4090 bieden de mogelijkheid om ECC via het stuurprogramma in te schakelen om de betrouwbaarheid van het geheugen voor professionele workloads te verbeteren, ook al gebruiken deze kaarten een "zachte ECC" in plaats van een speciale on-die ECC geheugenchip.

Sinds de Ampere-generatie heeft Nvidia zijn vlaggenschip Titan kaart vervangen door de 90-serie die gericht is op professionals die ook gamen.

De Nvidia GeForce RTX 5090gB202 GPU brengt aanzienlijke hardwareverbeteringen met zich mee ten opzichte van de RTX 4090aD102 en de RTX 3090 TigA102 GPU's.

Terwijl zowel de RTX 3090 Ti als de RTX 4090 de optie boden om de VRAM ECC-status in het stuurprogramma om te schakelen, ontbreekt deze optie vreemd genoeg bij de RTX 5090.

Wat is ECC-geheugen precies?

ECC, wat staat voor error correction code, is een techniek waarmee het geheugen zichzelf kan corrigeren. Geheugenfouten treden op wanneer er bitflips zijn tijdens de gegevensoverdracht of wanneer er fouten in de gegevens sluipen wanneer geheugencellen hun lading ontladen en aanvullen.

De zelfcorrectie wordt uitgevoerd door een speciale geheugenchip die de pariteit tussen de andere acht chips op de RAM-module controleert (bekend als on-die ECC) of op het niveau van de geheugencontroller (DRAM ECC).

Het DDR5-systeemgeheugen van consumenten ondersteunt ECC, maar niet volledig. Standaard kan DDR5 RAM multi-bit fouten detecteren, maar alleen single-bit fouten corrigeren door middel van ingebouwde gegevenscontrole.

Vanwege de fundamentele manier waarop DDR5 64-bits geheugen opsplitst in twee 32-bits subkanalen, wordt DDR5-ECC RAM geleverd in 72-bits (32+4) EC4 of 80-bits (32+8) EC8 modules.

ECC-geheugen is zelden nodig voor de meeste toepassingen bij consumenten. Als u niet zeker bent van deze term, is de kans groot dat u waarschijnlijk geen ECC-geheugen nodig hebt.

Desalniettemin is ECC-geheugen van het grootste belang in missiekritische toepassingen en toepassingen voor machinaal leren waarbij de integriteit van gegevens over de hele keten moet worden gehandhaafd.

Google realiseerde zich dit op de harde manier in 1999 toen het beknibbelen op het gebruik van ECC-geheugen de prestaties van de zoekmachine drastisch beïnvloedde als gevolg van geheugencorruptie.

EDR op GDDR6X vermindert de kans op crashes tijdens VRAM overklokken. (Afbeelding Bron: Nvidia)
EDR op GDDR6X vermindert de kans op crashes tijdens VRAM overklokken. (Afbeelding Bron: Nvidia)

Alle GPU's met GDDR5 en GDDR6/6X VRAM hebben een manier om geheugenfouten te detecteren die EDC (Error Detection Code) wordt genoemd.

GPU's van Nvidia noemen deze functie Error Detection and Replay (EDR), wat een manier is om de geheugencontroller om een heruitzending van bits te vragen na het uitvoeren van een cyclische redundantiecontrole (CRC).

EDR helpt bij het minimaliseren van pixelartefacten wanneer het VRAM overklokt, hoewel het de prestaties enigszins kan beïnvloeden.

ECC VRAM op de RTX 4090 en RTX 5090

Hoewel er niet veel over wordt gesproken, is een onderscheidend kenmerk van de Nvidia GeForce RTX 3090 Ti en de RTX 4090 desktop GPU's is de mogelijkheid om via het stuurprogramma te wisselen tussen ECC en niet-ECC geheugentoestanden.

Deze functie ontbreekt echter in de nieuwe RTX 5090.

Omschakelen van ECC-status in de RTX 4090
Omschakelen van ECC-status in de RTX 4090
Geen optie om ECC-status om te schakelen met de RTX 5090
Geen optie om ECC-status om te schakelen met de RTX 5090

Prestatie-impact van inschakelen ECC

De RTX 3090 Ti en RTX 4090 implementeren iets dat "zachte ECC" wordt genoemd. Bij deze aanpak is er geen aparte chip nodig voor het handhaven van de pariteit; in plaats daarvan wordt door het inschakelen van deze functie een deel van het VRAM toegewezen om op dezelfde manier te functioneren als een ECC-module op de chip.

Als gevolg hiervan worden het totale beschikbare VRAM en de geheugensnelheid verlaagd. In het geval van de RTX 4090 wordt het bruikbare VRAM teruggebracht van 24 GB naar 22,5 GB, waarbij 1,5 GB wordt gereserveerd voor ECC-functies.

1.5 GB VRAM is toegewezen voor ECC
1.5 GB VRAM is toegewezen voor ECC
Dit wordt ook weergegeven in Taakbeheer
Dit wordt ook weergegeven in Taakbeheer

Het omschakelen van de ECC-status heeft invloed op de prestaties, zoals hieronder te zien is. Met ECC geactiveerd op de RTX 4090, dalen 3DMark Speed Way scores met 6,4%, terwijl Cyberpunk 2077 2.21 Phantom Liberty ongeveer 5% minder gemiddelde fps ervaart.

De mate van invloed op de prestaties hangt af van de werkbelasting.

3DMark Snelheidsmanier op de RTX 4090
3DMark Snelheidsmanier op de RTX 4090
Score daalt wanneer ECC is ingeschakeld
Score daalt wanneer ECC is ingeschakeld
Cyberpunk 2077 2.21 4K RT Ultra (geen DLSS/FG) op de RTX 4090
Cyberpunk 2077 2.21 4K RT Ultra (geen DLSS/FG) op de RTX 4090
Kleine prestatievermindering met ECC aan
Kleine prestatievermindering met ECC aan

GDDR7 VRAM van RTX 5090 is officieel gespecificeerd voor on-die ECC

Met GDDR7 heeft JEDEC on-die ECC opgenomen als onderdeel van de VRAM-specificatie, rekening houdend met de toenemende kans op fouten als gevolg van hogere geheugendichtheden. GDDR7 gebruikt on-die ECC met een transparantieprotocol dat de geheugencontroller informeert over het soort fouten dat zich voordoet.

Volgens JEDEC is GDDR7 in staat tot 100% correctie van 1-bit fouten en 100% detectie van 2-bit fouten, hoewel de detectiegraad iets daalt tot 99,3% voor zeldzame 3-bit fouten.

Daarnaast bevat de officiële specificatie ook command address parity met command blocking (CAPARBLK) om de betrouwbaarheid van de command address bus verder te verbeteren.

Overzicht van on-die ECC op GDDR7 VRAM. (Overgenomen uit JEDEC-document JESD239A)
Overzicht van on-die ECC op GDDR7 VRAM. (Overgenomen uit JEDEC-document JESD239A)

Het is echter niet duidelijk of de geheugencontroller van Blackwell standaard gebruik maakt van deze on-die ECC mogelijkheid.

Het 512-bits GDDR7-geheugen van de RTX 5090 is berekend op een bandbreedte van 1,792 TB/s bij een snelle 28 Gbps klok, wat mogelijk transmissiefouten kan veroorzaken. Bovendien prijst Nvidia de RTX 5090 aan voor AI-workflows, die kunnen profiteren van ECC tijdens het trainen van grote datasets.

Desondanks vermeldt Nvidia's architectuur whitepaper alleen ondersteuning voor "Enhanced Cyclic Redundancy Check (CRC) for Reliability, Availability, and Serviceability (RAS)", wat niet hetzelfde is als ECC.

Hoewel het veilig zou zijn om te verwachten dat Nvidia de on-die ECC-functionaliteit van GDDR7 zou inschakelen voor de Blackwell werkstation-GPU's waarover het gerucht gaatis het nog maar de vraag of de ECC-statusknop via een toekomstige driver of VBIOS-update naar de consumenten RTX 5090 komt.

Bron(nen)

Eigen

Please share our article, every link counts!
Mail Logo
> Overzichten en testrapporten over laptops en mobieltjes > Nieuws > Nieuws Archief > Nieuws archieven 2025 02 > Nvidia GeForce RTX 5090 wijkt af van RTX 3090 Ti en RTX 4090 vlaggenschip traditie, laat VRAM ECC vallen voor pro workloads
Vaidyanathan Subramaniam, 2025-02-13 (Update: 2025-02-14)