Ryktade specifikationer för nästa generations AMD RDNA 3-drivna Radeon RX 7900 XT & NVIDIA Ada Lovelace-drivna GeForce RTX 4090-grafikkort har återigen detaljerats. Ryktena kommer från Greymon55 som aktivt har publicerat detaljer om kommande hårdvara som CPU:er och GPU:er på sitt Twitter-flöde ett tag nu.
AMD RDNA 3 & NVIDIA Ada Lovelace GPU-driven nästa generations flaggskepp Radeon RX 7900 XT & GeForce RTX 4090 grafikkort Detaljerade
De AMD RDNA 3-drivna Navi 31 och Ada Lovelace-drivna AD102 GPU:erna förväntas ge enorma prestandaförbättringar och kommer också att vara de mest strömkrävande chipsen som någonsin gjorts. Medan NVIDIA siktar på ett monolitiskt tillvägagångssätt med sin Ada Lovelace-arkitektur, kommer AMD att använda en komplett MCM-design som man redan har tagit ledningen i med lanseringen av den CDNA 2-drivna MI200-serien “Aldebaran”. AMD kommer att utnyttja samma MCM-teknik för konsument- och spel-GPU:er nu. Så låt oss prata om de senaste ryktade specifikationerna som vi har fått från läckaren:
AD1025nm TSMC144SM 18432CUDA384bit 24G GDDR6X 21Gbps?2.3~2.5GHz?85~92T FP32?
— Greymon55 (@greymon55) 9 november 2021
AMD Radeon RX 7900 XT grafikkort – RDNA 3-driven Navi 31 flaggskepps-GPU
AMD Navi 31 GPU, flaggskeppet RDNA 3-chip, skulle driva nästa generations Radeon RX 7900 XT-grafikkort. Vi har hört att AMD kommer att släppa CU (Compute Units) till förmån för WGP (Work Group Processors) på sin nästa generations RDNA 3 GPU:er. Eftersom Navi 31 är en MCM GPU kommer den att ha två nyckel-IP:er, en GCD (Graphics Core Die) baserad på TSMC:s 5nm process och en MCD (Multi-Cache Die) baserad på TSMC 6nm processnoden. Tidigare rykten tyder på att AMD redan har tappat ut sin Navi 31 GPU-matris.
Navi 31 GPU-konfigurationen som visas här har två GCD:er (Graphics Core Die) och en enda MCD (Multi-Cache Die). Varje GCD har 3 Shader Engines (6 totalt) och varje Shader Engine har 2 Shader Arrays (2 per SE / 6 per GCD / 12 totalt). Varje Shader Array består av 5 WGPs (10 per SE / 30 per GCD / 60 totalt) och varje WGP har 8 SIMD32-enheter med 32 ALU:er (40 SIMD32 per SA / 80 per SE / 240 per GCD / 480 totalt). Dessa SIMD32-enheter utgör tillsammans 7 680 kärnor per GCD och totalt 15 360 kärnor.

Prestandamässigt förväntas GPU:n ha en klockhastighet på 2,4 – 2,5 GHz, vilket sätter dess teoretiska prestanda på cirka 75 TFLOPs (FP32). Detta är en galen förbättring på 226 % jämfört med ett Radeon RX 6900 XT grafikkort.
Navi 31 (RDNA 3) MCD kommer att länkas till de dubbla GCD:erna via en nästa generations Infinity Fabric-interconnect och har 256-512 MB Infinity Cache. Varje GPU bör också ha 4 minnesanslutningslänkar (32-bitars). Det är totalt 8 32-bitars minneskontroller för ett 256-bitars bussgränssnitt. Det anges att kortet kommer att ha upp till 32 GB GDDR6-minne som körs med 18 Gbps pin-hastigheter och som levererar upp till 576 GB/s bandbredd. Ett annat rykte som nyligen dök upp tyder på att AMD kommer att använda 3D Infinity Cache-teknik på sin RDNA 3-linje som kommer att integrera den nya cachen i vertikala stackar på GPU:erna, liknande hur Vermeer-X-chippen kommer att stapla L3-cache över CCD.
AMD RDNA GPU (Generationsjämförelse) Preliminär:
GPU-process | 7nm | 7nm | 5nm (6nm?) |
GPU-paket | Monolitisk | Monolitisk | MCD (Multi-Chiplet Die) |
Shader motorer | 2 | 4 | 6 |
GPU WGPs | 20 | 40 | 30 (per MCD)60 (Totalt) |
SP per WGP | 128 | 128 | 256 |
Beräkna enheter (per die) | 40 | 80 | 120 (per MCD)240 (totalt) |
Kärnor (per die) | 2560 | 5120 | 7680 |
Kärnor (totalt) | 2560 | 5120 | 15360 (2 x MCD) |
Högsta klocka | 1905 MHz | 2250 MHz | 2500 MHz |
FP32 Compute | 9.7 | 23 | 38,4 |
Minnesbuss | 256-bitars | 256-bitars | 256-bitars |
Minnestyp | GDDR6 | GDDR6 | GDDR6 |
Minneskapacitet | 8 GB | 16 GB | 32 GB |
Infinity cache | N/A | 128 MB | 512 MB |
Flaggskepps-SKU | Radeon RX 5700 XT | Radeon RX 6900 XTX | Radeon RX 7950 XT |
TBP | 225W | 330W | 500W |
Lansera | Q3 2019 | Q4 2020 | Q4 2022 |
NVIDIA GeForce RTX 4090 grafikkort – Ada Lovelace-driven AD102 flaggskepps-GPU
Baserat på tidigare rykten har det förekommit viskningar om att NVIDIA skulle använda TSMC:s N5 (5nm) processnod för sina Ada Lovelace GPU:er. Detta inkluderar även AD102 SKU som kommer att vara en helt monolitisk design. I hans senaste tweet som talar om de specifika GPU-konfigurationerna, sägs AD102 GPU ha en klockhastighet så hög som 2,5 GHz (2,3 GHz genomsnittlig ökning). Den specifika tweeten säger att GPU-klockan för Ada Lovelace ‘AD102’ kan vara 2,3 GHz eller högre så låt oss ta det som en baslinje och tidigare läckta specifikationer för att ta reda på var prestandan ska landa.
NVIDIA AD102 “ADA GPU” verkar ha 18432 CUDA-kärnor baserat på de preliminära specifikationerna (som kan ändras), inrymt inom 144 SM-enheter. Detta är nästan dubbelt så många kärnor som finns i Ampere som redan var ett stort steg upp från Turing. En klockhastighet på 2,3-2,5 GHz skulle ge oss upp till 85 till 92 TFLOP:s beräkningsprestanda (FP32). Detta är mer än dubbelt så mycket FP32-prestandan som den befintliga RTX 3090 som har 36 TFLOP:s FP32-beräkningskraft.

Prestandahoppet på 150 % ser enormt ut men man bör komma ihåg att NVIDIA redan gav ett stort hopp i FP32-siffror den här generationen med Ampere. Ampere GA102 GPU (RTX 3090) erbjuder 36 TFLOPs medan Turing TU102 GPU (RTX 2080 Ti) erbjöd 13 TFLOPs. Det är över 150 % ökning av FP32-flops men den verkliga spelprestandaökningen för RTX 3090 var i genomsnitt cirka 50-60 % snabbare jämfört med RTX 2080 Ti. Så en sak vi inte bör glömma är att Flops inte är lika med GPU-spelprestanda nuförtiden. Dessutom vet vi inte om 2,3-2,5 GHz är den genomsnittliga boosten eller toppförstärkningen med det förra som betyder att det kan finnas ännu högre beräkningspotential för AD102.
Bortsett från det säger läckaren också att flaggskeppet NVIDIA GeForce RTX 40 skulle behålla ett 384-bitars bussgränssnitt, liknande RTX 3090. Vad som är intressant är dock att läckaren nämner G6X vilket betyder att NVIDIA inte kommer att flytta till en ny minnesstandard till efter Ada Lovelace och utnyttja de högre pin-hastigheterna hos G6X på 21 Gbps för nästa generations kort innan vi ser en nyare standard (t.ex. GDDR7). Kortet kommer att ha 24 GB minne så vi kan antingen förvänta oss enkelsidiga 16 Gb DRAM eller dubbelsidiga 8 Gb DRAM-moduler.
NVIDIA CUDA GPU (RYKTADE) Preliminär:
Flaggskepps-SKU | RTX 2080 Ti | RTX 3090 Ti | RTX 4090? |
Arkitektur | Turing | Ampere | Ada Lovelace |
Bearbeta | TSMC 12nm NFF | Samsung 8nm | TSMC 4N? |
Dies storlek | 754 mm2 | 628 mm2 | ~600mm2 |
Graphics Processing Clusters (GPC) | 6 | 7 | 12 |
Texture Processing Clusters (TPC) | 36 | 42 | 72 |
Strömmande multiprocessorer (SM) | 72 | 84 | 144 |
CUDA kärnor | 4608 | 10752 | 18432 |
L2-cache | 6 MB | 6 MB | 96 MB |
Teoretiska TFLOPs | 16 TFLOPs | 40 TFLOP:s | ~90 TFLOPs? |
Minnestyp | GDDR6 | GDDR6X | GDDR6X |
Minneskapacitet | 11 GB (2080 Ti) | 24 GB (3090 Ti) | 24 GB (4090?) |
Minneshastighet | 14 Gbps | 21 Gbps | 24 Gbps? |
minnesbandbredd | 616 GB/s | 1,008 GB/s | 1152 GB/s? |
Minnesbuss | 384-bitars | 384-bitars | 384-bitars |
PCIe-gränssnitt | PCIe Gen 3.0 | PCIe Gen 4.0 | PCIe Gen 4.0 |
TGP | 250W | 350W | 600W? |
Släpp | september 2018 | 20 september | 2H 2022 (TBC) |
NVIDIA Ada Lovelace GPU:erna kommer att driva nästa generations GeForce RTX 40-grafikkort som kommer att gå direkt med AMD:s RDNA 3-baserade Radeon RX 7000-grafikkort. Det finns fortfarande en del spekulationer angående användningen av MCM av NVIDIA. Hopper GPU, som främst är inriktad på Datacenter & AI-segmentet, påstås ha släppts inom kort och kommer att ha en MCM-arkitektur. NVIDIA kommer inte att använda en MCM-design på sina Ada Lovelace GPU:er så de kommer att behålla den traditionella monolitiska designen.
NVIDIA Ada Lovelace (AD102)
Vilka nästa generations GPU:er ser du mest fram emot?