TILLBEHÖR

AMD & NVIDIA nästa generations flaggskepps-GPU:er Detaljerad: RDNA 3 Radeon RX 7900 XT med 15360 kärnor, Ada Lovelace GeForce RTX 4090 med 18432 kärnor

Ryktade specifikationer för nästa generations AMD RDNA 3-drivna Radeon RX 7900 XT & NVIDIA Ada Lovelace-drivna GeForce RTX 4090-grafikkort har återigen detaljerats. Ryktena kommer från Greymon55 som aktivt har publicerat detaljer om kommande hårdvara som CPU:er och GPU:er på sitt Twitter-flöde ett tag nu.

AMD RDNA 3 & NVIDIA Ada Lovelace GPU-driven nästa generations flaggskepp Radeon RX 7900 XT & GeForce RTX 4090 grafikkort Detaljerade

De AMD RDNA 3-drivna Navi 31 och Ada Lovelace-drivna AD102 GPU:erna förväntas ge enorma prestandaförbättringar och kommer också att vara de mest strömkrävande chipsen som någonsin gjorts. Medan NVIDIA siktar på ett monolitiskt tillvägagångssätt med sin Ada Lovelace-arkitektur, kommer AMD att använda en komplett MCM-design som man redan har tagit ledningen i med lanseringen av den CDNA 2-drivna MI200-serien “Aldebaran”. AMD kommer att utnyttja samma MCM-teknik för konsument- och spel-GPU:er nu. Så låt oss prata om de senaste ryktade specifikationerna som vi har fått från läckaren:

AMD Radeon RX 7900 XT grafikkort – RDNA 3-driven Navi 31 flaggskepps-GPU

AMD Navi 31 GPU, flaggskeppet RDNA 3-chip, skulle driva nästa generations Radeon RX 7900 XT-grafikkort. Vi har hört att AMD kommer att släppa CU (Compute Units) till förmån för WGP (Work Group Processors) på sin nästa generations RDNA 3 GPU:er. Eftersom Navi 31 är en MCM GPU kommer den att ha två nyckel-IP:er, en GCD (Graphics Core Die) baserad på TSMC:s 5nm process och en MCD (Multi-Cache Die) baserad på TSMC 6nm processnoden. Tidigare rykten tyder på att AMD redan har tappat ut sin Navi 31 GPU-matris.

Navi 31 GPU-konfigurationen som visas här har två GCD:er (Graphics Core Die) och en enda MCD (Multi-Cache Die). Varje GCD har 3 Shader Engines (6 totalt) och varje Shader Engine har 2 Shader Arrays (2 per SE / 6 per GCD / 12 totalt). Varje Shader Array består av 5 WGPs (10 per SE / 30 per GCD / 60 totalt) och varje WGP har 8 SIMD32-enheter med 32 ALU:er (40 SIMD32 per SA / 80 per SE / 240 per GCD / 480 totalt). Dessa SIMD32-enheter utgör tillsammans 7 680 kärnor per GCD och totalt 15 360 kärnor.

Prestandamässigt förväntas GPU:n ha en klockhastighet på 2,4 – 2,5 GHz, vilket sätter dess teoretiska prestanda på cirka 75 TFLOPs (FP32). Detta är en galen förbättring på 226 % jämfört med ett Radeon RX 6900 XT grafikkort.

Navi 31 (RDNA 3) MCD kommer att länkas till de dubbla GCD:erna via en nästa generations Infinity Fabric-interconnect och har 256-512 MB Infinity Cache. Varje GPU bör också ha 4 minnesanslutningslänkar (32-bitars). Det är totalt 8 32-bitars minneskontroller för ett 256-bitars bussgränssnitt. Det anges att kortet kommer att ha upp till 32 GB GDDR6-minne som körs med 18 Gbps pin-hastigheter och som levererar upp till 576 GB/s bandbredd. Ett annat rykte som nyligen dök upp tyder på att AMD kommer att använda 3D Infinity Cache-teknik på sin RDNA 3-linje som kommer att integrera den nya cachen i vertikala stackar på GPU:erna, liknande hur Vermeer-X-chippen kommer att stapla L3-cache över CCD.

AMD RDNA GPU (Generationsjämförelse) Preliminär:

GPU-namnNavi 10Navi 21Navi 31
GPU-process7nm7nm5nm (6nm?)
GPU-paketMonolitiskMonolitiskMCD (Multi-Chiplet Die)
Shader motorer246
GPU WGPs204030 (per MCD)60 (Totalt)
SP per WGP128128256
Beräkna enheter (per die)4080120 (per MCD)240 (totalt)
Kärnor (per die)256051207680
Kärnor (totalt)2560512015360 (2 x MCD)
Högsta klocka1905 MHz2250 MHz2500 MHz
FP32 Compute9.72338,4
Minnesbuss256-bitars256-bitars256-bitars
MinnestypGDDR6GDDR6GDDR6
Minneskapacitet8 GB16 GB32 GB
Infinity cacheN/A128 MB512 MB
Flaggskepps-SKURadeon RX 5700 XTRadeon RX 6900 XTXRadeon RX 7950 XT
TBP225W330W500W
LanseraQ3 2019Q4 2020Q4 2022

NVIDIA GeForce RTX 4090 grafikkort – Ada Lovelace-driven AD102 flaggskepps-GPU

Baserat på tidigare rykten har det förekommit viskningar om att NVIDIA skulle använda TSMC:s N5 (5nm) processnod för sina Ada Lovelace GPU:er. Detta inkluderar även AD102 SKU som kommer att vara en helt monolitisk design. I hans senaste tweet som talar om de specifika GPU-konfigurationerna, sägs AD102 GPU ha en klockhastighet så hög som 2,5 GHz (2,3 GHz genomsnittlig ökning). Den specifika tweeten säger att GPU-klockan för Ada Lovelace ‘AD102’ kan vara 2,3 GHz eller högre så låt oss ta det som en baslinje och tidigare läckta specifikationer för att ta reda på var prestandan ska landa.

NVIDIA AD102 “ADA GPU” verkar ha 18432 CUDA-kärnor baserat på de preliminära specifikationerna (som kan ändras), inrymt inom 144 SM-enheter. Detta är nästan dubbelt så många kärnor som finns i Ampere som redan var ett stort steg upp från Turing. En klockhastighet på 2,3-2,5 GHz skulle ge oss upp till 85 till 92 TFLOP:s beräkningsprestanda (FP32). Detta är mer än dubbelt så mycket FP32-prestandan som den befintliga RTX 3090 som har 36 TFLOP:s FP32-beräkningskraft.

Prestandahoppet på 150 % ser enormt ut men man bör komma ihåg att NVIDIA redan gav ett stort hopp i FP32-siffror den här generationen med Ampere. Ampere GA102 GPU (RTX 3090) erbjuder 36 TFLOPs medan Turing TU102 GPU (RTX 2080 Ti) erbjöd 13 TFLOPs. Det är över 150 % ökning av FP32-flops men den verkliga spelprestandaökningen för RTX 3090 var i genomsnitt cirka 50-60 % snabbare jämfört med RTX 2080 Ti. Så en sak vi inte bör glömma är att Flops inte är lika med GPU-spelprestanda nuförtiden. Dessutom vet vi inte om 2,3-2,5 GHz är den genomsnittliga boosten eller toppförstärkningen med det förra som betyder att det kan finnas ännu högre beräkningspotential för AD102.

Bortsett från det säger läckaren också att flaggskeppet NVIDIA GeForce RTX 40 skulle behålla ett 384-bitars bussgränssnitt, liknande RTX 3090. Vad som är intressant är dock att läckaren nämner G6X vilket betyder att NVIDIA inte kommer att flytta till en ny minnesstandard till efter Ada Lovelace och utnyttja de högre pin-hastigheterna hos G6X på 21 Gbps för nästa generations kort innan vi ser en nyare standard (t.ex. GDDR7). Kortet kommer att ha 24 GB minne så vi kan antingen förvänta oss enkelsidiga 16 Gb DRAM eller dubbelsidiga 8 Gb DRAM-moduler.

NVIDIA CUDA GPU (RYKTADE) Preliminär:

GPUTU102GA102AD102
Flaggskepps-SKURTX 2080 TiRTX 3090 TiRTX 4090?
ArkitekturTuringAmpereAda Lovelace
BearbetaTSMC 12nm NFFSamsung 8nmTSMC 4N?
Dies storlek754 mm2628 mm2~600mm2
Graphics Processing Clusters (GPC)6712
Texture Processing Clusters (TPC)364272
Strömmande multiprocessorer (SM)7284144
CUDA kärnor46081075218432
L2-cache6 MB6 MB96 MB
Teoretiska TFLOPs16 TFLOPs40 TFLOP:s~90 TFLOPs?
MinnestypGDDR6GDDR6XGDDR6X
Minneskapacitet11 GB (2080 Ti)24 GB (3090 Ti)24 GB (4090?)
Minneshastighet14 Gbps21 Gbps24 Gbps?
minnesbandbredd616 GB/s1,008 GB/s1152 GB/s?
Minnesbuss384-bitars384-bitars384-bitars
PCIe-gränssnittPCIe Gen 3.0PCIe Gen 4.0PCIe Gen 4.0
TGP250W350W600W?
Släppseptember 201820 september2H 2022 (TBC)

NVIDIA Ada Lovelace GPU:erna kommer att driva nästa generations GeForce RTX 40-grafikkort som kommer att gå direkt med AMD:s RDNA 3-baserade Radeon RX 7000-grafikkort. Det finns fortfarande en del spekulationer angående användningen av MCM av NVIDIA. Hopper GPU, som främst är inriktad på Datacenter & AI-segmentet, påstås ha släppts inom kort och kommer att ha en MCM-arkitektur. NVIDIA kommer inte att använda en MCM-design på sina Ada Lovelace GPU:er så de kommer att behålla den traditionella monolitiska designen.

NVIDIA Ada Lovelace (AD102)

Vilka nästa generations GPU:er ser du mest fram emot?

Botón volver arriba

Ad blocker detected

You must remove the AD BLOCKER to continue using our website THANK YOU