
Nvidia hat das offizielle Whitepaper (.PDF) zur Blackwell-Architektur und den darauf basierenden Grafikprozessoren der Geforce RTX 50-Serie veröffentlicht. Damit sind nun auch alle Spezifikationen der Geforce RTX 5070 Ti und Geforce RTX 5070 bekannt, die das Portfolio der heute erscheinenden Geforce RTX 5090 und Geforce RTX 5080 nach unten hin ergänzen und voraussichtlich Ende des kommenden Monats auf den Markt kommen sollen.
Geforce RTX 5090 | Geforce RTX 5080 | Geforce RTX 5070 Ti | Geforce RTX 5070 | |
---|---|---|---|---|
GPU-Codename | GB202 | GB203 | GB203 | GB205 |
GPU-Architektur | Nvidia Blackwell | Nvidia Blackwell | Nvidia Blackwell | Nvidia Blackwell |
GPCs | 11 | 7 | 6 | 5 |
TPCs | 85 | 42 | 35 | 24 |
SMs | 170 | 84 | 70 | 48 |
CUDA Cores / SM | 128 | 128 | 128 | 128 |
CUDA Cores / GPU | 21.760 | 10.752 | 8.960 | 6.144 |
Tensor Cores / SM | 4 (5th Gen) | 4 (5th Gen) | 4 (5th Gen) | 4 (5th Gen) |
Tensor Cores / GPU | 680 (5th Gen) | 336 (5th Gen) | 280 (5th Gen) | 192 (5th Gen) |
RT Cores | 170 (4th Gen) | 84 (4th Gen) | 70 (4th Gen) | 48 (4th Gen) |
Boost-Takt | 2.407 MHz | 2.617 MHz | 2.452 MHz | 2.512 MHz |
Peak FP32 TFLOPS | 104,8 | 56,3 | 43,9 | 30,9 |
Peak FP16 TFLOPS | 104,8 | 56,3 | 43,9 | 30,9 |
Peak BF16 TFLOPS | 104,8 | 56,3 | 43,9 | 30,9 |
Peak INT32 TOPS | 104,8 | 56,3 | 43,9 | 30,9 |
RT TFLOPS | 317,5 | 170,6 | 133,2 | 93,6 |
Peak FP4 Tensor TFLOPS | 1.676/3.352 | 900,4/1.8012 | 703/1.406 | 493,9/987,8 |
Peak FP8 Tensor TFLOPS (FP16) | 838/1.676 | 450,2/900,4 | 351,5/703 | 246,9/493,9 |
Peak FP8 Tensor TFLOPS (FP32) | 419/838 | 225,1/450,2 | 175,8/351,5 | 123,5/246,9 |
Peak FP16 Tensor TFLOPS (FP16) | 419/838 | 225,1/450,2 | 175,8/351,5 | 123,5/246,9 |
Peak FP16 Tensor TFLOPS (FP32) | 209,5/419 | 112,6/225,1 | 87,9/175,8 | 61,7/123,5 |
Peak BF16 Tensor TFLOPS (FP32) | 209,5/419 | 112,6/225,1 | 87,9/175,8 | 61,7/123,5 |
Peak TF32 Tensor TFLOPS | 104,8/209,5 | 56,3/112,6 | 43,9/87,9 | 30,9/61,7 |
Peak INT8 Tensor TOPS | 838/1.676 | 450,2/900,4 | 351,5/703 | 246,9/493,9 |
Frame Buffer Memory Size | 32 GiB GDDR7 | 16 GiB GDDR7 | 16 GiB GDDR7 | 12 GiB GDDR7 |
Memory Interface | 512-Bit | 256-Bit | 256-Bit | 192-Bit |
Memory Clock (Data Rate) | 28 Gbps | 30 Gbps | 28 Gbps | 28 Gbps |
Memory Bandwidth | 1.792 GiB/s | 960 GiB/s | 896 GiB/s | 672 GiB/s |
ROPs | 176 | 112 | 96 | 80 |
Pixel Fill-rate (Gigapixels/s) | 423,6 | 293,1 | 235,4 | 201 |
Texture Units | 680 | 336 | 280 | 192 |
Texel Fill-rate (Gigatexels/s) | 1636,8 | 879,3 | 686,6 | 482,3 |
L1 Data Cache/Shared Memory | 21.760 KiB | 10.752 KiB | 8.960 KiB | 6.144 KiB |
L2 Cache Size | 98.304 KiB | 65.536 KiB | 49.152 KiB | 49.152 KiB |
Register File Size | 43.520 KiB | 21.504 KiB | 17.920 KiB | 12.288 KiB |
Video Engines | 3× NVENC (9th Gen) 2× NVDEC (6th Gen) |
2× NVENC (9th Gen) 2× NVDEC (6th Gen) |
2× NVENC (9th Gen) 1× NVDEC (6th Gen) |
1× NVENC (9th Gen) 1× NVDEC (6th Gen) |
TGP (Total Graphics Power) | 575 Watt | 360 Watt | 300 Watt | 250 Watt |
Anzahl der Transistoren | 92,2 Milliarden | 45,6 Milliarden | 45,6 Milliarden | 31,1 Milliarden |
Chipfläche (Die Size) | 750 mm² | 378 mm² | 378 mm² | 263 mm² |
Fertigungsprozess | TSMC 4nm (4N) | TSMC 4nm (4N) | TSMC 4nm (4N) | TSMC 4nm (4N) |
PCI Express Interface | Gen 5 x16 | Gen 5 x16 | Gen 5 x16 | Gen 5 x16 |