NVIDIA GeForce RTX 40 Serisi İnceleme
Gerçek zamanlı grafik hesaplama arenasında liderliği uzun yıllardır kimselere kaptırmayan NVIDIA, geçtiğimiz eylül-ekim aylarına damgasını vuran yeni nesil GeForce RTX 40 serisi ekran kartlarını birer birer tanıtmaya ve kullanıcılarla buluşturmaya başladı. Yalnızca kas gücü bakımından değil aynı zamanda arkasına aldığı derin öğrenme ve yapay zekâ teknolojileriyle de kendinden önce gelen “RTX” serisi ekran kartlarını sollayıp geçen GeForce RTX 40 serisi, özellikle tepe seviye modellerin şaşırtıcı performanslarına ek olarak yeni DLSS imkânlarıyla da dikkat çekiyor. NVIDIA’nın “Optik Akış Hızlandırıcı” şeklinde isimlendirdiği ve DLSS 3’e zemin teşkil eden özellik, olağanüstü performans artışlarına ve dudak uçuklatıcı kare/saniye oranlarının elde edilebilmesine olanak tanıyor. Hazırsanız gelin, ünlü matematikçi Ada Lovelace’tan adını alan mimari üzerine inşa edilen NVIDIA GeForce RTX 40 serisinin teknik ayrıntılarına göz atalım.
TSMC ile İş Birliği, Yeni Nesil Kartları Avantajlı Kılıyor
GeForce RTX 30 ekran kartlarının grafik işlemci üretimi sürecinde Samsung ile iş birliği yapan ancak bu defa yeni seri için TSMC ile çalışan NVIDIA, 8 nm üretim sürecinden 4 nm üretim sürecine geçişin sunduğu tüm avantajlardan yararlanıyor. Çok kısaca ifade etmek gerekirse üretim sürecinin yarı yarıya azalmış olması, aynı, hatta daha az alana, daha fazla sayıda transistör sığdırabilmek anlamına geliyor. Bu sayede hem verimlilik hem de toplamda elde edilen performans artmış oluyor. Detaylara geçmeden önce küçük bir kıyaslamayla bu geçişin yansımasından söz edelim.
Önceki neslin kralı konumundaki NVIDIA GeForce RTX 3090 Ti ekran kartının grafik işlemcisi 628 mm²’lik boyuta sahipti ve 28,3 milyon transistör içeriyordu. Yeni neslin, şimdilik en güçlüsü olan NVIDIA GeForce RTX 4090 ise 608 mm²’lik grafik işlemci boyutuna karşın 76,3 milyon transistör ile geliyor. Her birinin arasındaki mesafe azalan ve sayıca artan transistörler, RTX 40 serisinin en güçlüsüne -ve serinin diğer üyelerine de- teknik açıdan büyük kazanımlar sunuyor. Yine iki ekran kartının grafik işlemcilerini örnek alarak devam edersek 10572 CUDA çekirdeği (işlemci çekirdeği) bulunduran GeForce RTX 3090 Ti modelinden farklı olarak GeForce RTX 4090, tam 16384 CUDA çekirdeğiyle yapılandırılıyor. Transistörler arası mesafenin azalması, grafik işlemcinin saat hızlarının da artmasını mümkün kılıyor ve 1860 MHz boost frekanslı GeForce RTX 3090 Ti modelini, 2520 MHz boost frekansıyla geçen GeForce RTX 4090, bu yönden de yeni mimarinin ne denli verimli olduğunu ispat ediyor. Tabii yeni mimari, yalnızca transistör bazında değil, teknoloji cephesinde de birtakım yenilikler ve üstünlükleri beraberinde getiriyor.
Yüksek Performansın Kilidi, Daha Fazla L2 Önbellek ile Açılıyor
Ekran kartlarının hesaplamadan sorumlu birimi olan grafik işlem birimlerinden bahsederken genellikle bu birimlerin ne gibi teknik konfigürasyonlar içerdiğinden -biraz da kafa karıştırmamak adına- söz etmiyoruz ancak NVIDIA GeForce RTX 4090 özelinde RTX 40 serisinin artan L2 önbellek miktarına değinmek gerekiyor. Masaüstü ve dizüstü bilgisayarlardaki merkezî işlemcilerin (CPU) performansını büyük ölçüde değiştiren önbellekler, ekran kartı grafik işlem birimlerinin de ne kadar veriyi işleyebileceklerini belirleyerek grafik işlemcinin genel performansını tayin edebiliyor. Bu sürecin farkında olan ve yeni nesil ekran kartlarında, grafik işlem birimlerinin önbellek darboğazına takılmamaları adına bahse konu önbelleğin boyutunu artıran NVIDIA, önceki neslin tepe seviyesi GeForce RTX 3090 Ti modelinde, 6 MB kullandığı önbellek miktarını, bu neslin tepe seviyesinde tam 12 kat artırarak 72 MB düzeyine getiriyor. Tabii, GeForce RTX 40 serisinin alt kırılımlarında bu değer 72 MB olarak kalmayıp 64 MB (RTX 4080), 48 MB (4070 Ti) şeklinde azalıyor ancak azalan bu değerler bile önceki neslin birkaç kat ötesine geçmeyi başarıyor.
Ada Lovelace mimarili yeni nesil NVIDIA ekran kartlarında değişen ve yenilenen unsurlardan biri de NVIDIA’nın hayatımıza GeForce RTX 20 serisiyle kazandırdığı ray tracing ve DLSS (Derin Öğrenme Temelli Süper Örnekleme) teknolojilerine hayat veren RT ve Tensör çekirdekleri oluyor. Hem yapısal olarak iyileştirilen hem de daha kabiliyetli hâle getirilen bu çekirdeklerin sayısı, GeForce RTX 4090 tarafında 128 RT çekirdeği ve 512 Tensör çekirdeği olarak belirtiliyor ki bu sayılar, yine önceki neslin tepe seviyesine kıyasla (84 RT, 336 Tensör) daha yüksek seviyede kalıyor. Gerçek zamanlı ışın izleme kabiliyetleri optimize edilen RT çekirdekleri, artık oyunlarda ışın izleme açıkken daha yüksek kare/saniye oranları alınabilmesini sağlarken DLSS 3 teknolojisini bizlere armağan eden yeni nesil Tensör çekirdekleri ise bu teknolojinin Optik Akış Hızlandırıcı özelliği sayesinde oyunlardaki kareleri analiz edip akıcılığı ve gerçekçiliği bozmayacak şekilde sıfırdan yeni kareler oluşturup oyuna ekliyor. DLSS 2 ile arasında performans bakımından uçurumlar yaratan DLSS 3 teknolojisi, bu teknolojiden yararlanan oyunlarda muazzam kare/saniye oranları alınabilmesine imkân tanıyor.
AV1 Kodlama Desteği ve Daha Nicesi RTX 40 Serisinde
Çeşitli video yayın platformları aracılığıyla canlı yayınlar yapanların hayatını kolaylaştıran yeniliklerle gelen NVIDIA GeForce RTX 40 serisi, AV1 kodlama yetenekleriyle elini daha da güçlendiriyor. Önceki nesil GeForce RTX üyeleri, AV1 çözme yeteneklerine sahipti ancak grafik işlemci temelli AV1 kodlama, hâlihazırda Full HD (1080p) çözünürlükte yayın yapan yayıncıların aynı görüntü kalitesini ve bit değerlerini koruyarak yayın çözünürlüklerini 1440p’ye taşıyabilmelerine olanak veriyor. Bunun yanı sıra teknik yönden iyileştirilen NVIDIA Reflex başta olmak üzere güncel NVIDIA ekran kartlarında kullanılabilen özellikler, GeForce RTX 40 serisinde bulunuyor. Şimdiye kadar gerek masaüstü gerekse dizüstü bilgisayar sürümleri çıkan yeni nesil NVIDIA grafik işlemcilerin/ekran kartlarının bazılarının teknik ayrıntılarına bakarak yazıyı sonlandıralım.
Ekran Kartı | RTX 4090 | RTX 4080 | RTX 4070 Ti | RTX 4070 | RTX 4060 Ti |
CUDA Çekirdeği | 16384 | 9728 | 7680 | 5888 | 4352 |
GPU Boost Hızı | 2520 MHz | 2505 MHz | 2610 MHz | 2475 MHz | 2535 MHz |
Bellek Kapasitesi | 24 GB | 16 GB | 12 GB | 12 GB | 8 GB |
Belllek Tipi | GDDR6X | GDDR6X | GDDR6X | GDDR6X | GDDR6 |
Güç Tüketimi | 450 Watt (TDP) | 320 Watt (TDP) | 285 Watt (TDP) | 200 Watt (TDP) | 160 Watt (TDP) |
PSU Gereksinimi | 850 Watt | 700 Watt | 600 Watt | 550 Watt | 450 Watt |