NVIDIA, Blackwell GPU’lu GB10 “Superchip”i ayrıntılarıyla anlattı. Bu çip, birden fazla DGX AI Mini süperbilgisayara güç veriyor ve şirketin “AI PC” vizyonunun merkezine yerleşiyor.
NVIDIA GB10 Superchip: 3 nm, 2.5D paket, iki yongaçık
Hot Chips 2025’te tanıtılan GB10, veri merkezindeki yenilikleri küçük bir masaüstü formuna indiriyor. Amaç net: Blackwell mimarisini mini geliştirici istasyonlarına ve iş istasyonlarına taşımak. Bunun için NVIDIA, NVFP4 (FP4), CUDA, SLANG, TensorRT, vLLM, ConnectX-7 NIC, NVLINK C2C, TMEM ve Birleşik Bellek Mimarisi (UMA) gibi bileşenleri tek platformda buluşturuyor. Çok yongalı paketleme ve düşük güç tüketimli C2C arayüzü sayesinde kompakt kasalara sığıyor.
DGX Spark neler sunuyor?
– GB10 Grace Blackwell Superchip: Yapay zeka, veri bilimi, hesaplama, render ve görselleştirme hızlanıyor
– 128 GB birleşik sistem belleği: 200 milyar parametreye kadar modelleri çalıştırır. 70 milyara kadar modelleri ince ayar için uygun
– ConnectX-7 ağ: İki DGX Spark’ı bağlayıp yaklaşık 405 milyar parametreye kadar modellerle çalış
– DGX Base OS + NVIDIA AI yazılım yığını: İş yüklerini DGX Spark’tan DGX Cloud’a veya hızlandırılmış veri merkezlerine sorunsuz taşı
– Esnek kurulum: İster AI iş istasyonu ister kişisel, ağa bağlı mini AI bulutu
– Masaüstünde güçlü deneyim: Çoklu monitör ve esnek bağlantı seçenekleri
– Kompakt ve verimli: Masaya rahat sığar. Standart prizle çalışır
SoC mimarisi: S-Dielet + G-Dielet
GB10’un içinde iki ana yongaçık var:
– S-Dielet: CPU, bellek alt sistemi ve çevre birimleri
– G-Dielet: GPU çekirdeği
İkisi TSMC’nin 3 nm sürecinde üretiliyor. İleri 2.5D paketleme ile aynı pakette birleşiyor.
CPU
– ARM v9.2 mimarisi
– Toplam 20 çekirdek. 10+10 iki küme
– Her çekirdeğe özel L2
– Küme başına 16 MB L3. Toplam 32 MB
GPU
– GB100 Blackwell tabanlı, aynı pakette yer aldığı için iGPU konumunda
– 5. nesil Tensor Çekirdekleri, DLSS 4 ve RTX ışın izleme desteği
– 32-bit FP32’de 31 TFLOPS
– NVFP4 biçiminde yapay zeka hesaplarında 1000 TOPS
– 24 MB ek L2 önbellek
Bellek ve bant genişliği
– 256 bit LPDDR5X UMA. 9400 MT/s’ye kadar
– Ham bant genişliği 301 GB/s. Kapasite 128 GB’a kadar
– Yüksek performanslı tutarlı sistem kumağı. CHI‑E protokol desteği
– GPU, C2X üzerinden toplam 600 GB/s’ye kadar sistem bant genişliğine erişir
– 16 MB Sistem Düzeyi Önbellek (CPU için L4 gibi davranır). SoC içindeki motorlar arasında verimli veri paylaşımı
Bağlantılar, ekran ve güvenlik
– PCIe, USB, PCIe üzerinden Ethernet
– Aynı anda 4 ekran: 3x DisplayPort + 1x HDMI
– DP Alt Mod ile 4K 120 Hz. HDMI 2.1a ile 8K 120 Hz
– Güvenlik: Çift Güvenli Kök, SROOT ve OSROOT işlemcileri, fTPM ve ayrık TPM desteği
– TDP: 140 W
Ölçeklenebilirlik
GB10’lar ConnectX teknolojisiyle birbirine bağlanabiliyor. PCIe Gen5 x8 üzerinden NIC’e, aralarında Ethernet ile iletişime geçiyorlar. Böylece toplam işlem gücü, bant genişliği ve DRAM kapasitesi büyüyor. Büyük modeller için yatayda ölçek kurmak kolaylaşıyor.
Mediatek iş birliği
GB10, NVIDIA ile Mediatek’in ortak çalışmasının sonucu. CPU IP’si Mediatek’ten geliyor. NVIDIA, GPU bellek trafiğini Mediatek’in bellek alt sistemine uyarlamak için kapsamlı performans modellemeleri yapmış.
Özetle
GB10 Superchip, veri merkezi sınıfı Blackwell yeteneklerini küçük bir kasaya taşıyor. Geliştiriciler, araştırmacılar ve yaratıcı profesyoneller için “masada süperbilgisayar” fikrini gerçeğe yaklaştırıyor.
Kaynak: wccftech.com