NVIDIA Blackwell Ultra “GB300” GPU, En Hızlı Yapay Zekâ Çipi, Detaylar: Çift Retikül GPU, 20 Binden Fazla Çekirdek, 288 GB HBM3e/8 TB/sn ve GB200’den %50 Daha Hızlı

NVIDIA, en hızlı yapay zeka çipi Blackwell Ultra GB300’ün tüm teknik detaylarını paylaştı: GB200’e göre yüzde 50 daha hızlı ve 288 GB HBM3e bellekle geliyor.

NVIDIA Blackwell Ultra “GB300” nedir?
– GB300, Blackwell mimarisinin güçlendirilmiş sürümü. İki büyük GPU kalıbı tek bir yonga gibi çalışacak şekilde NV‑HBI adlı yüksek bant genişlikli arayüzle birbirine bağlı. Bu bağlantı iki kalıp arasında 10 TB/s bant genişliği sunuyor.
– Yonga TSMC 4NP sürecinde üretiliyor ve 208 milyar transistör barındırıyor.

Hesaplama birimleri ve çekirdekler
– GPU içinde 160 adet SM (akış çoklayıcı) var. Her SM’de 128 CUDA çekirdeği, FP8/FP6/NVFP4 destekli dört adet 5. nesil Tensor çekirdeği, 256 KB Tensor belleği (TMEM) ve özel fonksiyon birimleri bulunuyor.
– Toplamda 20.480 CUDA çekirdeği, 640 Tensor çekirdeği ve 40 MB TMEM mevcut.

Bellek tarafındaki büyük sıçrama
– GB300, 8 yığınlı HBM3e bellekle 288 GB kapasiteye çıkıyor. Arayüz 8192‑bit genişliğinde ve yonga başına 8 TB/s bant genişliği sunuyor.
– Bu kapasiteyle:
– 300 milyar+ parametreli modeller belleğe sığabiliyor.
– Dönüştürücü (transformer) modellerde KV önbellekleri büyüyor, bağlam uzunlukları uzuyor.
– Çeşitli iş yüklerinde hesaplama/bellek dengesi iyileşiyor.

Bağlantı ve ölçekleme
– NVLink 5 ile GPU başına 1,8 TB/s çift yönlü bant genişliği (18 hat x 100 GB/s).
– Hopper’a göre 2 kata kadar daha iyi ölçeklenme.
– 72 GPU’lu NVL72 raf yapılandırmalarıyla 130 TB/s toplu bant genişliği ve 576 GPU’ya kadar kesintisiz topoloji.
– Sunucuya bağlantıda PCIe Gen6 x16 (256 GB/s çift yönlü).
– Grace CPU ile NVLink‑C2C üzerinden 900 GB/s ve bellek tutarlılığı.

NVFP4 ile yüzde 50 daha yüksek yoğun hesap
– GB300, düşük hassasiyetli yoğun hesapta yeni NVFP4 formatıyla GB200’e kıyasla yüzde 50 daha fazla çıkış veriyor.
– NVFP4, çoğu görevde FP8’e çok yakın doğruluk sağlıyor. Bellek ayak izini FP8’e göre 1,8 kat, FP16’ya göre 3,5 kat azaltıyor.

Yazılım ve güvenlik odaklı yenilikler
– Geliştirilmiş GigaThread Engine: 160 SM’in tamamında işleri daha iyi paylaştıran yeni zamanlayıcıyla daha hızlı bağlam değişimi.
– MIG bölümlendirme: Tek bir GB300’ü farklı boyutlarda güvenli bölümlere ayırmak mümkün. Örneğin iki adet 140 GB, dört adet 70 GB ya da yedi adet 34 GB’lık örnek yapılandırmalar.
– Gizli bilgi işlem ve güvenli AI: GPU tarafında donanımsal Güvenli Yürütme Ortamı (TEE) ve TEE‑I/O, NVLink üzerinde satır içi şifreleme ile neredeyse şifresiz modla aynı hızlar.
– Gelişmiş RAS: Binlerce sensörü izleyen yapay zekâ destekli güvenilirlik motoru, arızaları öngörüp bakımı planlıyor ve sistem çalışma süresini artırıyor.

Verimlilik ve güç
– GB300, GB200’e göre daha yüksek TPS/MW verimliliği hedefliyor.
– En üst yapılandırmalarda güç bütçesi 1400 W seviyesine çıkabiliyor; karşılığında NVLink/NVSwitch altyapısıyla büyük kümelerde güçlü performans ölçeklenmesi geliyor.

Özetle NVIDIA, Blackwell ve özellikle Blackwell Ultra ile veri merkezi yapay zekâ hızlandırıcılarında çıtayı yeniden yukarı taşıyor. Donanımdaki agresif yıllık güncellemeler ve yazılım optimizasyonları bu ivmeyi destekliyor.

Kaynak: wccftech.com

Total
0
Shares
Bir yanıt yazın
Previous Post

Meta’nın Catalina Pod Yapay Zeka Sistemi, NVIDIA Blackwell GB200 NVL72’yi Open Rack v3 ve Sıvı Soğutma ile Birleştiriyor

Next Post

SK hynix 321 Katmanlı QLC NAND Seri Üretimde: 32 Kata Kadar Yığınlama ile Önce PC’lere Geliyor

Related Posts