NVIDIA ConnectX-8: Blackwell Sistemleri İçin PCIe G6 ve 800GbE Destekli SuperNIC

NVIDIA, Blackwell tabanlı sistemler için geliştirdiği yeni ConnectX-8 ağ kartını tanıttı. Şirket bu kartın yeteneklerini “SuperNIC” seviyesinde görüyor.

NVIDIA ConnectX-8 SuperNIC: Blackwell’e özel, 800G’ye kadar hız
NVIDIA’ya göre yapay zekâ eğitimi ve çıkarım (inference) ağ tarafında farklı ihtiyaçlara sahip. Çıkarım, dış dünyayla daha çok konuşan, gecikmeye hassas ve parçalı bir iş yükü. Eğitim ise uzun soluklu, senkron çalışıyor; kuyruk gecikmesi verimi düşürüyor ve dış dünyayla etkileşim daha az. Bu yüzden ağın uçtan uca esnek bir politika ile her iki senaryoya da uyum sağlaması hedefleniyor.

ConnectX-8, hem Spectrum-X Ethernet hem de Quantum-X InfiniBand altyapılarıyla çalışıyor. Kısacası veri merkezlerinde yapay zekâ kümelerini beslemek için tasarlanmış bir ağ hızlandırıcı.

Öne çıkanlar
– Milyonlarca GPU’da kanıtlanmış RDMA altyapısı
– 800G RDMA donanım hattı: yapay zekâ için bant genişliği, düşük gecikme ve ölçek
– Entegre yük dengeleme, tıkanıklık kontrolü ve yüksek güvenilirlik
– Yapay zekâ iş yükleri ve veri merkezi esnekliği için programlanabilir veri yolu
– Sistem mimarisiyle sıkı entegrasyon
– Kurumsal sınıf güvenlik

Bağlantılar ve arayüzler
– API uyumluluğu: Verbs, NCCL, NIXL, DOCA
– 800 Gb/s InfiniBand XDR ya da 2x400G Ethernet (Spectrum-X) arayüzü, 8 porta kadar seçenek
– Ana sistem bağlantısı: 48 hatlı PCIe Gen6, entegre PCIe anahtarı üzerinden

RDMA ölçeklenmesi ve “NIC’ten fazlası”
NVIDIA, ConnectX-8’in 800G’de farklı mesaj boyutlarında (64 KB–1 MB) sınırsız ölçeklenme sunduğunu paylaşıyor. SuperNIC, klasik anlamda sadece bir ağ kartı değil; GPU’ları diğer kümelere bağlayan bir ASIC görevi de üstleniyor.

Blackwell GB300 NVL72 ilk durak
Kart ilk olarak Blackwell Ultra GPU’lu GB300 NVL72 sistemlerinde devreye alınıyor. Kartın üzerindeki CX8 PCIe anahtarı, NVLINK C2C bant genişliğini daha verimli kullanmaya yardımcı oluyor ve ağ tarafında QoS’u iyileştiriyor.

Her NVL72 kartında iki CX8 PCIe anahtarı bulunuyor. Grace CPU için PCIe Gen5 x16, Blackwell Ultra GPU için PCIe Gen6 x16 hat ayrılmış. SSD tarafında ise PCIe Gen5 x4 mevcut.

64 GPU ölçeğinde bağlantı
NVIDIA, ConnectX-8’in 64 GPU’ya kadar nasıl ölçeklendiğini de gösteriyor. Ölçek büyüdükçe darboğazları azaltmak için ConnectX-8 Entegre Spectrum-X Ethernet Anahtarı devreye giriyor. Bu çözüm, Spectrum-X altyapısını genişletip yük dengeleme ve tıkanıklık kontrolünü anahtar seviyesinde sunuyor. RDMA katmanı geleneksel işletim sistemi servislerini yapay zekâ ağlarına ölçeklerken, ConnectX-8 Paket İşlemcisi de “AI fabrikaları”nı güvenli biçimde yönlendirip korumaya odaklanıyor.

Veri Yolu Hızlandırıcısı: 16 çekirdekli RISC-V olay işlemcisi
Ağın verimli kalması için kart üzerinde Data Path Accelerator yer alıyor. Bu bir 16 çekirdekli RISC‑V olay işlemcisi. Bu donanım ve yazılım entegrasyonları sayesinde Spectrum‑X Ethernet, hazır (OTS) RDMA NIC/anahtarlara kıyasla eğitim adım süresini yüzde 60 kısaltıyor. Yük altındayken kuyruk gecikmesini de neredeyse sıfıra indiriyor.

Spectrum-X performans kazanımları
– Etkin bant genişliği: 1,6 kat (yük dengeleme)
– Kolektif bant genişliği: 1,3 kat (kuyruk gecikmesi iyileştirmesi)
– All-reduce bant genişliği: 2,2 kat (gürültü izolasyonu)
– All-to-all bant genişliği: 1,3 kat (dayanıklı performans)
– Telemetri toplama: 1000 kat daha hızlı (yüksek frekanslı telemetri)

Özetle Spectrum-X ve ConnectX-8 SuperNIC, 800G bağlantı ve PCIe Gen6 desteğini birlikte getiriyor. NVIDIA bu teknolojileri Blackwell sistemlerinde şimdiden sunmaya başladı. Önümüzdeki aylarda daha fazla detay bekleniyor.

Kaynak: wccftech.com

Total
0
Shares
Bir yanıt yazın
Previous Post

İddiaya Göre Huawei, HBM’in Yerine Geçebilecek ‘Yapay Zekâ Belleği’ Tasarlıyor, Batı’ya Bağımlılığını Azaltabilir

Next Post

Google NotebookLM Türkçe dil desteğine kavuştu

Related Posts