بررسی کامل نسل جدید ابرتراشه‌های NVIDIA GH200 و GB200

پیش از عرضه GH200، هم سرورهای خود NVIDIA و هم سرورهای شرکت‌های ثالث که از GPUهای NVIDIA استفاده می‌کردند، بر پایه پردازنده‌های x86 از Intel یا AMD ساخته می‌شدند. در این معماری، GPUها به‌صورت کارت‌های PCIe یا ماژول‌های ۸ تایی به مادربرد متصل می‌شدند.

در این مدل‌ها، CPU و GPU به‌صورت مستقل عمل می‌کردند. سازندگان سرور می‌توانستند با خرید کارت‌های گرافیکی (مثلاً ۸ عدد A100) و انتخاب پردازنده‌های Intel یا AMD بر اساس هزینه، بازده یا قیمت به‌صرفه، سرور خود را سفارشی‌سازی کنند.

سرورهای نسل بعد: ترکیب NVIDIA CPU و NVIDIA GPU

با ورود ابرتراشه‌ی NVIDIA GH200 در سال ۲۰۲۴، تحول بزرگی در معماری سرورها ایجاد شد. NVIDIA در این سری، CPU و GPU را روی یک ماژول یکپارچه‌سازی کرده است.

  • در دوران کامپیوترها: در این دوره CPU نقش اصلی داشت و GPU به‌عنوان پردازنده جانبی گرافیکی در نظر گرفته می‌شد.
  • در دوران دیتاسنترهای هوش مصنوعی: GPU تبدیل به عنصر اصلی شده و حالا CPU به‌عنوان یک جزء فرعی در داخل GPU قرار می‌گیرد.

در نتیجه، NVIDIA حالا نه‌تنها تراشه، بلکه سرور کامل و حتی رک‌های آماده را ارائه می‌دهد.

مشخصات تراشه‌ها

  • CPU Chip: پردازنده Grace مبتنی بر معماری ARMv9
  • GPU Chip: سری Hopper و Blackwell
    • H100: نسخه اصلی
    • H800: نسخه کاهش‌یافته‌ی H100
    • H200: نسخه ارتقاءیافته‌ی H100
    • H20: نسخه‌ای ضعیف‌تر از H200، حتی پایین‌تر از H800

نمونه‌هایی از محصولات ترکیبی:

Grace CPU + H200 GPU → تراشه GH200 روی یک بُرد

NVIDIA GH200 Chip (Board) Rendering: Left: Grace CPU chip; Right: Hopper GPU chip.

Grace CPU + B200 GPU → ماژول GB200 (شامل 2 CPU و 4 GPU) با خنک‌سازی مایع

NVIDIA GB200 Rendering: A module including 2 Grace CPUs + 4 B200 GPUs, with an integrated liquid cooling module.

در مقیاس بزرگ‌تر، 72 عدد B200 می‌توانند یک رک NVL72 را تشکیل دهند.

NVIDIA GB200 NVL72 Cabinet

طراحی داخلی سرورهای GH200

دیاگرام منطقی تراشه GH200:

ادغام CPU، GPU، RAM و VRAM روی یک تراشه واحد

ترکیب اصلی در GH200:

  • یک Grace CPU
  • یک H200 GPU
  • تا 480GB حافظه CPU (LPDDR5X)
  • 96 یا 144GB حافظه گرافیکی (VRAM) از نوع HBM3 یا HBM3e

اتصالات سخت‌افزاری تراشه:

  • اتصال CPU به مادربورد: از طریق ۴ مسیر PCIe Gen5 x16 با مجموع سرعت 512GB/s
  • ارتباط بین CPU و GPU: با فناوری NVLink-C2C با پهنای باند 900GB/s (۷ برابر سریع‌تر از PCIe Gen5)

اتصال داخلی بین GPUها از طریق 18 لینک NVLINK4 انجام می‌شود (هر کدام 900GB/s)

فناوری NVLink-C2C باعث همگام‌سازی حافظه (Memory Coherency) می‌شود، که شامل:

  • دسترسی یکپارچه به حافظه و VRAM تا سقف 624GB
  • امکان استفاده هم‌زمان از حافظه توسط CPU و GPU
  • امکان oversubscribe حافظه گرافیکی با استفاده از حافظه CPU

پردازنده و حافظه

CPU و حافظه

LPDDR5X Memory: پشتیبانی تا 480GB با پهنای باند 500GB/s

Grace CPU: دارای ۷۲ هسته بر پایه معماری Arm Neoverse V2 (ARMv9)

حافظه LPDDR5X تا 480GB

  • حداکثر پهنای باند: 500GB/s
  • این نوع حافظه برخلاف DDR بر روی برد لحیم شده و قابل ارتقاء نیست، اما سرعت بالاتر و مصرف انرژی پایین‌تری دارد.

GPU و حافظه گرافیکی

  • H200 GPU: قدرت محاسباتی بالا و بهره‌گیری از حافظه‌های جدید
  • گزینه‌های VRAM:
    • 96GB HBM3
    • 144GB HBM3e با پهنای باند 4.9TB/s (۵۰٪ سریع‌تر از H100 SXM)

نسخه پیشرفته GH200 NVL2

در این پیکربندی، دو تراشه GH200 روی یک برد قرار گرفته و تمام منابع سخت‌افزاری دو برابر می‌شوند (۲ CPU، ۲ GPU، ۲ برابر حافظه).
در یک سرور ۸ بردی:

  • با GH200 ساده: 8 × (1 GPU + 1 CPU)
  • با GH200 NVL2: 8 × (2 GPU + 2 CPU)

GH200 & GH200 NVL2 Product Specifications (Computing Power)

سرورها و شبکه‌سازی

NVIDIA MGX + GH200

در این ساختار، هر نود فقط یک GH200 دارد و از PCIe استفاده می‌کند. ارتباط بین نودها از طریق شبکه (NIC و DPU) برقرار می‌شود، مناسب برای بارهای AI کوچک تا متوسط.

NVIDIA NVL32 Cabinet

این کابینت شامل 32 تراشه GH200 است که با استفاده از NVLINK به‌صورت یک GPU منطقی عمل می‌کنند:

  • حافظه یکپارچه: 19.5 ترابایت
  • فناوری Extended GPU Memory (EGM)
  • اتصال چند کابینت از طریق شبکه برای ایجاد کلاسترهای AI بزرگ‌مقیاس

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا