

# زیرساخت NVIDIA GB200 NVL72 و کابل‌کشی MPO-8 APC برای واحدهای مقیاس‌پذیر

واحد مقیاس‌پذیر (SU) DGX GB200 یک تغییر بزرگ در معماری دیتاسنترها محسوب می‌شود. این SU یک موجودیت یکپارچه با 576 GPU است که توسط 9,216 رشته فیبر فعال به هم متصل شده‌اند. ScaleFibre ترانک‌های با ترمینیشن دقیق مورد نیاز برای مدیریت این چگالی را فراهم می‌کند.


---


## 4 فابریک فیزیکی SuperPOD
NVIDIA SU را به لایه‌های فیزیکی متمایز تقسیم می‌کند تا ترافیک GPU را ایزوله کند.

### MN-NVL (NVLink 5) [Scale-Up]

* شبکه 'داخلی' رک که 72 GPU را با سرعت 1.8 ترابایت بر ثانیه به هم متصل می‌کند.
**Features:**
  - فیبر نوری صفر
  - بک‌پلن مسی پسیو
  - کانکتورهای Blind-mate

### Compute InfiniBand [Scale-Out]

* فابریک اولیه 'شرق-غرب' برای آموزش‌های چند نودی گسترده.
**Features:**
  - 4,608 فیبر فعال در هر SU
  - توپولوژی بهینه‌شده برای ریل
  - Quantum-3/Quantum-2

### Storage & In-Band [Frontend]

* فابریک مبتنی بر اترنت برای ورود و تامین داده با سرعت بالا.
**Features:**
  - فاکتور مسدودسازی 5:3
  - آف‌لود BlueField-3 DPU
  - پشتیبانی از VXLAN/RoCE

### OOB Management [Control Plane]

* شبکه ایزوله برای تله‌متری سخت‌افزار، BMC و مدیریت PDU.
**Features:**
  - RJ45/Cat6 Copper
  - تیِر سوئیچ SN2201
  - امنیت Physical air-gap


## معیارهای SU در مقیاس اگزا
یک واحد مقیاس‌پذیر 8 رکی، بلوک ساختاری اساسی کارخانه هوش مصنوعی NVIDIA را نشان می‌دهد.

| Metric | Value |
| :--- | :--- |
| فیبر فعال در هر SU | **9,216** |
| رشته فقط محاسباتی | **4,608** |
| نسبت مسدودسازی ذخیره‌سازی | **5:3** |
| سرعت پورت بومی | **400G/800G** |
## سه سطح اتصال SU
1. **سطح A: سرور به لیف**: 1,152 فیبر در هر رک با استفاده از ترانک‌های با تعداد فیبر بالا یا جامپرها برای اتصال نودهای NVL72 به سوئیچ‌های لیف.
2. **سطح B: لیف به اسپاین**: جمع‌آوری ترافیک هم‌تراز با ریل در داخل SU با استفاده از لینک‌های 1:1 بدون مسدودسازی برای محاسبات.
3. **سطح C: اسپاین به کور**: مقیاس‌گذاری فراتر از SU به یک منطقه مرکزی کور با استفاده از ترانک‌های با تعداد بالا.

## Comparison: پچ‌کردن قدیمی (نقطه به نقطه) vs. ترانک‌کشی ماژولار با تعداد فیبر بالا

### پچ‌کردن قدیمی (نقطه به نقطه)
* پیچیدگی دستی: نیاز به 9,216 پچ کورد مجزا برای هر بلوک 8 رکی.
* انسداد جریان هوا: دسته‌های متراکم کابل مسیرهای خروج خنک‌کننده مایع را مسدود می‌کنند.
* پروفایل ریسک: احتمال بالای 'ریل‌های متقاطع' در طول پچ‌کردن دستی 1:1.
* زمان استقرار: بیش از 115 ساعت برای مسیریابی و برچسب‌گذاری دستی برای هر SU.

### ترانک‌کشی ماژولار با تعداد فیبر بالا
* Plug-and-Play: هزاران فیبر را در ترانک‌های سفارشی‌شده 128F/144F/256F/288F/576F از پیش ترمینیت‌شده ادغام می‌کند.
* بهینه‌سازی حرارتی: کابل‌های با قطر کوچک جریان هوا را در رک‌های متراکم به حداکثر می‌رسانند.
* کارایی مسیر: 1,152 فیبر فعال در هر رک را در بک‌بون‌های MPO با تعداد بالا ادغام می‌کند.
* پروفایل نصب: استقرار سریع از طریق مجموعه‌های از پیش ترمینیت‌شده و آزمایش‌شده در کارخانه.

## Expert Insight
> ""
> — **<no value>**, <no value>
## Technical FAQ
**Q: چگونه تعداد SU در 9,216 فیبر قابل مدیریت باقی می‌ماند؟**
A: با استفاده از یک سلسله مراتب کابل‌کشی طبقه‌بندی شده. [ترانک‌های با تعداد فیبر بالا](/products/optical-cable-assemblies/mpo-trunks/high-fibre-count-mpo-trunks/) جایگزین هزاران پچ کورد MPO جداگانه می‌شوند که حجم فیزیکی را کاهش داده و از انسداد خنک‌کننده جلوگیری می‌کند.

**Q: مفهوم 'فاکتور مسدودسازی 5:3' در فابریک ذخیره‌سازی چیست؟**
A: برخلاف فابریک محاسباتی بدون مسدودسازی (1:1)، شبکه ذخیره‌سازی عمداً بیش از حد اشتراک‌گذاری شده است. این امر هزینه‌های فیبر و پیچیدگی را کاهش می‌دهد در حالی که الزامات 40 گیگابیت بر ثانیه در هر نود برای ذخیره‌سازی را برآورده می‌کند. استقرار اغلب از [کابل‌های پچ MPO سازگار با NVIDIA](/products/optical-cable-assemblies/mpo-trunks/nvidia-compatible-mpo-patch-cable-apc/) استفاده می‌کند.

**Q: چرا فابریک NVLink داخلی بدون فیبر است؟**
A: NVIDIA از یک بک‌پلن مسی پسیو و کارتریج‌های کابل در داخل رک NVL72 استفاده می‌کند. این امر هزاران فرستنده-گیرنده نوری و فیبر را حذف می‌کند و مصرف برق و تاخیر را به میزان قابل توجهی کاهش می‌دهد. فیبر نوری برای [فابریک محاسباتی scale-out](/products/optical-cable-assemblies/mpo-trunks/nvidia-compatible-mpo-splitter-ndr/) رزرو شده است.

**Q: وقتی به 16 واحد مقیاس‌پذیر ارتقا دهیم چه اتفاقی می‌افتد؟**
A: در مقیاس 16 SU (9,216 GPU)، تعداد کل فیبرهای فعال فقط برای فابریک محاسباتی به 18,432 رشته می‌رسد. مدیریت این چگالی نیازمند [محفظه‌های با چگالی بالا](/products/housings/high-fibre-count-housings/highstack-fixed-housings-for-high-count-optical-fibre/) است که به طور خاص برای فیبر نوری با تعداد بالا و معماری‌های سوئیچینگ گروهی مرکزی طراحی شده‌اند.

**Q: چرا MPO-8 به جای MPO-12 استاندارد استفاده می‌شود؟**
A: فرستنده-گیرنده‌های مدرن 400G NDR و 800G XDR از اپتیک موازی 4 یا 8 لین استفاده می‌کنند. هم‌ترازی MPO 8 فیبری دقیقاً با پیکربندی 4x Tx و 4x Rx مطابقت دارد. استفاده از [ترانک‌های MPO فعال 8 فیبری](/products/optical-cable-assemblies/mpo-trunks/small-fibre-count-mpo-trunks/) فیبرهای 'تاریک' یا هدر رفته در فابریک کلاستر را از بین می‌برد.

**Q: اهمیت پولیش APC (Angled Physical Contact) چیست؟**
A: سیگنالینگ پرسرعت 100G-PAM4 به بازتاب‌های برگشتی بسیار حساس است. زاویه 8 درجه [کانکتور APC](/products/optical-cable-assemblies/mpo-trunks/nvidia-compatible-mpo-patch-cable-apc/) تضمین می‌کند که نور منعکس شده در روکش فیبر جذب می‌شود و از دست دادن بازگشت نوری (ORL) بالا که برای آموزش هوش مصنوعی بدون خطا لازم است، حفظ می‌شود.

**Q: چگالی فیبر چگونه بر سالن‌های هوش مصنوعی با خنک‌کننده مایع تاثیر می‌گذارد؟**
A: حتی با سینی‌های خنک‌کننده مایع، هوا هنوز باید برای مدیریت گرمای ثانویه گردش کند. استفاده از [کابل‌های SmartRibbon](/products/fibre-optic-cables/indoor-cables/smartribbon-flame-retardant-optical-fibre-cables/) با چگالی بالا، قطر کابل را به طور قابل توجهی کاهش می‌دهد و تضمین می‌کند که کابل‌کشی فیزیکی جریان هوا یا منیفولدهای خنک‌کننده مایع را مسدود نمی‌کند.

**Q: محدودیت‌های فاصله برای کابل‌کشی در سطح SU چیست؟**
A: مالتی‌مد (OM4/OM5) برای 400G/800G به 50 متر محدود می‌شود. برای لینک‌های مرکزی Spine-to-Core که از این فاصله فراتر می‌روند، [فیبر سینگل‌مد G.657.A1](/products/fibre-optic-cables/indoor-cables/slimcore-indoor-optical-cables/slimcore-144-fibre-indoor-fibre-optic-cable/) برای پشتیبانی از دسترسی بیشتر بدون تخریب سیگنال الزامی است.

**Q: آیا می‌توانم از کابل‌های بیرونی استاندارد برای بک‌بون‌های دیتاسنتر هوش مصنوعی استفاده کنم؟**
A: خیر. سالن‌های داخلی هوش مصنوعی نیازمند [LSZH (Low Smoke Zero Halogen)](/products/fibre-optic-cables/indoor-cables/slimcore-indoor-optical-cables/)، رایزر یا پلنوم هستند تا مقررات ایمنی آتش‌سوزی مورد نیاز را بسته به مقررات محلی برآورده کنند. برای مسیرهای با چگالی بالا، [کابل‌های داخلی SlimCORE](/products/fibre-optic-cables/indoor-cables/slimcore-indoor-optical-cables/slimcore-288-fibre-indoor-fibre-optic-cable/) تعداد رشته‌های لازم را در قطر کاهش‌یافته فراهم می‌کنند.

**Q: مزیت پیگتیل‌های ترمینیت‌شده در کارخانه در SU چیست؟**
A: [پیگتیل‌های فیبر نوری با کابل MPO](https://americas.scalefibre.com/en/products/optical-cable-assemblies/optical-fibre-pigtails/mpo-cord-optical-fibre-pigtails/) امکان اتصال سریع فیوژن جرمی را در لایه اسپاین یا کور فراهم می‌کنند. این ترمیناسیون کنترل‌شده در کارخانه در یک انتها مزایای از پیش ترمینیت شدن را فراهم می‌کند، در حالی که انتهای 'بریده شده' امکان انعطاف‌پذیری برای اتصال به طول مورد نیاز در محل را می‌دهد.


## References

