NVIDIA شتاب دهنده PCIe A100 را اعلام کرد: ۲۵۰ وات آمپر در یک فاکتور فرم استاندارد – لپ تاپ استوک
خرید لپ تاپ استوک
برای خرید لپ تاپ استوک با ما تماس بگیرید. لپ تاپ دسته دوم
NVIDIA شتاب دهنده PCIe A100 را اعلام کرد: ۲۵۰ وات آمپر در یک فاکتور فرم استاندارد
NVIDIA صبح امروز با راهاندازی معماری Ampere و شتابدهنده جدید A100 خود تقریباً یک ماه پشت سر آنهاست ، نسخه PCIe شتابدهنده آنها را به عنوان بخشی از آغاز کنفرانس ISC Digital Digital Digital Digital V8 برای محاسبات با کارایی بالا اعلام کرد. هر چه همتای مستقیم تری برای شتاب دهنده A100 پرچمدار NVIDIA داشته باشد ، نسخه PCie A100 برای ارائه A100 در یک فاکتور فرم سنتی برای مشتریانی که به چیزی نیاز دارند که بتواند به سرورهای استاندارد وصل شود ، ارائه می دهد. به طور کلی PCIe A100 عملکرد اوج مشابه SXM4 A100 را ارائه می دهد ، اما با یک TDP کمتر از ۲۵۰ وات ، عملکرد دنیای واقعی به اندازه خوبی نخواهد بود.
همتای واجب برای شتاب دهنده های عامل فرم SVM NVIDIA ، شتاب دهنده های PCIe NVIDIA به منظور جلب قسمت های دیگر از شتاب دهنده NVIDIA خدمت می کنند. در حالی که NVIDIA با خوشحالی به همه شتابدهنده های مبتنی بر SXM - که شامل تابلوی حامل ارزان قیمت NVIDIA HGX است - می پردازد - هنوز هم تعداد زیادی مشتری وجود دارد که باید بتوانند از شتابدهنده های GPU در سرورهای rackmount مبتنی بر PCIe استاندارد استفاده کنند. یا برای بارهای کاری کوچکتر ، مشتریان به نوع مقیاس پذیری ۴ طرفه و بالاتر که توسط شتاب دهنده های فاکتور SXM-فرم ارائه می شود ، نیازی ندارند. بنابراین با کارت های PCIe خود ، NVIDIA می تواند به بقیه بازار شتاب دهنده که محصولات SXM آنها نمی تواند برسد خدمت کند.
PCIe A100 به نوبه خود ، A100 تمام عیار است ، فقط در یک فاکتور شکل متفاوت و با TDP مناسب تر. از لحاظ عملکرد اوج ، PCIe A100 به همان اندازه سریعتر از همتای SXM4 خود است. NVIDIA این بار به عنوان یک پیکربندی برش خورده با ساعتهای پایین یا بلوکهای کاربردی کمتر از نسخه پرچمدار SXM4 حمل و نقل نمی کند. در نتیجه ، کارت PCIe هر آنچه را که A100 در جدول ارائه می دهد ، با همان تمرکز سنگین بر روی عملیات تنشور ، از جمله فرمت های جدید با دقت بالاتر TF32 و FP64 ، و همچنین استنباط صحیح سریع تر است.
مقایسه مشخصات شتاب دهنده NVIDIA | ||||||
A100 (PCIe) |
A100 (SXM4) |
V100 (PCIe) |
P100 (PCIe) |
|||
هسته های FP32 CUDA | ۶۹۱۲ | ۶۹۱۲ | ۵۱۲۰ | ۳۵۸۴ | ||
ساعت بوست | ۱٫۴۱ گیگاهرتز | ۱٫۴۱ گیگاهرتز | ۱٫۳۸ گیگاهرتز | ۱٫۳ گیگاهرتز | ||
ساعت حافظه | ۲٫۴Gbps HBM2 | ۲٫۴Gbps HBM2 | ۱٫۷۵Gbps HBM2 | ۱٫۴ گیگابیت بر ثانیه HBM2 | ||
عرض اتوبوس حافظه | ۵۱۲۰ بیتی | ۵۱۲۰ بیتی | ۴۰۹۶ بیتی | ۴۰۹۶ بیتی | ||
پهنای باند حافظه | ۱٫۶ ترابایت در ثانیه | ۱٫۶ ترابایت در ثانیه | ۹۰۰ گیگابایت در ثانیه | ۷۲۰ گیگابایت در ثانیه | ||
VRAM | ۴۰ گیگابایت | ۴۰ گیگابایت | ۱۶ گیگابایت / ۳۲ گیگابایت | ۱۶ گیگابایت | ||
تک دقت | ۱۹٫۵ TFLOP | ۱۹٫۵ TFLOP | ۱۴٫۱ TFLOP | ۹٫۳ TFLOP | ||
دقت دو برابر | ۹٫۷ TFLOP (نرخ ۱/۲ FP32) |
۹٫۷ TFLOP (نرخ ۱/۲ FP32) |
۷ TFLOP (نرخ ۱/۲ FP32) |
۴٫۷ TFLOP (نرخ ۱/۲ FP32) |
||
تنسور INT8 | ۶۲۴ بالای صفحه | ۶۲۴ بالای صفحه | N / A | N / A | ||
تنسور FP16 | ۳۱۲ TFLOP | ۳۱۲ TFLOP | ۱۱۲ TFLOP | N / A | ||
TF32 Tensor | ۱۵۶ TFLOP | ۱۵۶ TFLOP | N / A | N / A | ||
عملکرد نسبی (نسخه SXM) | ۹۰٪ | ۱۰۰٪ | N / A | N / A | ||
بهم وصل | NVLink 3 ۶ پیوند؟ (۳۰۰ گیگابایت در ثانیه؟) |
NVLink 3 ۱۲ پیوند (۶۰۰ گیگابایت در ثانیه) |
NVLink 2 ۴ پیوند (۲۰۰ گیگابایت در ثانیه) |
NVLink 1 ۴ پیوند (۱۶۰ گیگابایت در ثانیه) |
||
GPU | A100 (۸۲۶ mm2) |
A100 (۸۲۶ mm2) |
GV100 (۸۱۵ mm2) |
GP100 (۶۱۰ mm2) |
||
تعداد ترانزیستور | ۵۴٫۲B | ۵۴٫۲B | ۲۱٫۱B | ۱۵٫۳B | ||
TDP | ۲۵۰W | ۴۰۰W | ۲۵۰W | ۳۰۰W | ||
فرایند ساخت | TSMC 7N | TSMC 7N | TSMC 12nm FFN | TSMC 16 نانومتر FinFET | ||
رابط | PCIe 4.0 | SXM4 | PCIe 3.0 | SXM | ||
معماری | آمپر | آمپر | ولتا | پاسکال |
اما از آنجا که فاکتور شکل کارت افزودنی دو شکاف برای محصولات TDP پایین تر طراحی شده است ، فضای کمتری برای خنک کننده و همچنین دسترسی کمتری به برق دارد ، همچنین نسخه PCIe A100 باید TDP خود را از ۴۰۰W به ۲۵۰W کاهش دهد. . این کاهش قابل توجه ۳۸٪ در مصرف برق است و در نتیجه PCIe A100 نمی تواند با عملکرد پایدار همتای SXM4 خود مطابقت داشته باشد - این مزیت استفاده از فاکتور فرم با قدرت بالاتر و بودجه خنک کننده است. . همه گفته شده ، نسخه PCIe A100 باید حدود ۹۰٪ عملکرد نسخه SXM4 را روی بارهای تک GPU تحویل دهد ، که برای چنین افت بزرگ TDP ، نتیجه بدی نیست.
و در این یادداشت ، من باید اعتبار NVIDIA را در آنجا اعتبار بدهم: برخلاف نسخه PCIe شتاب دهنده V100 ، NVIDIA کار بسیار بهتری را برای ثبت این تفاوت های عملکردی انجام می دهد. این بار در حدود NVIDIA صراحتاً حاکی از رقم ۹۰٪ در برگه مشخصات آنها و مواد بازاریابی مرتبط است. بنابراین باید در مورد چگونگی مقایسه نسخه PCIe شتاب دهنده با نسخه SXM سردرگمی کمتری وجود داشته باشد.
به غیر از تغییر شکل فاکتور و TDP ، تنها انحراف قابل توجه دیگر برای PCIe A100 از نسخه SXM ، تعداد GPU های متصل به NVLink است. برای کارت PCIe آنها NVIDIA بار دیگر از پل های NVLink متصل شده در بالای کارت های A100 استفاده می کند و این امکان را فراهم می آورد تا دو (و فقط دو کارت) به هم وصل شوند. صفحه محصول NVIDIA کل پهنای باند موجود را لیست نمی کند ، اما از آنجا که PCIe V100 با استفاده از دو لینک حداکثر ۱۰۰ گیگابایت در ثانیه را در هر جهت پشتیبانی می کند ، اتصالات PCIe A100 و ۳ NVLink آن می توانند در صورت عدم استفاده بیشتر از ۱۵۰ گیگابایت در ثانیه نیز باشند. .
در غیر این صورت PCIe A100 با تریم های معمولی فاکتور فرم همراه است. کارت کاملاً منفعل خنک شده است ، به گونه ای طراحی شده است که در آن از سرورهایی با فن های قدرتمند شاسی استفاده شود. و اگرچه در عکس های رسمی NVIDIA تصویر نشده است ، سوکت هایی برای اتصالات برق PCIe وجود دارد. در همین حال ، با کاهش استفاده از NVLink در این نسخه از کارت ، پشتیبانی PCIe 4 بومی A100 بدون شک در اینجا از اهمیت بیشتری برخوردار خواهد شد ، و این نکته را تأکید می کند که یک جفت AMD Epyc + NVIDIA A100 در حال حاضر از آنجایی که AMD تنها فروشنده سرور x86 است. با پشتیبانی از PCIe 4.
بسته بندی موارد ، در حالی که NVIDIA امروز اطلاعات خاصی درباره قیمت و یا در دسترس بودن اعلام نمی کند ، کارت های جدید PCIe A100 به زودی ارسال می شوند. سازگاری گسترده تر کارت PCIe به NVIDIA کمک کرده تا در این مرحله بیش از ۵۰ برنده سرور را ثبت کند ، که ۳۰ تابستان از این سرورها قرار است در تابستان امسال ارسال شوند.
قوی ترین لپ تاپ جهان لپ تاپ hp zbook
دیدگاهتان را بنویسید