انویدیا تولید انبوه پلتفرم هوش مصنوعی قدرتمند Vera Rubin را آغاز کرد

نویسنده:دیجیاتو

۱۲ خرداد ۱۴۰۵

0نظر

0 بازدید

انویدیا تولید انبوه پلتفرم هوش مصنوعی قدرتمند Vera Rubin را آغاز کرد

Rate this post

انویدیا با ورود پلتفرم قدرتمند Vera Rubin به مرحله تولید انبوه، تمام شایعات مربوط به تأخیر در عرضه این محصول را رد کرد. Vera Rubin که عنوان «قدرتمندترین پلتفرم هوش مصنوعی ایجنت‌محور جهان» را به دوش می‌کشد، اکنون آماده استقرار در کارخانه‌های هوش مصنوعی است.

به گزارش Wccftech، کمتر از دو هفته پیش بود که انویدیا تولید انبوه پردازنده‌های مرکزی (CPU) سری Vera را آغاز کرد؛ اقدامی که پیش‌بینی می‌شود بازاری ۲۰۰ میلیارد دلاری را پیش روی این شرکت قرار دهد. مدیران انویدیا با اطمینان اعلام کرده‌اند که با تکیه بر تراشه‌های Vera، در سال جاری به بزرگ‌ترین تأمین‌کننده CPU در جهان تبدیل خواهند شد. اکنون با ورود کامل پلتفرم Vera Rubin NVL72 به فاز تولید، انویدیا هدف‌گذاری خود را روی تأمین انرژی کارخانه‌های هوش مصنوعی چند میلیارد دلاری و چند گیگاواتی در سراسر جهان متمرکز کرده است.

تولید انبوه پلتفرم هوش مصنوعی Vera Rubin انویدیا

پلتفرم Rubin انویدیا مجموعه‌ای از ۶ تراشه ‌پیشرفته است که همگی از کارخانه‌های تولید نیمه‌رسانا به آزمایشگاه‌های انویدیا برای تست نهایی منتقل شده‌اند. این تراشه‌ها عبارتند از:

پردازشگر گرافیکی Rubin GPU: با ۳۳۶ میلیارد ترانزیستور
پردازنده مرکزی Vera CPU: با ۲۲۷ میلیارد ترانزیستور
سوئیچ NVLINK 6: برای ارتباط داخلی قطعات
ماژول‌های CX9 و BF4: برای مدیریت شبکه
ماژول نوری Spectrum-X 102.4T CPO: برای فوتونیک سیلیکونی (انتقال داده با نور)

انویدیا تولید انبوه پلتفرم هوش مصنوعی Vera Rubin را آغاز کرد — انویدیا تولید انبوه پلتفرم هوش مصنوعی قدرتمند Vera Rubin را آغاز کرد

این تراشه منحصراً برای پردازش‌های سنگین هوش مصنوعی طراحی شده است. Rubin GPU دارای دو قطعه سیلیکونی Reticle Die با تعداد زیادی هسته محاسباتی و هسته تنسور است. قدرت پردازشی این تراشه به شکل چشمگیری افزایش یافته است:

۵۰ پتافلاپس (PFLOPs) عملکرد استنتاج با فرمت NVFP4 (۵ برابر قوی‌تر از نسل قبلی یعنی Blackwell)
۳۵ پتافلاپس عملکرد آموزش مدل با فرمت NVFP4 (۳.۵ برابر قوی‌تر از Blackwell)
پهنای باند حافظه HBM4 تا ۲۲ ترابایت‌برثانیه (۲.۸ برابر سریع‌تر از Blackwell)
پهنای باند ارتباطی NVLink تا ۳.۶ ترابایت‌برثانیه به ازای هر CPU (۲ برابر سریع‌تر از Blackwell)

برای بخش CPU، انویدیا از معماری سفارشی و نسل بعدی آرم با اسم رمز Olympus استفاده کرده است. مشخصات این غول پردازشی عبارتند از:

۸۸ هسته فیزیکی و ۱۷۶ رشته با پشتیبانی از فناوری Spatial Multi-Threading
۱.۸ ترابایت‌برثانیه پهنای باند حافظه یکپارچه (NVLink-C2C)
۱.۵ ترابایت حافظه سیستم (۳ برابر بیشتر از پردازنده Grace)
۱.۲ ترابایت‌برثانیه پهنای باند حافظه با استفاده از فناوری SOCAMM LPDDR5X
پشتیبانی از محاسبات محرمانه در سطح رک

ترکیب این ویژگی‌ها باعث شده تا پردازنده Vera در پردازش داده‌ها، فشرده‌سازی و فرایندهای CI/CD عملکردی دو برابر بهتر از پردازنده نسل قبل (Grace) ارائه دهد.

ارتباطات درون‌سیستمی در پلتفرم Rubin برعهده سوئیچ‌های نسل ششم NVLink 6 است. این سوئیچ‌ها با طراحی مبتنی‌بر خنک‌کننده مایع، پهنای باند مجموعاً ۲۸.۸ ترابایت‌برثانیه و توان محاسباتی درون‌شبکه‌ای ۱۴.۴ ترافلاپس (با فرمت FP8) را فراهم می‌کنند.

برای ارتباطات خارجی شبکه نیز از ماژول‌های ConnectX-9 و BlueField-4 استفاده می‌شود: ConnectX-9 SuperNIC پهنای باند ۱.۶ ترابایت‌برثانیه را با پروتکل RDMA ارائه می‌دهد و برای مقیاس‌های بزرگ هوش مصنوعی بهینه‌سازی شده است. BlueField-4 DPU نیز یک پردازنده ۸۰۰ گیگابیتی است که در واقع یک پردازنده ۶۴ هسته‌ای Grace را با ConnectX-9 ترکیب کرده و ظرفیت شبکه را نسبت به نسل قبل دو برابر می‌کند.

علاوه‌براین، انویدیا از سیستم ارتباطی نوری جدید خود با نام Spectrum-X Ethernet Co-Packaged Optics رونمایی کرد. این فناوری از فوتونیک سیلیکونی ۲۰۰ گیگابیتی استفاده می‌کند. سیستم جدید ۵ برابر کارآمدتر، ۱۰ برابر قابل‌اعتمادتر و دارای ۵ برابر زمان اجرای برنامه بالاتر است.

هنگامی که تمام این قطعات پیشرفته در قالب یک رک به نام NVIDIA Vera Rubin NVL72 فراهم می‌شوند، شاهد جهش خارق‌العاده‌ای نسبت به معماری نسل قبل (Blackwell) هستیم:

۵ برابر عملکرد بهتر در استنتاج (۳.۶ اگزافلاپس)
۳.۵ برابر عملکرد بهتر در آموزش مدل (۲.۵ اگزافلاپس)
۲.۵ برابر ظرفیت بیشتر حافظه LPDDR5x (مجموعاً ۵۴ ترابایت)
۱.۵ برابر ظرفیت بیشتر حافظه HBM4 (مجموعاً ۲۰.۷ ترابایت)
۲.۸ برابر پهنای باند بیشتر حافظه (۱.۶ پتابایت بر ثانیه)
۲ برابر پهنای باند ارتباطی Scale-Up بیشتر (۲۶۰ ترابایت بر ثانیه)

برای دیتاسنترهای بزرگ، انویدیا پلتفرم DGX SuperPOD را با ترکیب ۸ رک از مدل NVL72 ارائه می‌دهد. برای دیتاسنترهای متداول‌تر نیز مدل DGX Rubin NVL8 در نظر گرفته شده است. همچنین، پلتفرم ذخیره‌سازی Inference Context Memory Storage نیز برای مقیاس‌های گیگابایتی استنتاج معرفی شده که به‌طور کامل با نرم‌افزارهای انویدیا یکپارچه است.

درکل پلتفرم Vera Rubin به معنای واقعی کلمه هزینه‌ها را کاهش و سرعت را افزایش می‌دهد. به گفته انویدیا، استفاده از معماری Rubin در مقایسه با مدل قبلی (Blackwell GB200) باعث کاهش ۱۰ برابری هزینه تولید هر توکن در استنتاج و کاهش ۴ برابری در تعداد GPUهای مورد نیاز برای آموزش مدل‌های MoE می‌شود. هم‌اکنون بزرگ‌ترین سازندگان سرور جهان از جمله لنوو، دل، HPE، ایسوس، گیگابایت و فاکسکان درحال تولید انبوه این سیستم‌ها هستند و انتظار می‌رود اولین تراشه‌ها اواخر سال جاری میلادی به دست مشتریان برسند.

انویدیا تولید انبوه پلتفرم هوش مصنوعی قدرتمند Vera Rubin را آغاز کرد

تولید انبوه پلتفرم هوش مصنوعی Vera Rubin انویدیا

مطالب مرتبط فناوری

AMD از کارت گرافیک Radeon RX 9070 GRE رونمایی کرد؛ سریع‌تر از RTX 5060 Ti

پردازنده اینتل +Xeon 6 با ۲۸۸ هسته کم‌مصرف برای سرورها از راه رسید

اینتل اطلاعات جدیدی از پردازنده‌های سرور Xeon 7 منتشر کرد؛ عرضه در سال ۲۰۲۷

اینتل با معرفی یک فریم‌ورک جدید چالش بزرگ توسعه هوش مصنوعی فیزیکی را حل کرد

معمای QWERTY: می‌دانستید کیبورد شما برای کند کردن سرعت تایپ طراحی شده است؟

کوالکام با برند جدید Dragonfly به جنگ غول‌های بازار دیتاسنتر و هوش مصنوعی می‌رود

دیدگاهتان را بنویسید لغو پاسخ

آخرین مقالات هوش مصنوعی

AMD از پردازنده اقتصادی رایزن 7700X3D رونمایی کرد؛ بازگشت 5800X3D پس از سال‌ها

مدیرعامل سافت‌بانک: انقلاب هوش مصنوعی ۵۰ برابر بزرگ‌تر از رشد دوره دات‌کام است

آنتروپیک زودتر از OpenAI وارد بازار بورس می‌شود؛ محک جدی برای حباب هوش مصنوعی

مطالعه جدید: ایجنت‌های هوش مصنوعی می‌توانند به دزدی و نقض قوانین روی بیاورند

مدیرعامل OpenAI: هوش مصنوعی برخلاف انتظارم باعث آخرالزمان شغلی نشده است

آیا پاپ برای نوشتن درباره «خطرات هوش مصنوعی» از هوش مصنوعی کمک گرفت؟

نقطه عطفی برای گوشی‌های شیائومی؛ دستیار هوش مصنوعی miclaw با HyperOS 4 می‌آید

مدیرعامل اسپاتیفای از تولید آهنگ با هوش مصنوعی دفاع کرد

هوش مصنوعی جدید ElevenLabs معرفی شد: Music v2 با قابلیت تغییر سبک در میانه آهنگ [تماشا کنید]

ویژگی‌های جدید گوگل معرفی شدند: «منابع ترجیحی» و نمایش دیدگاه کاربران در AI Overviews

مدل Claude Opus 4.8 معرفی شد؛ بهتر از GPT-5.5 با صداقت بیشتر [تماشا کنید]

بالاتر از OpenAI؛ ارزش آنتروپیک با رشدی خیره‌کننده به ۹۶۵ میلیارد دلار رسید

هزینه نجومی استفاده از هوش مصنوعی؛ یک شرکت با فاکتور نیم میلیارد دلاری مواجه شد

تغییر استراتژی Mistral AI: ری‌برند Le Chat به Vibe با انبوهی از ویژگی‌های ایجنت‌محور

شبکه CNN از هوش مصنوعی پرپلکسیتی به‌اتهام نقض کپی‌رایت اخبار شکایت کرد

AMD از کارت گرافیک Radeon RX 9070…

پردازنده اینتل +Xeon 6 با ۲۸۸ هسته…

اینتل اطلاعات جدیدی از پردازنده‌های سرور Xeon…

اینتل با معرفی یک فریم‌ورک جدید چالش…