NVIDIA Blackwell Architecture ला रही है दुनिया की सबसे तेज GPU Architecture…..3 min read

Spread the love

NVIDIA Blackwell architecture के Excellent quality and speed ने सामान्यत: artificial intelligence and fast computing के क्षेत्र में एक नई कड़ी की स्थापना की है। यह पिछली NVIDIA techniques का एक new version है, जो Excellence, Efficiency and Scale में अग्रणी है। Blackwell architecture ने generative AI में Unparalleled performance, efficiency, and scale को परिभाषित किया है।

Blackwell architecture का एक महत्वपूर्ण गुणवत्ता उसका प्रदर्शन है। यह Encryption, deep learning, and organizational tools के लिए Unparalleled speed and performance प्रदान करता है। इसमें scale के साथ काम करने की क्षमता भी है, जिससे बड़े-बड़े data set का सम्मान किया जा सकता है और बड़े models का निर्माण किया जा सकता है।

एक और महत्वपूर्ण विशेषता है Blackwell architecture की Maximum Efficiency and Efficiency। यह non-uniform working models को develop करने के लिए सक्षम है, जो बहुत time और labor costs करते हैं। इसके साथ ही, यह इस technical field में एक बड़ी simplicity and growth लाता है, जिससे scientists and researchers को अधिकExcellent and smooth performance की संभावना होती है।

Other innovations में, Blackwell architecture excellent energy efficiency प्रदान करता है। यह speed and performance के साथ-साथ energy efficiency को भी मजबूत करता है, जो इसे powerful and sufficient बनाता है। इससे उपयोगकर्ताओं को बेहतर बैटरी लाइफ और कम ऊर्जा की खपत का लाभ मिलता है।

NVIDIA Blackwell architecture
NVIDIA Blackwell architecture

NVIDIA Blackwell Architecture ने Generative AI and fast computing के क्षेत्र में एक नई यात्रा की शुरुआत की है। इसकी Unparalleled quality, efficiency, and performance के कारण यह एक महत्वपूर्ण मील का पत्थर है, जो भविष्य में और भी excellence की दिशा में ले जाने की संभावना है।

Look Inside the NVIDIA Blackwell Architecture

A New Class of AI Superchip

NVIDIA Blackwell Architecture के GPU में 208 अरब transistors होते हैं और इन्हें एक custom-built TSMC 4NP process का उपयोग करके निर्मित किया जाता है। सभी Blackwell products में 2 reticle-limited die होते हैं जो एक integrated single GPU में एक 10 terabyte per second (TB/s) chip-to-chip interconnect द्वारा जुड़े होते हैं।

यह NVIDIA Blackwell Architecture की एक महत्वपूर्ण विशेषता है कि इसमें बेहद बड़ी संख्या में transistors होते हैं, जो इसे बेहतर Performance and functionality के लिए उत्कृष्ट बनाता है। इन transistors का उपयोग High communication rates, ocean computing, and energy के प्रयोग के लिए किया जाता है।

इसके अलावा, NVIDIA Blackwell Architecture में उपयोग किए जाने वाले TSMC 4NP process का उपयोग करने से यह graphics processors को बेहतर ऊर्जा कुशलता भी प्रदान करता है। इससे graphics card के प्रदर्शन में सुधार होता है और ऊर्जा की खपत कम होती है। 2 reticle-limited die का उपयोग करके, NVIDIA Blackwell Architecture ने अपनी प्रदर्शन को बढ़ावा दिया है और समय के अनुसार calibration करता है। इससे एक capable and high-potential GPU तैयार होता है जो विभिन्न कामों को संभावित करने में सक्षम होता है।

NVIDIA Blackwell Architecture

इसके अतिरिक्त, 2 die को 10 TB/s की chip-to-chip interconnect द्वारा जोड़ा गया है, जो इन GPU के बीच data communication को तेजी से और efficient बनाता है। इससे graphics card के अंदर के components एक-दूसरे के साथ सही ढंग से संचार कर सकते हैं, जिससे ग्राफिक्स प्रोसेसिंग की गति में सुधार होती है। इस प्रकार, NVIDIA Blackwell Architecture के Superior quality, energy efficiency, and high performance ने इसे आगे के लिए एक Critical Graphics Processing Solution बना दिया है। यह उद्योग में नई ऊर्जा की बौछार और कार्यक्षमता की दिशा में नई गति के रूप में काम करता है।

Second-Generation Transformer Engine

Second-Generation Transformer Engine अपने अनुसार custom blackwell Tensor Core तकनीक का उपयोग करती है, जो NVIDIA® TensorRT™-LLM और NeMo™ Framework के innovations के साथ मिलकर large language models (LLMs) और MoE model के लिए training and inference को तेज़ करता है।

MoE models को supercharge करने के लिए, blackwell Tensor Cores नए Precisions, जैसे कि new community-defined microscaling formats, शामिल करते हैं, जो high accuracy और अधिक बड़े Precisions के लिए आसान बदलाव की सुविधा प्रदान करते हैं। Blackwell Transformer Engine micro-tensor scaling नामक Fine-Grain Scaling Techniques का उपयोग करता है, जिससे Performance and accuracy को अनुकूलित किया जा सकता है और 4-bit floating point (FP4) AI को संभव बनाता है। यह Next Generation के models की performance and size को दोगुना करता है, जिसे memory का समर्थन कर सकता है, और साथ ही high accuracy को बनाए रखता है।

NVIDIA Blackwell architecture
NVIDIA Blackwell architecture

यह innovation सुनिश्चित करता है कि MoE models के अनुमान को बेहतर तरीके से समर्थित किया जा सकता है, जिससे उन्हें अधिक Comprehensive and detailed datasets पर प्रदर्शन करने की सामर्थ्य मिलती है। यह नए समुदाय-निर्धारित microscaling formats का उपयोग करके अधिक छोटे Precisions के साथ भी सटीक अनुमान प्रदान करता है, जिससे कि data को विशेषज्ञों के बीच साझा करने में आसानी होती है और इसे अनुमान करने में बेहतर साधारिता मिलती है।

इसके साथ ही, blackwell Transformer Engine के द्वारा अपनाए गए Micro-Tensor Scaling Techniques से उपयोगकर्ता को एक बेहतर Performance and accuracy की अनुभूति होती है। यह तकनीक सिर्फ प्रदर्शन को ही बढ़ावा नहीं देती, बल्कि यह सुनिश्चित भी करती है कि Performance and accuracy के बीच संतुलन बना रहे। इससे बड़े Spatial and High-Hypothesis Models के प्रदर्शन को सुधारने के लिए नई संभावनाएं खोलता है, जो अब भी सटीकता के साथ और अधिक तेज़ी से अनुमानित कर सकते हैं।

Blackwell Tensor Core तकनीक एक innovative initiatives है जो MoE models के लिए estimation and training को तेजी से और सही तरीके से समर्थित करता है। यह उपयोगकर्ताओं को अधिक detailed datasets पर काम करने और अधिक व्यापक MoE models को अधिक समय में प्रदर्शित करने की संभावना प्रदान करता है।

NVIDIA Blackwell architecture

Secure AI

Blackwell में NVIDIA Confidential Computing शामिल है, जो मजबूत hardware based safety के साथ sensitive data और AI model को unauthorized access से safe रखता है। Blackwell उद्योग में पहला TEE-I/O सक्षम GPU है, जबकि NVIDIA® NVLink® पर TEE-I/O सक्षम host और inline security के साथ सबसे Demonstrable confidential computing solution प्रदान करता है। Blackwell Confidential Computing secret methods से data process करता है और privacy रखता है। यह non-confidential modes के समान performance प्रदान करता है। साथ ही AI Intellectual property (IP) की सुरक्षा भी सुनिश्चित कर सकते हैं, और सुरक्षित रूप से Confidential AI Training, Inference, and Federated Learning को सक्रिय कर सकते हैं।

Reliability, Availability, and Serviceability (RAS) Engine

Blackwell में एक विशेष Reliability, Availability, and Serviceability (RAS) engine के साथ intelligent reusability जोड़ी गई है जो नुकसान को कम करने के लिए संभावित खराबियों को पहचानता है जो पहले ही हो सकती हैं। NVIDIA की AI-boosted forecasting-management capabilities hardware and software के thousands of data points को सतत रूप से निरीक्षित करती हैं जिससे overall health के लिए समय-समय पर कमी और अप्रभाव के sources को पहचाना और रोका जा सकता है। यह intelligent reusability बनाता है जो समय, ऊर्जा, और कंप्यूटिंग लागत बचाता है।

NVIDIA Blackwell architecture
NVIDIA Blackwell architecture

NVIDIA का RAS engine detailed information प्रदान करता है जो चिंता की क्षेत्रों को पहचान सकती है और रखरखाव के लिए योजना बना सकती है। RAS इंजन अवसरों के स्रोत को त्वरित रूप से स्थानांतरित करके यमतवारी के समय को कम करता है और प्रभावी उपचार के द्वारा निर्देशित करके समय-समय पर कमी को कम करता है।

यह उपाय निश्चित करता है कि यदि कोई समस्या हो, तो उसका निश्चित की जा सकती है और इसके साथ ही लागत और समय की बचत होती है। इसके अलावा, इस इंजन के द्वारा स्थानांतरण की गई जानकारी से प्रयोगकर्ता को सही निर्णय लेने में सहायक होता है।

इस प्रकार, Blackwell में शामिल NVIDIA RAS engine एक उच्च स्तर की intelligent reusability और performance को अनुमति देता है। यह सुनिश्चित करता है कि नुकसान की संभावना को पहले ही पहचाना जा सकता है और उसके संभावित प्रभावों को कम किया जा सकता है, जिससे कि संगठन का सामग्री को सुरक्षित और अस्थायी सेवायोग्यता में बढ़ावा हो सकता है।

Know more click here https://blogs.nvidia.com/blog/blackwell-auto-ecosystem-gtc/

Our more technical blogs are here https://khabharexpress.com/category/tech/

Leave a comment