facebookmetapixel
Test Post कैश हुआ आउट ऑफ फैशन! अक्टूबर में UPI से हुआ अब तक का सबसे बड़ा लेनदेनChhattisgarh Liquor Scam: पूर्व CM भूपेश बघेल के बेटे चैतन्य को ED ने किया गिरफ्तारFD में निवेश का प्लान? इन 12 बैंकों में मिल रहा 8.5% तक ब्याज; जानिए जुलाई 2025 के नए TDS नियमबाबा रामदेव की कंपनी ने बाजार में मचाई हलचल, 7 दिन में 17% चढ़ा शेयर; मिल रहे हैं 2 फ्री शेयरIndian Hotels share: Q1 में 19% बढ़ा मुनाफा, शेयर 2% चढ़ा; निवेश को लेकर ब्रोकरेज की क्या है राय?Reliance ने होम अप्लायंसेस कंपनी Kelvinator को खरीदा, सौदे की रकम का खुलासा नहींITR Filing 2025: ऑनलाइन ITR-2 फॉर्म जारी, प्री-फिल्ड डेटा के साथ उपलब्ध; जानें कौन कर सकता है फाइलWipro Share Price: Q1 रिजल्ट से बाजार खुश, लेकिन ब्रोकरेज सतर्क; क्या Wipro में निवेश सही रहेगा?Air India Plane Crash: कैप्टन ने ही बंद की फ्यूल सप्लाई? वॉयस रिकॉर्डिंग से हुआ खुलासाPharma Stock एक महीने में 34% चढ़ा, ब्रोकरेज बोले- बेचकर निकल जाएं, आ सकती है बड़ी गिरावट

चीन की DeepSeek ने AI की दुनिया में मचाई हलचल, अमेरिका की ChatGPT और Gemini को चुनौती

चीन की DeepSeek लैब ने अपने ओपन-सोर्स AI मॉडल्स के जरिए ग्लोबल AI इंडस्ट्री में मचाई हलचल, OpenAI को दे रही सीधी चुनौती।

Last Updated- January 27, 2025 | 5:33 PM IST
Deepseek

चीन की AI रिसर्च लैब DeepSeek ने हाल ही में ऐसा कारनामा किया है जिसने आर्टिफिशियल इंटेलिजेंस (AI) की दुनिया को चौंका दिया है। इस लैब ने अपना नया ओपन-सोर्स मॉडल DeepSeek-R1 लॉन्च किया है, जो न केवल OpenAI जैसे दिग्गजों को टक्कर दे रहा है, बल्कि कई मामलों में उनसे बेहतर प्रदर्शन कर रहा है। खास बात यह है कि DeepSeek ने यह उपलब्धि बेहद कम लागत में हासिल की है, जिससे ग्लोबल AI उद्योग में एक नई बहस छिड़ गई है।

DeepSeek क्या है और कैसे बना यह सपना हकीकत?

DeepSeek चीन की एक स्वतंत्र AI रिसर्च लैब है, जिसकी शुरुआत 2023 में लियांग वेनफेंग ने की थी। इसका मूल जुड़ाव High-Flyer नाम के एक हेज फंड से है, जो फाइनेंशियल डेटा एनालिसिस में एडवांस्ड कंप्यूटिंग का इस्तेमाल करता था। हालांकि, लियांग ने AI के क्षेत्र में कुछ बड़ा करने के लिए High-Flyer के रिसोर्सेस को DeepSeek की तरफ मोड़ दिया।

DeepSeek को चीन की Baidu और Alibaba जैसी बड़ी कंपनियों का समर्थन नहीं है। यह पूरी तरह से स्वतंत्र रूप से काम करती है। लियांग का मकसद केवल मुनाफा कमाना नहीं, बल्कि वैज्ञानिक खोजों के जरिए दुनिया को नई तकनीकों से परिचित कराना है।

DeepSeek-R1: AI की दुनिया का नया सितारा

DeepSeek का नया मॉडल DeepSeek-R1 AI की दुनिया में एक नई मिसाल बन चुका है। यह मॉडल अपनी बेहतरीन रीजनिंग क्षमता, मैथ और कोडिंग जैसे कार्यों में शानदार प्रदर्शन कर रहा है। DeepSeek ने न केवल अपने प्रमुख मॉडल को ओपन-सोर्स किया है, बल्कि इसके छोटे वर्जन भी डेवलपर्स के लिए उपलब्ध कराए हैं। इन सभी मॉडल्स को MIT लाइसेंस के तहत लॉन्च किया गया है, जिससे डेवलपर्स इन्हें फाइन-ट्यून और कस्टमाइज कर सकते हैं।

इस मॉडल की सबसे खास बात इसकी किफायती ट्रेनिंग तकनीक है। DeepSeek ने नई टेक्नोलॉजीज, जैसे मल्टी-हेड लैटेंट अटेंशन (MLA) और मिश्रण-ऑफ-एक्सपर्ट्स का इस्तेमाल किया, जिससे इसकी लागत बहुत कम हो गई। रिपोर्ट्स के अनुसार, DeepSeek ने अपने मॉडल को Meta के Llama मॉडल की तुलना में केवल 10% रिसोर्स में ट्रेन किया।

लियांग वेनफेंग: DeepSeek के पीछे का दिमाग

DeepSeek के संस्थापक लियांग वेनफेंग का सफर बेहद प्रेरणादायक है। 1985 में जन्मे लियांग ने झेजियांग यूनिवर्सिटी से इंजीनियरिंग की पढ़ाई की और उसके बाद फाइनेंशियल हेज फंड इंडस्ट्री में कदम रखा। लेकिन उनका असली सपना AI की दुनिया में कुछ बड़ा करना था।

DeepSeek में लियांग ने चीन की टॉप यूनिवर्सिटीज़, जैसे पेकिंग यूनिवर्सिटी और चिंगहुआ यूनिवर्सिटी, के युवा रिसर्चर्स को मौका दिया। ये युवा वैज्ञानिक न केवल अपनी पढ़ाई में एक्सिलेंट थे, बल्कि नए इनोवेशन के लिए भी पूरी तरह समर्पित थे। लियांग का मानना है कि युवा दिमाग ज्यादा साहसी होते हैं और जोखिम उठाने को तैयार रहते हैं, जो AI जैसी तकनीकी क्षेत्र में जरूरी है।

अमेरिकी प्रतिबंध और DeepSeek की स्मार्ट रणनीति

2022 में अमेरिका ने चीन पर एडवांस्ड चिप्स, जैसे Nvidia H100, की सप्लाई पर रोक लगा दी। इससे चीन की AI इंडस्ट्री को झटका लगा। लेकिन DeepSeek ने इस चुनौती को अपने फायदे में बदल दिया।

DeepSeek ने अपने मॉडल को ट्रेन करने के लिए किफायती और स्मार्ट तकनीकों का सहारा लिया। उन्होंने कस्टम डेटा एक्सचेंज और मेमोरी ऑप्टिमाइजेशन जैसे उपाय अपनाए, जिससे सीमित संसाधनों में भी बेहतरीन परिणाम मिले। इन रणनीतियों ने यह साबित कर दिया कि AI की दुनिया में सफलता केवल महंगे संसाधनों पर निर्भर नहीं करती।

DeepSeek ने अपनी तकनीकों में तीन बड़े बदलाव किए:

कस्टम कम्युनिकेशन स्कीम्स: चिप्स के बीच डेटा शेयरिंग को इतना स्मार्ट बना दिया कि मेमोरी की बचत होने लगी।
मेमोरी ऑप्टिमाइजेशन: फील्ड साइज को घटाकर संसाधनों का अधिकतम इस्तेमाल किया।
मिक्स-ऑफ-मॉडल्स: छोटे-छोटे मॉडलों को जोड़कर ऐसे रिजल्ट दिए जो बड़े मॉडल्स को टक्कर देते हैं।

ओपन-सोर्स मॉडल से बढ़ती DeepSeek की धाक

DeepSeek ने अपने AI मॉडल्स को ओपन-सोर्स करके पूरी दुनिया का ध्यान खींचा है। MIT लाइसेंस के तहत, कोई भी डेवलपर इन मॉडल्स का इस्तेमाल कर सकता है और अपनी जरूरत के हिसाब से इन्हें कस्टमाइज कर सकता है। इस कदम से न केवल AI तकनीकों तक पहुंच आसान हुई है, बल्कि पश्चिमी कंपनियों के दबदबे को भी चुनौती दी गई है।

AI की नई रेस: अमेरिका बनाम चीन

DeepSeek की इस सफलता ने अमेरिका को झकझोर कर रख दिया है। अमेरिका अब अपनी बादशाहत बचाने के लिए बड़े प्रोजेक्ट्स पर काम कर रहा है। हालांकि, DeepSeek ने दिखा दिया है कि AI की दुनिया में केवल बड़े निवेश और महंगे चिप्स से ही काम नहीं चलता।

First Published - January 27, 2025 | 5:26 PM IST

संबंधित पोस्ट