दीपसेक-आर 1 पेपर नेचर के कवर पर दिखाई दिया, दुनिया का पहला मुख्यधारा का बड़ा भाषा मॉडल बन गया, जिसे सहकर्मी की समीक्षा की गई है
हाल ही में, चीनी वैज्ञानिक अनुसंधान टीम द्वारा विकसित की गई बड़ी भाषा मॉडल डीपसेक-आर 1 अंतर्राष्ट्रीय शीर्ष पत्रिका नेचर के कवर पर दिखाई दिया है, जो दुनिया की पहली मुख्यधारा की बड़ी भाषा मॉडल बन गई है, जिसने सख्त सहकर्मी समीक्षा की है। यह सफलता परिणाम चिह्नित करता है कि कृत्रिम बुद्धिमत्ता के क्षेत्र में चीन का शोध दुनिया में सबसे आगे पहुंच गया है, और बड़ी भाषा मॉडल की विश्वसनीयता, पारदर्शिता और शैक्षणिक कठोरता के लिए एक नया बेंचमार्क भी सेट करता है।
दीपसेक-आर 1 की मुख्य सफलता
दीपसेक-आर 1 को डीपसेक टीम द्वारा विकसित किया गया था। इसके मुख्य नवाचार मॉडल वास्तुकला अनुकूलन, प्रशिक्षण दक्षता सुधार और सख्त नैतिक संरेखण डिजाइन में निहित हैं। मुख्यधारा के बड़े भाषा मॉडल की तुलना में, डीपसेक-आर 1 कई बेंचमार्क में अच्छा प्रदर्शन करता है, विशेष रूप से गणितीय तर्क, कोड जनरेशन और तथ्यात्मक सटीकता में।
मूल्यांकन संकेतक | दीपसेक-आर 1 | जीपीटी -4 | क्लाउड 3 |
---|---|---|---|
गणितीय तर्क (GSM8K) | 92.3% | 88.1% | 85.7% |
संहिता उत्पादन | 89.5% | 86.2% | 83.4% |
Truthfulqa | 78.6% | 72.3% | 75.1% |
सहकर्मी समीक्षा का प्रमुख मूल्य
जर्नल नेचर की सहकर्मी समीक्षा प्रक्रिया में आठ महीने लगे, और दुनिया भर के 15 विशेषज्ञों ने आर्किटेक्चरल डिजाइन, प्रशिक्षण डेटा, मूल्यांकन के तरीकों और डीपसेक-आर 1 के नैतिक मानदंडों की व्यापक समीक्षा की। समीक्षा फोकस में शामिल हैं:
रिव्यू ग्रुप के अध्यक्ष और कैम्ब्रिज विश्वविद्यालय में एआई एथिक्स रिसर्च सेंटर के निदेशक प्रोफेसर मारिया रोड्रिगेज ने कहा: "दीपसेक-आर 1 अकादमिक प्रकाशन मानकों द्वारा सत्यापित होने वाला पहला बड़ा भाषा मॉडल है। इसके खुले अनुसंधान विधियों और प्रतिलिपि प्रस्तुत करने योग्य प्रयोगात्मक डिजाइन उद्योग के लिए एक उदाहरण निर्धारित करते हैं।"
उद्योग प्रभाव और भविष्य की संभावनाएं
दीपसेक-आर 1 की सफलता की प्रगति ने उद्योग से मजबूत प्रतिक्रिया जगाई है। आंकड़ों के अनुसार, कागज प्रकाशित होने के बाद 72 घंटे के भीतर:
अनुक्रमणिका | डेटा |
---|---|
गीथब रिपॉजिटरी स्टार नंबर | 24,587 (320% वृद्धि) |
एपीआई कॉल अनुरोध | औसत दैनिक 1.8 मिलियन गुना |
कॉर्पोरेट सहयोग के लिए इरादे | 47 फॉर्च्यून 500 कंपनियां |
इन-डेप्थ सर्च सीईओ झांग हुआ ने एक साक्षात्कार में खुलासा किया: "हम तीसरी तिमाही में स्रोत मॉडल वेट खोलेंगे और मेडिकल और लॉ जैसे ऊर्ध्वाधर क्षेत्रों के लिए पेशेवर संस्करण जारी करेंगे। उसी समय, टीम एक ट्रिलियन-डॉलर पैरामीटर डीपसेक-आर 2 विकसित कर रही है, जो 2025 की शुरुआत में जारी होने की उम्मीद है।"
शैक्षणिक समुदाय में गर्म चर्चा
इस उपलब्धि ने अकादमिक समुदाय में व्यापक चर्चा की है। "डीपसेक-आर 1 जर्नल रिव्यू प्रतिमान से गुजरता है और एआई मॉडल के मूल्यांकन मानदंडों को बदल सकता है। भविष्य में, जिन मॉडलों को सहकर्मी की समीक्षा नहीं की गई है, वे वैज्ञानिक अनुसंधान और प्रमुख उद्योग अनुप्रयोगों में प्रवेश करना मुश्किल हो सकता है।"
इसी समय, बड़े मॉडलों की समीक्षा के लिए मानकों पर चर्चा तेजी से उत्साही हो रही है। नेचर मैगज़ीन में एक साथ प्रकाशित संपादकीय ने अंतरराष्ट्रीय स्तर पर एकीकृत एलएलएम मूल्यांकन ढांचे की स्थापना के लिए कहा, जिसमें शामिल हैं:
दीपसेक-आर 1 के आगमन के साथ, ग्लोबल एआई प्रतियोगिता ने एक नए चरण में प्रवेश किया है। अकादमिक कठोरता द्वारा चिह्नित यह परिवर्तन, बड़ी भाषा मॉडल के विकास प्रक्षेपवक्र को फिर से खोल सकता है और उद्योग को अधिक पारदर्शी और जिम्मेदार दिशा में विकसित करने के लिए बढ़ावा दे सकता है।
विवरण की जाँच करें
विवरण की जाँच करें