हालांकि, यह अभी भी अपने प्रतिद्वंद्वियों की तुलना में सस्ता है।
दीपसेक के नए चैटबॉट ने इस आकर्षक विवरण के साथ खुद को मेरे सामने पेश किया:
नमस्ते, मैं बनाया गया था ताकि आप कुछ भी पूछ सकें और एक उत्तर प्राप्त कर सकें जो आपको आश्चर्यचकित भी कर सकता है।
आज, डीपसेक की कृत्रिम बुद्धिमत्ता बाजार में एक दुर्जेय प्रतियोगी के रूप में उभरी है, विशेष रूप से एनवीडिया के सबसे बड़े स्टॉक मूल्य गिरावट में से एक में योगदान दिया है।
चित्र: ensigame.com
इस मॉडल को अलग करने के लिए इसकी अभिनव वास्तुकला और प्रशिक्षण विधियाँ हैं। यह कई अत्याधुनिक प्रौद्योगिकियों का उपयोग करता है:
मल्टी-टोकन भविष्यवाणी (एमटीपी): यह दृष्टिकोण मॉडल को एक वाक्य के विभिन्न हिस्सों का विश्लेषण करके एक बार में कई शब्दों का पूर्वानुमान लगाने की अनुमति देता है, सटीकता और दक्षता दोनों को बढ़ाता है।
विशेषज्ञों का मिश्रण (एमओई): डीपसेक का मॉडल इनपुट डेटा को संसाधित करने के लिए तंत्रिका नेटवर्क की एक विविध सरणी को नियुक्त करता है। यह आर्किटेक्चर एआई प्रशिक्षण को गति देता है और प्रदर्शन को बढ़ाता है। दीपसेक V3 में, 256 तंत्रिका नेटवर्क का उपयोग किया जाता है, प्रत्येक टोकन प्रसंस्करण कार्य के लिए आठ सक्रिय होते हैं।
मल्टी-हेड लेटेंट ध्यान (एमएलए): यह तंत्र एआई को एक वाक्य के सबसे महत्वपूर्ण भागों पर ध्यान केंद्रित करने में मदद करता है। पाठ के टुकड़ों से प्रमुख विवरणों को बार -बार निकालकर, MLA इनपुट डेटा में महत्वपूर्ण बारीकियों को बेहतर ढंग से कैप्चर करने के लिए AI को लापता महत्वपूर्ण जानकारी के जोखिम को कम करता है।
प्रमुख चीनी स्टार्टअप दीपसेक का दावा है कि उन्होंने न्यूनतम लागत पर एक अत्यधिक प्रतिस्पर्धी एआई मॉडल बनाया है, यह दावा करते हुए कि केवल 2048 ग्राफिक्स प्रोसेसर का उपयोग करके दीपसेक वी 3 को प्रशिक्षित करने पर केवल $ 6 मिलियन खर्च करने का दावा किया गया है।
चित्र: ensigame.com
हालांकि, सेमियनलिसिस के विश्लेषकों ने खुलासा किया कि डीपसेक एक पर्याप्त कम्प्यूटेशनल बुनियादी ढांचा संचालित करता है, जिसमें लगभग 50,000 एनवीडिया हॉपर जीपीयू शामिल हैं। इसमें 10,000 H800 इकाइयाँ, 10,000 उन्नत H100 और अतिरिक्त H20 GPU शामिल हैं। ये संसाधन कई डेटा केंद्रों में फैले हुए हैं और एआई प्रशिक्षण, अनुसंधान और वित्तीय मॉडलिंग के लिए उपयोग किए जाते हैं।
सर्वर में कंपनी का कुल निवेश लगभग 1.6 बिलियन डॉलर है, जिसमें परिचालन खर्च $ 944 मिलियन है।
दीपसेक चीनी हेज फंड हाई-फ्लायर की एक सहायक कंपनी है, जो 2023 में एक अलग एआई-केंद्रित डिवीजन के रूप में स्टार्टअप को बंद कर देती है। क्लाउड प्रदाताओं पर भरोसा करने वाले अधिकांश स्टार्टअप्स के विपरीत, डीपसेक अपने डेटा केंद्रों का मालिक है, एआई मॉडल अनुकूलन पर पूर्ण नियंत्रण प्रदान करता है और तेजी से नवाचार को सक्षम करता है। कंपनी स्व-वित्त पोषित है, अपनी लचीलापन और निर्णय लेने की गति को बढ़ाती है।
चित्र: ensigame.com
इसके अलावा, दीपसेक के कुछ शोधकर्ता सालाना $ 1.3 मिलियन से अधिक कमाते हैं, प्रमुख चीनी विश्वविद्यालयों से शीर्ष प्रतिभा को आकर्षित करते हैं (कंपनी विदेशी विशेषज्ञों को काम पर नहीं रखती है)।
इन तथ्यों को देखते हुए, दीपसेक के अपने नवीनतम मॉडल को केवल $ 6 मिलियन के प्रशिक्षण के दावे के लिए अवास्तविक दिखाई देता है। यह आंकड़ा केवल पूर्व-प्रशिक्षण के दौरान GPU उपयोग की लागत को कवर करता है और इसमें अनुसंधान व्यय, मॉडल शोधन, डेटा प्रसंस्करण, या समग्र बुनियादी ढांचा लागत शामिल नहीं है।
अपनी स्थापना के बाद से, दीपसेक ने एआई विकास में $ 500 मिलियन से अधिक का निवेश किया है। हालांकि, इसकी दुबली संरचना इसे बड़ी, अधिक नौकरशाही कंपनियों की तुलना में AI नवाचारों को अधिक सक्रिय और प्रभावी ढंग से लागू करने की अनुमति देती है।
चित्र: ensigame.com
दीपसेक का उदाहरण बताता है कि एक अच्छी तरह से वित्त पोषित, स्वतंत्र एआई कंपनी वास्तव में उद्योग दिग्गजों के साथ प्रतिस्पर्धा कर सकती है। फिर भी, विशेषज्ञों ने ध्यान दिया कि कंपनी की सफलता अरबों निवेशों, तकनीकी सफलताओं और एक मजबूत टीम द्वारा संचालित होती है, जबकि एआई मॉडल के विकास के लिए "क्रांतिकारी बजट" के बारे में दावे कुछ हद तक अतिरंजित हैं।
फिर भी, दीपसेक की लागत उसके प्रतिद्वंद्वियों की तुलना में कम है। उदाहरण के लिए, दीपसेक ने R1 पर $ 5 मिलियन खर्च किए, जबकि CHATGPT4O को प्रशिक्षित करने के लिए $ 100 मिलियन का खर्च आया।