তবে এটি এখনও এর প্রতিযোগীদের তুলনায় সস্তা।
ডিপসেকের নতুন চ্যাটবট এই আকর্ষণীয় বিবরণ দিয়ে আমার সাথে নিজেকে পরিচয় করিয়ে দিয়েছে:
হাই, আমাকে তৈরি করা হয়েছিল যাতে আপনি কিছু জিজ্ঞাসা করতে পারেন এবং এমন একটি উত্তর পেতে পারেন যা আপনাকে অবাক করে দিতে পারে।
আজ, ডিপসিকের কৃত্রিম বুদ্ধিমত্তা বাজারে এক শক্তিশালী প্রতিযোগী হিসাবে আত্মপ্রকাশ করেছে, বিশেষত এনভিডিয়ার অন্যতম বৃহত্তম শেয়ারের দামের ড্রপকে অবদান রাখে।
চিত্র: ensigame.com
এই মডেলটিকে কী আলাদা করে তা হ'ল এর উদ্ভাবনী স্থাপত্য এবং প্রশিক্ষণের পদ্ধতি। এটি বেশ কয়েকটি কাটিয়া প্রান্ত প্রযুক্তি ব্যবহার করে:
মাল্টি-টোকেন প্রেডিকশন (এমটিপি): এই পদ্ধতির ফলে একটি বাক্যটির বিভিন্ন অংশ বিশ্লেষণ করে, যথার্থতা এবং দক্ষতা উভয়ই বাড়িয়ে মডেলটিকে একবারে একাধিক শব্দের পূর্বাভাস দেওয়ার অনুমতি দেয়।
বিশেষজ্ঞদের মিশ্রণ (এমওই): ডিপসিকের মডেল ইনপুট ডেটা প্রক্রিয়া করতে বিভিন্ন নিউরাল নেটওয়ার্কগুলির বিভিন্ন অ্যারে নিয়োগ করে। এই আর্কিটেকচারটি এআই প্রশিক্ষণকে গতি দেয় এবং কর্মক্ষমতা বাড়ায়। ডিপসেক ভি 3 -তে, প্রতিটি টোকেন প্রসেসিং টাস্কের জন্য আটটি সক্রিয় সহ 256 নিউরাল নেটওয়ার্ক ব্যবহার করা হয়।
মাল্টি-হেডের সুপ্ত মনোযোগ (এমএলএ): এই প্রক্রিয়াটি এআইকে একটি বাক্যটির সর্বাধিক উল্লেখযোগ্য অংশগুলিতে ফোকাস করতে সহায়তা করে। পাঠ্য খণ্ডগুলি থেকে বারবার কী বিশদটি বের করে, এমএলএ গুরুত্বপূর্ণ তথ্য অনুপস্থিতির ঝুঁকি হ্রাস করে, ইনপুট ডেটাতে এআইকে আরও ভালভাবে ক্যাপচার করতে সক্ষম করে।
শীর্ষস্থানীয় চীনা স্টার্টআপ ডিপসেক গর্ব করে যে তারা ন্যূনতম ব্যয়ে একটি অত্যন্ত প্রতিযোগিতামূলক এআই মডেল তৈরি করেছে, দাবি করে যে মাত্র 2048 গ্রাফিক্স প্রসেসর ব্যবহার করে ডিপসেক ভি 3 প্রশিক্ষণে কেবল million মিলিয়ন ডলার ব্যয় করেছে।
চিত্র: ensigame.com
তবে সেমিয়ানালাইসিসের বিশ্লেষকরা প্রকাশ করেছেন যে ডিপসেক প্রায় ৫০,০০০ এনভিডিয়া হপার জিপিইউ সমন্বিত একটি উল্লেখযোগ্য গণ্য অবকাঠামো পরিচালনা করে। এর মধ্যে 10,000 এইচ 800 ইউনিট, 10,000 উন্নত এইচ 100 এবং অতিরিক্ত এইচ 20 জিপিইউ অন্তর্ভুক্ত রয়েছে। এই সংস্থানগুলি একাধিক ডেটা সেন্টারে ছড়িয়ে পড়ে এবং এআই প্রশিক্ষণ, গবেষণা এবং আর্থিক মডেলিংয়ের জন্য ব্যবহৃত হয়।
সার্ভারগুলিতে কোম্পানির মোট বিনিয়োগ প্রায় 1.6 বিলিয়ন ডলার, অপারেশনাল ব্যয়ের সাথে আনুমানিক $ 944 মিলিয়ন ডলার।
ডিপসেক চীনা হেজ ফান্ড হাই-ফ্লায়ারের একটি সহায়ক সংস্থা, যা 2023 সালে পৃথক এআই-কেন্দ্রিক বিভাগ হিসাবে স্টার্টআপটি ছড়িয়ে দেয়। ক্লাউড সরবরাহকারীদের উপর নির্ভর করে এমন বেশিরভাগ স্টার্টআপগুলির বিপরীতে, ডিপসেক তার ডেটা সেন্টারগুলির মালিক, এআই মডেল অপ্টিমাইজেশনের উপর সম্পূর্ণ নিয়ন্ত্রণ সরবরাহ করে এবং দ্রুত উদ্ভাবন সক্ষম করে। সংস্থাটি স্ব-অর্থায়িত থাকে, এর নমনীয়তা এবং সিদ্ধান্ত গ্রহণের গতি বাড়িয়ে তোলে।
চিত্র: ensigame.com
তদুপরি, ডিপসেকের কিছু গবেষক বার্ষিক $ 1.3 মিলিয়ন ডলারের বেশি আয় করেন, শীর্ষস্থানীয় চীনা বিশ্ববিদ্যালয়গুলি থেকে শীর্ষ প্রতিভা আকৃষ্ট করে (সংস্থাটি বিদেশী বিশেষজ্ঞদের নিয়োগ দেয় না)।
এই তথ্যগুলি দেওয়া, ডিপসিকের সর্বশেষ মডেলটিকে মাত্র million মিলিয়ন ডলারে প্রশিক্ষণের দাবি অবাস্তব বলে মনে হয়। এই চিত্রটি কেবল প্রাক-প্রশিক্ষণের সময় জিপিইউ ব্যবহারের ব্যয়কে কভার করে এবং গবেষণা ব্যয়, মডেল পরিশোধন, ডেটা প্রসেসিং বা সামগ্রিক অবকাঠামোগত ব্যয় অন্তর্ভুক্ত করে না।
প্রতিষ্ঠার পর থেকে ডিপসেক এআই বিকাশে $ 500 মিলিয়ন ডলারের বেশি বিনিয়োগ করেছে। যাইহোক, এর পাতলা কাঠামো এটিকে বৃহত্তর, আরও আমলাতান্ত্রিক সংস্থার চেয়ে আরও সক্রিয় এবং কার্যকরভাবে এআই উদ্ভাবনগুলি বাস্তবায়নের অনুমতি দেয়।
চিত্র: ensigame.com
ডিপসেকের উদাহরণ চিত্রিত করে যে একটি সু-অর্থায়িত, স্বতন্ত্র এআই সংস্থা প্রকৃতপক্ষে শিল্প জায়ান্টদের সাথে প্রতিযোগিতা করতে পারে। তবুও, বিশেষজ্ঞরা নোট করেছেন যে সংস্থার সাফল্য বিলিয়ন বিনিয়োগ, প্রযুক্তিগত অগ্রগতি এবং একটি শক্তিশালী দল দ্বারা পরিচালিত হয়েছে, যখন এআই মডেল বিকাশের জন্য "বিপ্লবী বাজেট" সম্পর্কে দাবি কিছুটা অতিরঞ্জিত।
তবুও, ডিপসিকের ব্যয় তার প্রতিযোগীদের তুলনায় কম থাকে। উদাহরণস্বরূপ, ডিপসেক আর 1 এ 5 মিলিয়ন ডলার ব্যয় করেছে, যেখানে চ্যাটজিপিটি 4 ও প্রশিক্ষণের জন্য $ 100 মিলিয়ন ব্যয় করেছে।