DeepSeek AI استارتاپ چینی درحالرشدی است که بهدلیل پیشرفتهای خود در زمینه هوش مصنوعی موردتوجه جهان قرار گرفته است. شرکت چینی به عقیده بسیاری از کارشناسان یکی از قدرتمندترین مدلهای هوش مصنوعی رایگان با نام دیپسیک را منتشر کرده است که در ادامه این مطلب آن را معرفی خواهیم کرد.
در ویدیوی زیر شما را کامل با دیپسیک آشنا میکنیم:
مشاهده در یوتوب دیجیاتو
مشاهده در آپارات دیجیاتو
هوش مصنوعی دیپسیک چیست؟
دیپسیک یک پلتفرم پیشرفته در زمینه هوش مصنوعی است که بهطور ویژه برای تحلیل دادهها و ارائه پیشنهادات هوشمند طراحی شده است. این فناوری از الگوریتمهای یادگیری ماشین و یادگیری عمیق استفاده میکند تا قادر به شبیهسازی رفتارهای انسانی در پردازش اطلاعات و تصمیمگیریها باشد. DeepSeek بهعنوان یک ابزار تحلیلی هوشمند میتواند به کسبوکارها و افراد کمک کند تا بهصورت دقیقتر به تجزیه و تحلیل دادهها بپردازند و در تصمیمگیریهای خود از نتایج هوشمند بهره ببرند.
جدیدترین نسخه از مدل هوش مصنوعی این شرکت که DeepSeek V3 نام دارد، اواخر 2024 منتشر شد و توسعهدهندگان میتوانند آن را دانلود و در برنامههای خود استفاده کنند. این مدل هوش مصنوعی از معماری نوآورانهای بهره میبرد که باعث شده در مقایسه با بسیاری از مدلهای هوش مصنوعی قدرتمند امروزی از شرکتهایی مانند متا و OpenAI که برای استفاه از امکانات پیشرفته آنها باید پول بپردازید، قدرتمندتر باشد.
تاریخچه و بنیانگذاری DeepSeek
دیپسیک استارتاپی چینی است که دفتر مرکزی آن در هانگژو، استان ژجیانگ، چین قرار دارد. این استارتاپ کامل توسط های-فلایر تأمین مالی میشود، این امر به این شرکت اجازه میدهد بدون فشار سرمایهگذاران خارجی، بر تحقیقات و توسعه بلندمدت خود متمرکز باشد.
بنیانگذار DeepSeek کیست و این شرکت چه زمانی تأسیس شد؟
بنیانگذار DeepSeek «لیانگ ونفنگ»، کارآفرین چینی 40 ساله است که با شرکت سرمایهگذاری Hedge fund خود مالک آن محسوب میشود.
بهطور دقیقتر، در 14 آوریل سال 2023، شروع به کار آزمایشگاه هوش مصنوعی توسط High-Flyer اعلام شد که جدای از کسبوکار اصلی آن به تحقیق در زمینه توسعه ابزارهای هوش مصنوعی تمرکز دارد. در 17 ژوئیه سال 2023 این آزمایشگاه نام DeepSeek را به خود گرفت.
لیانگ ونفنگ عموماً بهدلیل داشتن شخصیتی کمحاشیه و کنجکاوی علمی بهجای رفتن بهدنبال بازده مالی شناخته شده است. او اعلام کرده مأموریت دیپسیک حل «سختترین سؤالات جهان» و ترویج فرهنگ نوآوری و همکاری است. رویکرد او در استخدام بر اشتیاق و خلاقیت تأکید دارد و اغلب استعدادهای جوان را از دانشگاههای برتر چین جذب میکند.
در ابتدا شرکتهای سرمایهگذاری تمایلی به تامین بودجه آن نداشتند، زیرا از نظر آنها احتمال سودآوری این سرمایهگذاری در یک دوره زمانی کوتاه بعید بهنظر میرسد.
معرفی مدلهای DeepSeek
شرکت چینی تاکنون مدلهای هوش مصنوعی مختلفی را منتشر کرده است. ماجراجویی DeepSeek با انتشار DeepSeek Coder در نوامبر 2023 آغاز شد، مدلی متنباز برای انجام وظایف کدنویسی. بهدنبال آن اولین مدل زبانی بزرگ DeepSeek از راه رسید که مدلی با 67 میلیارد پارامتر بود. سپس مه 2024 مدل DeepSeek-V2 عرضه شد که بهدلیل عملکرد قوی و هزینه کم توجه زیادی را به خود جلب کرد و جنگ قیمتی را در بازار مدلهای هوش مصنوعی چین به راه انداخت.
در ادامه به معرفی 2 مورد از مهمترین مدلهای DeepSeek میپردازیم.
مدل DeepSeek V3:
در دسامبر 2024، این شرکت یک مدل پایه با نام DeepSeek-V3-Base و یک مدل چتبات با نام DeepSeek-V3 را منتشر کرد.
ویژگیهای فنی و معماری پیشرفته DeepSeek V3
دیپ سیک میگوید مدل آن میتواند طیف وسیعی از وظایف و کارهای مبتنیبر متن، نظیر کدنویسی، ترجمه و نگارش مقاله و ایمیل را انجام دهد. همچنین در آموزش آن از پردازشگرهای گرافیکی H800 مخصوص چین از شرکت انویدیا استفاده شده است.
دیپ سیک برای توسعه مدل خود از معماری بهینهشدهای (با نام ترکیبی-از-متخصصان یا MoE) استفاده کرده است که نیاز آن به قدرت محاسباتی گسترده و سختافزارهای قدرتمند را کاهش میدهد. این معماری را تیمی (متخصص) از سیستمهای هوش مصنوعی تخصصی در نظر بگیرید که در آن هر بهاصطلاح «متخصص» شبکه عصبی خود را دارد و برای انجام وظایف مرتبط با خود فعال میشوند.
در واقع این معماری پیش از انجام وظایف، پیچیدگی آنها را پیشبینی میکند و براساس منابعی که در اختیار دارد، (متخصصان) مسیر موردنیاز برای تحقق آن را تعیین میکند. همچنین برای انجام هریک از وظایف فقط مرتبطترین سیستمهای هوش مصنوعی فعال خواهند شد که محاسبات اضافی را به حداقل میرساند و سرعت عملکرد مدل را بیشتر میکند.
برتریهای DeepSeek V3 نسبت به رقبا
دیپ سیک با تستهای خود اعلام کرده DeepSeek V3 هم از مدلهای قابلدانلود و رایگان هم از مدلهای غیررایگان که فقط از طریق API در دسترس هستند، بهتر عمل میکند. به گفته این شرکت و طبق تصویر زیر، مدل هوش مصنوعی آن در کدنویسی از مدلهای دیگر مانند Llama 3.1 متعلق به متا، GPT-4o از OpenAI و Qwen 2.5 72B شرکت چینی Alibaba بهتر عمل کرده است.
دیپ سیک ادعا کرده DeepSeek V3 با مجموعه دادهای از 14 تریلیون و 800 میلیارد توکن آموزش دیده است. برای درک بهتر این موضوع باید گفت هر یکمیلیون توکن معادل حدود 750 هزار کلمه است. DeepSeek V3 از نظر اندازه نیز بسیار وسیع است و از 671 میلیارد پارامتر پشتیبانی میکند (پارامترها متغیرهای داخلی هستند که مدلهای برای پیشبینی یا تصمیمگیری از آنها استفاده میکنند). با این شرایط، هوش مصنوعی این شرکت تقریباً 1.6 برابر از Llama 3.1 405B شرکت متا بزرگتر است که از 405 میلیارد پارامتر پشتیبانی میکند.
نکته جالب دیگر اینکه چینیها مدل پرچمدار خود را فقط در 2 ماه و با هزینهای نزدیک به 5.58 میلیون دلار آموزش دادهاند؛ بنابراین در مقایسه با شرکتهای بزرگی مانند متا و OpenAI این شرکت زمان و منابع کمتری برای مدل هوش مصنوعی خود صرف کرده است.
مدل DeepSeek R1:
در 20 ژانویه 2025 نیز مدل DeepSeek-R1 منتشر شد. شرکت چینی درباره این مدل ادعا میکند که عملکرد DeepSeek R1 با سختافزار نسبتاً ارزانتر با برترین مدلهای هوش مصنوعی جهان مطابقت دارد.
معرفی مدل R1 و تفاوتهای آن با نسخههای قبلی
DeepSeek-R1 یک مدل هوش مصنوعی رایگان با قابلیت استدلال است که از جدیدترین مدلهای هوش مصنوعی دیپسیک محسوب میشود. گفته میشود آموزش این مدل با هزینه بسیار کمتری نسبت به GPT-4 (6 میلیون دلار در مقابل 100 میلیون دلار) و تقریبا یک دهم قدرت محاسباتی مورد استفاده برای مدل LLaMA 3.1 انجام شده است.
کاربردهای خاص DeepSeek R1
به گفته DeepSeek، مدل R1 در طیف وسیعی از وظایف مبتنی بر متن مانند نوشتن، پاسخ به سوالات، ویرایش و خلاصهسازی مهارت دارد. البته مدل هوش مصنوعی R1 بهطور خاص در وظایف استدلالمحور خوب عمل میکند. از جمله این وظایف میتوان به فهرست زیر اشاره کرد:
- کدنویسی و رفع اشکال
- انجام محاسبات ریاضی
- تشریح مفاهیم پیچیده علمی
با وجود چنین قابلیتهایی، مدل R1 در مواردی مانند توسعه نرمافزار، ریاضیات، تولید محتوا، خدمات مشتریان و تحلیل داده میتوانند مفید باشد.
قابلیتهای کلیدی، مزایا و معایب هوش مصنوعی DeepSeek در مقایسه با رقبا
ویژگیها و مزایای مهمی وجود دارند که باعث میشوند مدلهای زبان بزرگ DeepSeek بسیار منحصر به فرد به نظر برسند.
برای مثال، با وجود اینکه این مدلها توسط تیم کوچکتر و با بودجه بسیار کمتر نسبت به غولهای برتر آمریکایی ساخته شدهاند، اما DeepSeek هوش مصنوعی بزرگ و قدرتمندی است که با وجود منابع کمتر عملکردی برابر با مدلهای پیشرو ارائه میکند. دلیل این امر بهرهمندی از معماری خاصی است که پیشتر درباره آن توضیح داده بودیم.
نکته قابل توجه دیگر اینکه آموزش مدلهای DeepSeek نسبت به مدلهای رقیب بسیار ارزانتر است و سریعتر انجام میشود. با این وجود هم DeepSeek در بنچمارکهای معتبر نمرات قابل توجهی دریافت کرده که همترازی یا برتری آن نسبت به مدلهای آمریکایی را نشان میدهد.
مقایسه عملکرد DeepSeek با ChatGPT
در حالی که DeepSeek و ChatGPT هر دو مدلهای هوش مصنوعی پیشرفتهای هستند، اما رویکردهای متفاوتی را دنبال میکنند. از جمله مهمترین تفاوتهای این دو مدل میتوان به معماری آنها اشاره کرد. DeepSeek همانطور که گفتیم دارای معماری ترکیبی-از-متخصصان یا MoE است اما ChatGPT از یک معماری سنتی استفاده میکند که در آن تمام متخصصان روی یک وظیفه کار میکنند.
از نظر عملکرد در حوزههای مختلف؛ هرکدام در زمینههای مختلفی میدرخشند.
DeepSeek در وظایف فنی، به ویژه ریاضیات عملکرد بسیار خوبی از خود نشان داده است و بالاتر از تمام رقبای خود نرخ دقت 90 درصد را دارد. در مقابل، ChatGPT برای درک زمینه و ارائه پاسخهای دقیقتر در طیف وسیعی از موضوعات قویتر است. در زمینه کدنویسی نیز ChatGPT بهعنوان یک دستیار جامع به شما کمک خواهد کرد و توضیحات و پیشنهادات کاربردی ارائه میکند. با این وجود برای افراد تازهوارد یک ابزار یادگیری عالی است. DeepSeek اما رویکرد مستقیمتری دارد و با کدنویسی سریعتر و ارائه راهحلهای کارآمد برای چالشهای برنامهنویسی مفید است.
همچنین تفاوت مهم دیگر این مدلها به نحوه دسترسی به آنها مربوط میشود. در حالی که DeepSeek کاملا رایگان است، ChatGPT قابلیتهای پیشرفته خود را به مشترکین ارائه میکند.
در جدول زیر مزایا و معایب DeepSeek و ChatGPT را آوردهایم.
DeepSeek | ChatGPT | |
---|---|---|
مزایا | رایگان و مقرونبهصرفه | درک متنی عالی و تولید دقیق متن |
کارآمد برای کدنویسی و وظایف فنی | قابل اعتماد برای کارهای تحقیقاتی و وظایف نوشتاری | |
پاسخ سریعتر برای سوالات دارای ساختار | ترکیب بهتر با قابلیتهای چندوجهی (مانند صدای تصاویر) | |
عملکرد برتر در محاسبات ریاضی | رابط کاربر پسندتر | |
منابع مورد نیاز کمتر | عملکرد ثابت در وظایف مختلف | |
معایب | سوگیریهای احتمالی در موضوعات حساس سیاسی | نیاز به اشتراک برای ویژگیهای پیشرفته |
برای پاسخهای پیچیده به تأیید بیشتری نیاز دارد | هزینههای محاسباتی بالاتر | |
رابط کاربری معمولی | محدودیت نسخه رایگان | |
سیاستهای تعدیل محتوا سختگیرانهتر | برای محاسبات فنی میتواند کندتر باشد |
نحوه استفاده از هوش مصنوعی DeepSeek برای کاربران عمومی
دسترسی به هوش مصنوعی DeepSeek V3
میتوانید به صورت رایگان از نسخه وب هوش مصنوعی پرچمدار چینی DeepSeek V3 استفاده کنید. البته برای استفاده از آن به حساب کاربری نیاز دارید که از طریق حساب گوگل نیز میتوان آن را ایجاد کرد. محیط کاربری این سرویس شباهت زیادی به ChatGPT دارد و میتوانید پس از ورود به حساب خود با آن گفتگو کنید. نکته قابلتوجه اینکه این مدل از زبان فارسی نیز پشتیبانی میکند و کاربران ایرانی را تحریم نکرده است.
افزونبر نسخه وب، درحالحاضر اپلیکیشن DeepSeek برای اندروید و iOS نیز موجود است. علاوه بر این API آن برای توسعهدهندگان در دسترس است.
ثبتنام و استفاده از دیپسیک (نسخه وب)
برای استفاده از دیپسیک پیش از هرچیز به یک حساب کاربری نیاز دارید. برای ثبتنام ابتدا باید به صفحه ساخت حساب جدید در وبسایت DeepSeek بروید. سپس از شما خواسته میشود با واردکردن آدرس ایمیل و یک پسورد حساب خود را بسازید. پس از واردکردن ایمیل یک کد برای آن ارسال خواهد شد که در مراحل ثبت نام باید آن را در فیلد Code وارد کنید.
در نهایت با انتخاب دکمه Sign Up حساب شما ساخته میشود.
پس از آن رابط اصلی DeepSeek برای شما نمایش داده خواهد شد. مطابق با تصویر زیر:
- از کادر سمت چپ میتوانید تاریخچه سوالات خود را مشاهده کنید.
- در کادر مرکز صفحه میتوانید سوالات خود را بپرسید.
- با انتخاب گزینه Search به هوش مصنوعی اجازه میدهد تا نتایج وب را جستجو کند.
- گزینه DeepThink دسترسی به مدل استدلالگر R1 را فراهم میکند.
- با استفاده از آیکون سنجاق در سمت راست میتوانید تصویر یا یک فایل را آپلود کنید.
ثبتنام و استفاده از اپلیکیشن دیپسیک در موبایل
همانطور که گفتیم، هوش مصنوعی DeepSeek در موبایلها نیز قابل استفاده است. از طریق باکس زیر میتوانید آن را از گوگل پلی یا اپ استور دانلود کنید.
undefined
DeepSeek – AI Assistant
سازنده: DeepSeek |
قیمت: رایگان |
دسته بندی: undefined |
سیستم عامل: اندروید و iOS |
حجم: 16 / 37 مگابایت |
زبان: undefined |
نحوه استفاده و ساخت حساب DeepSeek در موبایل نیز مانند نسخه وب آن است. ابتدا پس از اجراکردن اپلیکیشن صفحهای نمایش داده میشود که با آن میتوانید وارد حساب خود شوید یا با انتخاب دکمه Sign Up ثبت نام کنید. سپس از شما خواسته میشود تا یک ایمیل و پسورد انتخاب کنید و کد ارسال شده به ایمیل خود را نیز وارد کنید. پس از آن وارد صفحه اصلی اپلیکیشن خواهید شد.
با انتخاب آیکون دو خط در بالا سمت چپ اپلیکیشن به قسمت تاریخچه چتها هدایت خواهید شد. آیکون بعلاوه بالا سمت راست نیز چت جدیدی را آغاز میکند. در پایین صفحه نیز دکمههای Search برای جستجوی وب و DeepThink برای استفاده از مدل R1 وجود دارند. با آیکون بعلاوه پایین صفحه نیز میتوانید یک فایل برای DeepSeek آپلود کنید.
باید به این نکته توجه کرد که در هر دو مورد میتوانید با حساب گوگل خود نیز از دیپ سیک استفاده کنید.
نحوه استفاده از هوش مصنوعی DeepSeek برای توسعهدهندگان و حرفهایها
توسعهدهندگان و برنامهنویسان حرفهای نیز میتوانند از طریق API از دیپ سیک استفاده کنند.
چگونه DeepSeek را از طریق Hugging Face راهاندازی کنیم؟
یکی از راههای دسترسی به هوش مصنوعی DeepSeek برای توسعهدهندگان از طریق پلتفرم Hugging Face است. برای استفاده از آن در ابتدا باید مخزن DeepSeek AI را از گیتهاب کلون کنید:
git clone https://github.com/DeepSeekAI/DeepSeek-V3.git
سپس باید به مخزن مراجعه کرده و وابستگیهای موردنیاز را نصب کنید:
pip install -r requirements.txt
در مرحله بعدی، چکپوینتهای Hugging Face را از طریق لینک ارائهشده در صفحه GitHub دانلود کنید. در نهایت برای راهاندازی و اجرای مدل باید دستورالعملهای موجود در مخزن را دنبال کنید.
چگونه DeepSeek را از طریق API راهاندازی کنیم؟
هوش مصنوعی DeepSeek امکان استفاده از API خود را برای کاربران فراهم کرده است. برای استفاده از API این هوش مصنوعی باید در سایت DeepSeek اقدام به ساخت یک کلید API کنید.
بعد از ساخت اکانت و ورد به محیط کاربری، به بخش API Keys بروید تا بتوانید کلیدهای API خود را مدیریت کنید.
- URL پایه برای درخواستهای API آدرس https://api.deepseek.com است.
- برای احراز هویت، کلیدهای API خود را در هدرهای درخواست قرار دهید.
هوش مصنوعی DeepSeek V3 از قابلیتهای مختلف مانند مکالمات چند دورهای، فراخوانی عملکرد و خروجی JSON پشتیبانی میکند. برای ارسال درخواست چت باید از کد زیر استفاده کنید:
import requests
import json
url = "https://api.deepseek.com/chat/completions"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer YOUR_API_KEY"
}
payload = {
"model": "deepseek-chat",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello!"}
],
"stream": False
}
response = requests.post(url, headers=headers, data=json.dumps(payload))
print(response.json())
نکته: توجه داشته باشید که در این کد باید
چگونه هوش مصنوعی DeepSeek را دانلود و روی کامپیوتر شخصی اجرا کنیم؟
کاربران ویندوز برای نصب و استفاده از هوش مصنوعی DeepSeek R1 ابتدا باید به وبسایت Ollama رفته و Windows installer آن را دانلود کنند. بعد از نصب، Command Prompt را فعال و این دستور را تایپ کنند:
ollama run deepseek-r1:8b
کاربران سیستمعامل مک نیز باید در ابتدا Ollama را از طریق Homebrew نصب کرده و سپس DeepSeek R1 را با دستور زیر اجرا کنند:
ollama run deepseek-r1:8b
البته امکان اجرای دیگر نسخههای مدل R1 با پارامترهای بزرگتر نیز وجود دارد، اما مستلزم دانلود فایلهای سنگینتر و سختافزار قویتر برای اجرای مدل است. برای مشاهده دستور نصب سایر نسخهها این لینک را ببینید.
پیشنیازهای سختافزاری و نرمافزاری دیپسیک
برای استفاده از DeepSeek باید دستگاه شما به یکی از سیستمعاملهای زیر مجهز باشد:
- ویندوز 10 و بالاتر
- مک اواس 10.15 و بالاتر
- لینوکس (اوبونتو 18.04 و بالاتر)
مدل هوش مصنوعی DeepSeek R1 در نسخههای مختلفی عرضه میشود و هر مدل نیز بسته به تعداد پارامترها سختافزار خاص خود را میطلبد.
- نسخه 7B: حداقل ۸ گیگابایت رم بهصورت استاندارد
- نسخه 13B: حداقل ۱۶ گیگابایت رم
- نسخه 33B: حداقل ۳۲ گیگابایت رم
همچنین، برای نصب DeepSeek شما به حداقل سختافزار زیر نیاز دارید:
- پردازنده چند هستهای (پردازنده چهار هستهای یا بالاتر توصیه میشود)
- کارت گرافیک با عملکرد بالا (محصولات انویدیا با پشتیبانی از CUDA معمولاً برای فعالیتهای هوش مصنوعی مناسب هستند.)
- حداقل 8 یا 16 گیگابایت رم
- SSD با حداقل 50 گیگابایت حافظه در دسترس (برای مدیریت مجموعه دادههای بزرگتر به حافظه بیشتری نیاز دارید.)
نگرانیهای حریم خصوصی و امنیتی پیرامون هوش مصنوعی دیپسیک
این مدل هوش مصنوعی توسط استارتاپ چینی DeepSeek توسعهیافته و طبیعتاً سرورهای آن در کشور چین واقع شدهاند. پس از رشد خیرهکننده کاربران دیپسیک، نگرانیها در مورد امنیت دادههای کاربران و محل ذخیرهسازی این دادهها نیز افزایش یافته است. نشریه نیویورک پست بهتازگی گزارش داده که ذخیرهکردن دادههای کاربران آمریکایی دیپسیک روی سرورهای واقع در چین موجی از نگرانی را در میان کارشناسان امنیت سایبری برانگیخته است.
DeepSeek در سیاستهای خود به وضوح اعلام کرده که «اطلاعات شخصی کاربران در سرورهای امن واقع در چین ذخیره میشوند.»
سوالات متداول
دیپسیک استارتاپی چینی است که اخیراً توجه زیادی را جلب کرده است؛ مدلهای هوش مصنوعی این شرکت رایگان هستند و میتوانند با مدلهای قدرتمند OpenAI رقابت کنند.
برای استفاده از نسخه وب هوش مصنوعی دیپسیک میتوانید به وبسایت این شرکت مراجعه کنید، همچنین اپلیکیشن این هوش مصنوعی در پلی استور و اپ استور منتشر شده است.
مه 2023 «لیانگ ونفنگ» (Liang Wenfeng) 40 ساله استارتاپ DeepSeek را تأسیس کرد. او مستقل فعالیت میکند.
از هوش مصنوعی DeepSeek استفاده کنیم؟
در این مطلب به طور کامل و جامع هوش مصنوعی DeepSeek و تمام جوانب و ویژگیهای آن را به شما معرفی کردیم. برای پاسخ به این سوال که آیا باید از دیپ سیک استفاده کنیم باید تمام جوانب آن را در نظر بگیریم. در حالی که این مدل هوش مصنوعی بهصورت کاملاً رایگان در دسترس قرار دارد و همچنین در زمینههایی مانند کدنویسی و ریاضیات عملکرد قابل قبولی دارد، اما نگرانیهای امنیتی نیز درباره آن وجود دارد. علاوهبراین در حوزه نوشتن یا خلاصهکردن نیز مانند تمام مدلها نیاز است تا خروجی آن را بررسی کرد.