شرکت چینی دیبره یک نسخه اخیر 3.1 از مدل زبان عالی برای هوش مصنوعی شما منتشر شده مدل با 2 میلیارد معلم وت زمینه او اکنون می تواند ورودی ها را به اندازه 1 تا 2 صفحه پردازش کند. این تبلیغات به طور خاص برای تولید محتوای طولانی ، تجزیه و تحلیل اسناد فنی پیچیده و مکالمات طولانی مدت طولانی مدت طراحی شده اند. این خبر فقط از طریق مجموعه WeChat شرکت منتشر شد و هیچ اطلاعات رسمی در مورد کانال های رسانه ای Dip -sick ارائه نشده است.
Dibsic Deepsic 3.1 مدل
نسخه جدیدی از معماری مخلوط کردن (MEE) فقط استفاده شده 2 میلیارد معلم برای هر نماد فعال آنها می شوند. این رویکرد باعث افزایش بهره وری و کاهش مصرف منابع می شود. Deepseek v3.1 انواع قالب های محاسباتی مانند BF16 ، FP8 و F32 پشتیبانی از این امکان استفاده در محیط های مختلف را فراهم می کند. این مدل از طریق API یا در راه مدارس در چهره پذیرای انستیتوی فناوری ماساچوست این به توسعه دهندگان ارائه شد.
عملکرد در استانداردها
طبقه بندی 4.3 ٪ در آزمون برنامه نویسی دستیار این بالاتر است کلود اوبوس 4 این یکی از قوی ترین مدل های منبع باز در زمینه برنامه نویسی است.
وظایف بهبود یافته ریاضیات و منطقبشر
من به کاربران اطلاع می دهم پیشرفت چشمگیر در تفکر در مورد مدل R1-0528 او متوجه نشد.
استراتژی تغییر: پایان فرم R1
تمام نکات مربوط به مدل R1 از رابط چت خود و به جای ساختار یک مخلوط بلند شوید نظم پا این مرحله نشان دهنده تغییر رویکرد شرکت است مدل اصلی یکپارچه او است

Dibsic Deepsic 3.1 مدل
چالش های توسعه و تأخیر در R2
مدل بعدی برای Deepseek انتظار می رفت R2 روی قابلیت های تفکر تمرکز کنید. اما مشکلات فنی در استفاده تراشه های شبانه روزی هواوی تأخیر باعث توسعه می شود.
دولت چین برای استفاده از وسایل داخلی برای کاهش وابستگی به نفتیدیا تشویق
علی رغم پشتیبانی مهندسان و عملکرد هواوی برخاستن به دلیل سازگاری و مشکلات کارآیی در آموزش ضعیف بود.
سرانجام ، dibsic برای آموزش در واحدهای پردازش گرافیکی NVIDIA H800 بازگشت و از صعود به تنهایی در استنباط (استنباط) کاربر ؛ این رویکرد پیچیده تر بود.
تأخیر توضیحات داده نیز روند توسعه را کند می کند.
براساس این گزارش ها ، بنیانگذار Dempsic Liang Winfong از این روند طولانی و ناکامی ناراضی بود.
رقابت با بازیگران عالی
در حالی که Deepseek مشکلات زیرساختی را کاهش می دهد ، رقبا مانند رقبا هستند Alibaba Qwen 3 من موفق شدم الگوریتم های مشابه را با عملکرد بالاتر وارد بازار شوید. این امر ضعف سیستم محیط زیست دستگاه های داخلی در چین را ایجاد کرده است.
با این حال ، پیشنهاد R2 کاملاً رد نشده است ، اما در حال حاضر Deepseek 3.1 پیشگام اصلی شرکت این کارها از جمله تفکر و تولید محتوای عمومی در یک قاب ترکیبی را فراهم می کند. نسخه این نسخه نه تنها توانایی Deepseek را در زمینه مدل های زبان منبع باز تقویت می کند ، بلکه منعکس کننده چالش های ژئوپلیتیکی و فنی در مسیر خودآگاهی در چین در زمینه هوش مصنوعی است.
سخنرانی نهایی
Deepsek V3.1 گامی مهم در جهت رقابت چین با غول های جهانی هوش مصنوعی است. افزایش انقباض ، عملکرد بهتر در برنامه نویسی و معماری یکپارچه ، آن را به یکی از پیشرفته ترین منابع منابع تبدیل می کند. با این حال ، تأخیر در R2 و محدودیت دستگاه های داخلی یک مانع اساسی برای شرکت است. آینده توضیح خواهد داد که آیا Deepseek می تواند بر این چالش ها غلبه کند و موقعیت خود را در رقابت جهانی متحد کند.
نظر شما در مورد هوش مصنوعی Deepseek 3.1 چیست؟
برای دوستان خود ارسال کنید
منبع: https://toranji.ir/2025/08/20/%D9%85%D8%AF%D9%84-%D9%87%D9%88%D8%B4-%D9%85%D8%B5%D9%86%D9%88%D8%B9%DB%8C-deepseek-3-1-%D8%B9%D8%B1%D8%B6%D9%87-%D8%B4%D8%AF-%D8%AA%D8%BA%DB%8C%DB%8C%D8%B1%D8%A7%D8%AA-%D8%AC%D8%AF%DB%8C%D8%AF/
تحریریه ICTNN شبکه خبری