شبه به تازگی ، اولین مدل مهم زبانی (LLM) هوش مصنوعی آن نام آن نامیده می شود یادداشت رونمایی این مدل 2 میلیارد معلماولین مدل منابع این شرکت در زمینه قابلیت های تفکر قادر به انجام کارهای پیچیده در تولید و تولید ورزش است. عملکرد MIMO شبیه به مدلهای بزرگتر مانند O1-Mini Openai و Qwen-32B-Preview Alibaba است.
یادداشت: اولین مدل هوش مصنوعی در شیائومی
با این حال ، مؤثرترین مدل های تفکر بزرگترین ساختار مانند مدل ها است 2 میلیارد معلم آنها استفاده می کنند ، چنین ویژگی هایی را به شکل یک مدل کوچک ارائه می دهند که یک چالش را نشان می دهد. شیائومی معتقد است که توانایی میمو در حل مشکلات منطقی آنها را محکوم می کند استراتژی های بهبود یافته قبل و بعد از آموزش او است این می تواند آن را به یک انتخاب مناسب برای استفاده در دستگاه های هوشمند و منابع محدود تبدیل کند.
روند آموزش اولیه
منطق منطقی MIMO به یک فرایند آموزش بهبود یافته بستگی دارد. تیم توسعه شیائومی خط داده هاوت ابزارهای استخراج متن را بهبود می بخشد وت ظروف چندگانه برای افزایش شدت الگوهای تفکر کاربر
در این فرایند ، مجموعه ای از کاهش 2 میلیارد نماد نظم و انضباط این جمع آوری و یک استراتژی سه مرحله ای که برای داده های مختلط استفاده می شود. این مدل در سه مرحله پیشرو بر روی نماد 3 تریلیون آموزش داده می شود. همچنین شیائومی از ”پیش بینی چندگانه(پیش بینی چندگانه) از یک هدف آموزشی برای افزایش کارایی و کاهش زمان درمان استفاده می کند.

اولین مدل دانشمندان شیائومی
روند آموزش متوسطه
در مرحله تمرین بعدی ، تیم شیائومی از یادگیری افزوده (یادگیری تقویت) با استفاده از ریاضیات و برنامه نویسی از ریاضیات و برنامه نویسی استفاده کنید. این مشکلات از نظر صحت و مشکل در استفاده از سیستم های معمولی تأیید شده است.
برای غلبه بر مشکل “پاداش نادر” در کارهای پیچیده ، این شرکت از سیستم پاداش که توسط آزمون هدایت می شود ، و همچنین “نمونه های مجدد از داده های آسان” برای افزایش حفظ مشکلات یادگیری تقویت شده تر استفاده می کند.
برای تسریع در آموزش و تأیید سلامت ، شیائومی موتور بی نظیری را فراهم کرد که باعث کاهش زمان عدم فعالیت GPU می شود. این سیستم سرعت آموزش را ایجاد کرده است 1.5 بار و سرعت تأیید سلامتی 1.5 بار برای افزایش علاوه بر این ، موتور از “انتظارات چند کلمه” در VLM پشتیبانی می کند و ثبات سیستم یادگیری تقویت را بهبود می بخشد.
مدل های MIMO
سری mimo-7b این شامل چهار نسخه مختلف است:
- MIMO-7B-base: مدلی بر اساس ظرفیت بالای تفکر
- MIMO-7B-RL-ZERO: مدل یادگیری افزوده از مدل اساسی
- MIMO-7B-SFT: تحت نظارت
- MIMO-7B-RL: مدل یادگیری افزوده SFT با عملکرد برجسته ای که می تواند با O1-Mini Openai مقایسه شود
عملکرد در استانداردهای استاندارد
مدل MIMO-7B-RL با توجه به معیارهای مختلف خوب بود:
ریاضیات:
- ریاضی -500: دقت 4.3 ٪ (یک اجرا)
- آیمه 2024: دقت 4.3 ٪ (میانگین اجرای 1)
- آیمه 2025: دقت 4.3 ٪ (میانگین اجرای 1)
برنامه نویسی:
- livecooouoobench v5: دقت 4.3 ٪ (میانگین اجرای 1)
- livecooooobench v6: دقت 4.3 ٪ (میانگین اجرای 1)
عمومی:
- الماس GPQA: دقت 4.3 ٪ (میانگین اجرای 1)
- سوپر GPQA: دقت 2.3 ٪ (یک اجرا)
- قطره (3 شات F1): دقت 4.3 ٪
- MMLU-Pro (دقیقاً همسان): دقت 4.3 ٪
- if-eval (مربی سخت): دقت 4.3 ٪ (میانگین اجرای 1)
در دسترس بودن
تمام مدلهای سری MIMO-7B به عنوان منبع و اساسنامه منتشر شده اند گلدوزی در دسترس عموم است. گزارش های فنی کامل و نکات اجرایی معمولی به همراه جزئیات آموزش و ارزیابی منتشر می شود.
سخنرانی نهایی
MIMO معرفی اولین مدل از منبع اطلاعات شیائومی گسترش قابلیت های هوش مصنوعی بیشتر در مدل های کوچکتر و قابل اجرا در دستگاه های منابع محدود است. این دستاورد تعهد شیائومی را به تحقیقات هوش مصنوعی نشان می دهد و می تواند نقطه شروع همکاری بیشتر با جامعه توسعه دهنده باشد.
نظر شما در مورد اولین منبع شیائومی مدل هوش مصنوعی چیست؟
برای دوستان خود ارسال کنید
منبع: https://toranji.ir/2025/04/30/%D8%B4%DB%8C%D8%A7%D8%A6%D9%88%D9%85%DB%8C-%D8%A7%D9%88%D9%84%DB%8C%D9%86-%D9%85%D8%AF%D9%84-%D9%87%D9%88%D8%B4-%D9%85%D8%B5%D9%86%D9%88%D8%B9%DB%8C-%D8%A7%D8%B3%D8%AA%D8%AF%D9%84%D8%A7%D9%84%DB%8C/
تحریریه ICTNN شبکه خبری