در یک تجربه ، مدل OPP O3 پایین تر از آن چیزی بود که شرکت در ابتدا نشان داد.
به گفته اینا ، تفاوت بین نتایج یک تجربه جدید با اطلاعات اولیه در مورد مدل هوش مصنوعی O3 (O3 “Opnai (OpenAi) سؤالاتی در مورد شفافیت و تکنیک های روشهای آزمون هوش مصنوعی ایجاد می کند.
به نقل از تک کرانچا ، هنگامی که O3 در ماه دسامبر O3 رونمایی کرد ، وی گفت که این مدل می تواند به بیش از یک چهارم سؤالات “Frontiermath” پاسخ دهد ، مجموعه ای دشوار از مشکلات ریاضی. این امتیاز رقابت را از بین برده است. از آنجا که بهترین مدل زیر فقط می تواند به درستی به 2 ٪ Frontiermath پاسخ دهد.
مارک چن ، رئیس مدیر تحقیقات Open -ai گفت: “امروز ، همه مدل ها کمتر از دو درصد امتیاز در Frontiermath دارند.” ما می بینیم که با O3 می توانیم بیش از 2 ٪ را علامت گذاری کنیم.
همانطور که اشاره شد ، این احتمالاً نمره بالاتری بود که توسط یک نسخه از O3 با محاسبات بیشتر از مدل Openia هفته گذشته بدست آمد.
موسسه تحقیقاتی Frontiermath ، Epoch AI ، نتایج آزمایش مستقل خود را در روز جمعه منتشر کرد. O3 حدود 2 ٪ دریافت می کند که بسیار پایین تر از بالاترین ادعا توسط Openia است.
این بدان معنا نیست که آزاد دروغ گفته است. نتایج تجربی منتشر شده توسط این شرکت در ماه دسامبر ، نت کمتری را نشان می دهد که مربوط به پارتیشن مشاهده شده در آزمون IA از زمان است. علاوه بر این ، Epoch خاطرنشان کرد که پارامترهای آزمایش آن احتمالاً با OpenIA متفاوت است و از نسخه بروزرسانی Frontiermath برای ارزیابی های خود استفاده کرده است.
Epoch نوشته است: تفاوت بین نتایج ما و Open II می تواند به دلیل ارزیابی شرکت با چارچوب داخلی قوی تر و استفاده از آزمایشات بیشتر باشد یا به دلیل این نتایج در زیر مجموعه دیگری از Frontiermath بدست می آید.
پایان پیام
تیم تحرریه شبکه خبری فناوری اطلاعات و ارتباطات