یکی از قدرتمندترین مدل‌های «هوش مصنوعی باز» فاش شد

دیپ سیک مدل جدید هوش مصنوعی خود را معرفی کرده است که به نظر می رسد یکی از قدرتمندترین مدل های هوش مصنوعی باز تا به امروز باشد.

به گزارش ICTNN، DeepSeek V3، یک مدل هوش مصنوعی جدید که توسط DeepSeek توسعه یافته است، به توسعه دهندگان این امکان را می دهد که آن را برای اکثر برنامه ها، از جمله برنامه های تجاری، دانلود و تغییر دهند.

به گزارش TechCrunch، DeepSik V3 می‌تواند طیف گسترده‌ای از وظایف مبتنی بر متن مانند کدنویسی، ترجمه، و نوشتن مقالات و ایمیل‌های درخواستی را انجام دهد.

بر اساس آزمایش داخلی DeepSik، DeepSik V3 از مدل‌های قابل دانلود «باز» و مدل‌های «بسته» هوش مصنوعی که فقط از طریق API قابل دسترسی هستند، بهتر عمل می‌کند. در زیرمجموعه‌ای از مسابقات کدنویسی که بر روی پلتفرم «Codeforces» میزبانی شد، Dipsic V3 توانست از مدل‌های دیگری مانند «Llama 3.1 405B» از شرکت «متا»، «GPT-4o» از شرکت «OpenAI» و Qwen 2.5 اینچی 72B» از آثار «علی بابا».

DeepSik گفت که DeepSik V3 بر روی مجموعه داده ای از 14.8 تریلیون توکن آموزش داده شده است. در علم داده، توکن ها برای نمایش بیت های داده خام استفاده می شوند. یک میلیون توکن تقریباً 750000 کلمه است.

اگرچه Dipsic V3 کاربردی ترین مدل نیست، اما از برخی جهات یک موفقیت محسوب می شود. Dipsik توانست این مدل را با استفاده از مرکز داده Nvidia H800 GPU در حدود دو ماه آموزش دهد. این شرکت اعلام کرد که فقط 5.5 میلیون دلار برای آموزش DeepSeq V3 هزینه کرده است که کسری از هزینه توسعه مدل هایی مانند GPT-4 است.

ICTNN

تیم تحرریه شبکه خبری فناوری اطلاعات و ارتباطات

تحریریه ICTNN شبکه خبری

بخوانید: استقبال بسیار خوب از کسب و کارهای کوچک از این تصویر بی ستاره