دیپ سیک مدل جدید هوش مصنوعی خود را معرفی کرده است که به نظر می رسد یکی از قدرتمندترین مدل های هوش مصنوعی باز تا به امروز باشد.
به گزارش ICTNN، DeepSeek V3، یک مدل هوش مصنوعی جدید که توسط DeepSeek توسعه یافته است، به توسعه دهندگان این امکان را می دهد که آن را برای اکثر برنامه ها، از جمله برنامه های تجاری، دانلود و تغییر دهند.
به گزارش TechCrunch، DeepSik V3 میتواند طیف گستردهای از وظایف مبتنی بر متن مانند کدنویسی، ترجمه، و نوشتن مقالات و ایمیلهای درخواستی را انجام دهد.
بر اساس آزمایش داخلی DeepSik، DeepSik V3 از مدلهای قابل دانلود «باز» و مدلهای «بسته» هوش مصنوعی که فقط از طریق API قابل دسترسی هستند، بهتر عمل میکند. در زیرمجموعهای از مسابقات کدنویسی که بر روی پلتفرم «Codeforces» میزبانی شد، Dipsic V3 توانست از مدلهای دیگری مانند «Llama 3.1 405B» از شرکت «متا»، «GPT-4o» از شرکت «OpenAI» و Qwen 2.5 اینچی 72B» از آثار «علی بابا».
DeepSik گفت که DeepSik V3 بر روی مجموعه داده ای از 14.8 تریلیون توکن آموزش داده شده است. در علم داده، توکن ها برای نمایش بیت های داده خام استفاده می شوند. یک میلیون توکن تقریباً 750000 کلمه است.
اگرچه Dipsic V3 کاربردی ترین مدل نیست، اما از برخی جهات یک موفقیت محسوب می شود. Dipsik توانست این مدل را با استفاده از مرکز داده Nvidia H800 GPU در حدود دو ماه آموزش دهد. این شرکت اعلام کرد که فقط 5.5 میلیون دلار برای آموزش DeepSeq V3 هزینه کرده است که کسری از هزینه توسعه مدل هایی مانند GPT-4 است.
ICTNN
تیم تحرریه شبکه خبری فناوری اطلاعات و ارتباطات