گوگل مدل‌های هوش مصنوعی Imagen 3 و Veo خود را عرضه کرد

حدود 6 ماه پس از رونمایی رسمی، پلتفرم Vertex AI گوگل بالاخره آمد میزبان دو مدل جدید هوش مصنوعی این شرکت، یعنی تصویر 3 و Veo این دو مدل می توانند به تنهایی کار کنند، اما می توانند با هم استفاده شوند. اولی می تواند یک تصویر را بر اساس یک دستور متنی ایجاد کند، در حالی که دومی یک تصویر و پیام متنی را می گیرد و آن را متحرک می کند.

مدل های Google Imagen 3 و Veo AI

وقتی صحبت از تسلط بر هوش مصنوعی مولد به میان می آید، شرکت ها فعالانه به دنبال تثبیت خود هستند یا با کاوش مداوم قابلیت های جدید، پیشتاز باقی می مانند. OpenAI به طور تصاعدی رشد کرده است و همچنان از طریق فناوری پیشرفته خود پیشرفت ها و نوآوری هایی را در مدل های خود به ارمغان می آورد. با این حال، این شرکت به کاربران خود قول یک مدل هوشمند برای ساخت ویدیو را می دهد. سورا، که هنوز منتشر نشده است. از سوی دیگر، گوگل با راه اندازی Veo در پیش نمایش خصوصی، ایجاد محتوا را متحول کرد.

مدل های Google Imagen 3 و Veo AI

در حالی که OpenAI برای اولین بار از مدل ویدیویی هوش مصنوعی Sora خود در ماه فوریه رونمایی کرد و توانایی خود را در ایجاد ویدیوهای 60 ثانیه ای از طریق پیام های متنی نشان داد، گوگل اکنون از رقیب خود پیروی می کند. مشاهده کنید، در پیش نمایش ویژه پیشتاز است.

گوگل از مدل ویدئویی هوش مصنوعی خود حدود سه ماه پس از نمایش مدل متن به ویدئوی سورا توسط OpenAI رونمایی کرد. گوگل در طول کنفرانس توسعه دهندگان I/O خود ادعا کرد که Veo دارای قابلیت های گسترده ای است که می تواند به تولید ویدیوهای با کیفیت در بیش از یک دقیقه کمک کند و کاربران می توانند از انواع روش های بصری و سینمایی استفاده کنند.

در حالی که اطلاعات کمی در مورد اینکه آیا مدت زمان تولید ویدیو همان چیزی است که قبلاً در ویدیوها نشان داده شده است، کم است، ویدیوهای جدید واقعی مقدار زیادی از هوش مصنوعی را نشان می دهند. ویدیوها کیفیت بالایی دارند و تشخیص آنها از فیلم واقعی بسیار دشوار است مگر اینکه کاربران به دقت نگاه کنند.

بخوانید: هوش مصنوعی به برنامه گالری سامسونگ در آپدیت OneUI 7 راه می‌یابد

مدل تصویر 3 گوگل، توسعه دهنده هوش مصنوعی متن به تصویر، به زودی در دسترس مشتریان Google Cloud قرار خواهد گرفت و هفته آینده به طور گسترده در دسترس خواهد بود. ویژگی‌های جدیدی نیز برای کاربرانی که در لیست سفید قرار گرفته‌اند در دسترس خواهد بود و به آنها اجازه می‌دهد تا به سرعت تصاویر را سفارشی و ویرایش کنند یا حتی لوگوها یا عناصر تصاویر ایجاد شده را تغییر دهند.

گوگل همچنان بر این موضوع تاکید دارد مدل های Veo و Imagen 3 هر دو دارای محافظ های داخلی هستند که به جلوگیری از نقض و همچنین مسدود کردن هرگونه محتوای نامناسب کمک می کند. با این حال، با آزمایش مشخص شد که دور زدن آن غیرممکن نیست. گفته می شود محتوای تولید شده توسط این مدل ها حاوی یک واترمارک دیجیتال نامرئی است که با کمک فناوری SynthID DeepMind ایجاد شده است، که مشخص می کند آیا محتوا واقعاً توسط هوش مصنوعی تولید شده است یا خیر.

با راه اندازی Veo، مدل هوش مصنوعی ویدیویی گوگل، فشار بر OpenAI برای ارائه مدل Sora که مدت ها در انتظارش بود، افزایش یافته است، که تا پایان سال 2024 وعده داده بود.

نظر شما در مورد مدل های جدید هوش مصنوعی گوگل چیست؟

منبع: https://toranji.ir/2024/12/05/%DA%AF%D9%88%DA%AF%D9%84-%D9%85%D8%AF%D9%84%D9%87%D8%A7%DB%8C-%D9%87%D9%88%D8%B4-%D9%85%D8%B5%D9%86%D9%88%D8%B9%DB%8C-imagen-3-%D9%88-veo-%D8%B1%D8%A7-%D8%B9%D8%B1%D8%B6%D9%87-%DA%A9%D8%B1/

تحریریه ICTNN شبکه خبری

Tags: گوشی موبایل