حدود 6 ماه پس از رونمایی رسمی، پلتفرم Vertex AI گوگل بالاخره آمد میزبان دو مدل جدید هوش مصنوعی این شرکت، یعنی تصویر 3 و Veo این دو مدل می توانند به تنهایی کار کنند، اما می توانند با هم استفاده شوند. اولی می تواند یک تصویر را بر اساس یک دستور متنی ایجاد کند، در حالی که دومی یک تصویر و پیام متنی را می گیرد و آن را متحرک می کند.
مدل های Google Imagen 3 و Veo AI
وقتی صحبت از تسلط بر هوش مصنوعی مولد به میان می آید، شرکت ها فعالانه به دنبال تثبیت خود هستند یا با کاوش مداوم قابلیت های جدید، پیشتاز باقی می مانند. OpenAI به طور تصاعدی رشد کرده است و همچنان از طریق فناوری پیشرفته خود پیشرفت ها و نوآوری هایی را در مدل های خود به ارمغان می آورد. با این حال، این شرکت به کاربران خود قول یک مدل هوشمند برای ساخت ویدیو را می دهد. سورا، که هنوز منتشر نشده است. از سوی دیگر، گوگل با راه اندازی Veo در پیش نمایش خصوصی، ایجاد محتوا را متحول کرد.
در حالی که OpenAI برای اولین بار از مدل ویدیویی هوش مصنوعی Sora خود در ماه فوریه رونمایی کرد و توانایی خود را در ایجاد ویدیوهای 60 ثانیه ای از طریق پیام های متنی نشان داد، گوگل اکنون از رقیب خود پیروی می کند. مشاهده کنید، در پیش نمایش ویژه پیشتاز است.
گوگل از مدل ویدئویی هوش مصنوعی خود حدود سه ماه پس از نمایش مدل متن به ویدئوی سورا توسط OpenAI رونمایی کرد. گوگل در طول کنفرانس توسعه دهندگان I/O خود ادعا کرد که Veo دارای قابلیت های گسترده ای است که می تواند به تولید ویدیوهای با کیفیت در بیش از یک دقیقه کمک کند و کاربران می توانند از انواع روش های بصری و سینمایی استفاده کنند.
در حالی که اطلاعات کمی در مورد اینکه آیا مدت زمان تولید ویدیو همان چیزی است که قبلاً در ویدیوها نشان داده شده است، کم است، ویدیوهای جدید واقعی مقدار زیادی از هوش مصنوعی را نشان می دهند. ویدیوها کیفیت بالایی دارند و تشخیص آنها از فیلم واقعی بسیار دشوار است مگر اینکه کاربران به دقت نگاه کنند.
مدل تصویر 3 گوگل، توسعه دهنده هوش مصنوعی متن به تصویر، به زودی در دسترس مشتریان Google Cloud قرار خواهد گرفت و هفته آینده به طور گسترده در دسترس خواهد بود. ویژگیهای جدیدی نیز برای کاربرانی که در لیست سفید قرار گرفتهاند در دسترس خواهد بود و به آنها اجازه میدهد تا به سرعت تصاویر را سفارشی و ویرایش کنند یا حتی لوگوها یا عناصر تصاویر ایجاد شده را تغییر دهند.
گوگل همچنان بر این موضوع تاکید دارد مدل های Veo و Imagen 3 هر دو دارای محافظ های داخلی هستند که به جلوگیری از نقض و همچنین مسدود کردن هرگونه محتوای نامناسب کمک می کند. با این حال، با آزمایش مشخص شد که دور زدن آن غیرممکن نیست. گفته می شود محتوای تولید شده توسط این مدل ها حاوی یک واترمارک دیجیتال نامرئی است که با کمک فناوری SynthID DeepMind ایجاد شده است، که مشخص می کند آیا محتوا واقعاً توسط هوش مصنوعی تولید شده است یا خیر.
با راه اندازی Veo، مدل هوش مصنوعی ویدیویی گوگل، فشار بر OpenAI برای ارائه مدل Sora که مدت ها در انتظارش بود، افزایش یافته است، که تا پایان سال 2024 وعده داده بود.
نظر شما در مورد مدل های جدید هوش مصنوعی گوگل چیست؟
برای دوستان خود ارسال کنید
منبع: https://toranji.ir/2024/12/05/%DA%AF%D9%88%DA%AF%D9%84-%D9%85%D8%AF%D9%84%D9%87%D8%A7%DB%8C-%D9%87%D9%88%D8%B4-%D9%85%D8%B5%D9%86%D9%88%D8%B9%DB%8C-imagen-3-%D9%88-veo-%D8%B1%D8%A7-%D8%B9%D8%B1%D8%B6%D9%87-%DA%A9%D8%B1/
تحریریه ICTNN شبکه خبری