هوش مصنوعی الون لابز ، که متن را به گفتار تبدیل می کند ، به کنترل این عبارت اجازه می دهد تا صدا را تولید کند و به جای یک خواندن ساده ، عملکرد واقعی را امکان پذیر می کند.
به گفته اینا ، Elevenlabs ، بر اساس یک ساختار جدید ، رئالیسم و کنترل بی سابقه ای را برای تولید یک کلمه به ارمغان می آورد. این نرم افزار می تواند لحن را در وسط جمله تغییر دهد ، بین شخصیت ها یکپارچه شود و به علائمی مانند زمزمه ، خنده و آه پاسخ دهد. همه اینها بدون اختلال در گفتار انجام می شود.
نقل قول های دیجیتالی ترمینال ، این نسخه از هوش مصنوعی الون لابز نسخه آلفا است. این نسخه به مهندسی سریعتر از مدل های قبلی نیاز دارد ، اما انتشار آن تغییر عمده ای در بیان ، ظرافت و واقع گرایی انسان ارائه می دهد. این نسخه جدید باعث افزایش مراقبت از زبانهای مختلف 1 به 2 زبان شده است. با تنظیم دقیق تر ، قابلیت اطمینان و کنترل پذیری نیز افزایش می یابد.
ظرفیت های مهم الون وی به شرح زیر است.
1. پوشش بیش از 2 زبان ؛ زبانهای تحت پوشش الون وی از 5 زبان به بیش از 5 زبان افزایش یافته است و پوشش جمعیت جهان از 2 ٪ به 5 ٪ افزایش یافته است.
2. حالت مکالمه ؛ الون وی با وقایع طبیعی ، تغییرات تن و جریان عاطفی بین چندین بلندگو مدیریت می کند.
1. برچسب های صوتی ؛ الوان وی 4 ارائه خود را با برچسب هایی مانند زمزمه ، عصبانیت ، خنده یا صدای ظالمانه راهنمایی می کند و امکان کنترل جزئیات را فراهم می کند.
1. پشتیبانی از پخش های زنده ؛ ویژگی های پشتیبانی توزیع زنده در زمان مراکز تماس و مکالمات ارائه می شود.
1. API عمومی برای الون وی (آلفا) به زودی منتشر می شود. کاربران می توانند برای دسترسی زودهنگام با سرویس فروش تماس بگیرند.
Elvan WEI برای سازندگان ، توسعه دهندگان و شرکت هایی که محتوا تولید می کنند ، از جمله داستان ها ، کتاب های صوتی ، مکالمات شخصیت و تعامل رسانه ای طراحی شده است. این مدل از آزمون قدردانی می کند و نظرات آگاهانه از متن را ارائه می دهد.
برای استفاده فوری و کم ، مانند اطلاعات گفتگوی مصنوعی ، توصیه می شود کاربران در حال حاضر با مدل های توربو و فلش (فلش “(فلش) کار می کنند. این نسخه در زمان الون وی تهیه شده است.
Elun Wei کنترل عبارت را برای تولید صدا می دهد و به شما امکان می دهد به جای یک خواندن ساده ، عملکرد واقعی را انجام دهید. این نسخه می تواند احساسات را تغییر داده ، بیان را تنظیم کرده و یک حرکت سیال بین شخصیت های یک نسل ایجاد کند. برای اولین بار ، گفتمان هوش مصنوعی می تواند ریتم و ظرافت مکالمه انسانی را در بیش از 5 زبان دنبال کند.
ماتی استانیسوزسکی ، بنیانگذار الوان لابز و مدیرعامل این شرکت ، گفت: “الوان وی رسمی ترین مدل تبدیل متن تا به امروز است و کنترل کاملی بر احساسات ، نحوه بیان و بیان علائم غیر کلامی دارد.” کاربران می توانند با استفاده از برچسب های صوتی ، زمزمه ، خنده ، گویش یا حتی آهنگ را تشویق کنند. آنها می توانند سرعت ، احساسات و سبک را کنترل کنند تا با هر نوع نوشتن مطابقت داشته باشند. با مأموریت جهانی ما ، ما خوشحالیم که این مدل را با پشتیبانی بیش از 5 زبان گسترش دهیم. این نسخه نتیجه چشم انداز من و مدیریت من از همکارم پیوتر و گروه تحقیقاتی بزرگ است که او تشکیل داده بود.
ایجاد یک محصول خوب دشوار است ، اما ایجاد یک مدل کاملاً جدید تقریباً غیرممکن است. در الون لابز ، همه ما احساس خوشبختی می کنیم که جادویی را که این تیم به زندگی می بخشد ، می بینیم و خوشحالیم که دوباره مرزها را حرکت می دهیم.
الون وی (آلفا) در حال حاضر در https://elevenlabs.io در دسترس است.
پایان پیام
تیم تحرریه شبکه خبری فناوری اطلاعات و ارتباطات