رونمایی از هوش مصنوعی جدید معروف به موتور صدا
مدل هوش مصنوعی جدید OpenAI میتواند صدای افراد را از روی فایلی ۱۵ ثانیهای شبیهسازی کند.
به گزارش پارس نیوز ، پیشنمایش مدل هوش مصنوعی تبدیل متن به صوت موسومبه موتور صدا (Voice Engine) را رونمایی کرده است. این مدل با گرفتن نمونهی ۱۵ ثانیهای از صدای یک شخص، میتواند هر متنی را با همان صدا بخواند.
هریس میگوید: «ما نمونهی کوچکی از صوت و متن را میگیریم و صدای شبیهسازیشده را تولید میکنیم که با صدای اصلی کاملاً همخوانی دارد. صدای اصلی پس از اتمام درخواست حذف میشود. چنانچه متن دادهشده دارای قسمتهای سؤالی، تعجبی یا مانند آن باشد، تن صدای تولیدشده نیز متناسب با آن تغییر خواهد کرد.»
توسعهی مدل هوش مصنوعی ویس انجین از اواخر سال ۲۰۲۲ آغاز شد و از آن برای تولید صداهای پیشفرض موجود در API تبدیل متن به گفتار و همچنین ابزار مکالمهی صوتی ChatGPT استفاده شده است. OpenAI در همان زمان، رویکرد محتاطانهای نسبتبه انتشار گستردهتر این فناوری بهدلیل احتمال سوءاستفاده از صدای مصنوعی داشت.
API تبدیل متن به گفتار OpenAI از اوایل سپتامبر ۲۰۲۳ (شهریور و مهر ۱۴۰۲) منتشر شد و اسپاتیفای از آن برای دوبلهی پادکستهای مشهوری مانند لکس فریدمن به زبانهای مختلف استفاده کرده است. ابزار هوش مصنوعی جدید OpenAI میتواند تهدیدی برای آیندهی شغلی گویندگان و صدا پیشگان باشد. احتمالاً بهزودی از این افراد خواسته میشود که حق استفاده از صدای خود را برای تولید نسخههای ساختگی اعطا کنند و بهتدریج بهفکر جایگزینشدن با هوش مصنوعی باشند.
منبع: ایسنا
ارسال نظر