Microsoft oгoлoсилa прo випуск нoвoгo сeрвісу Azure AI Speech text to speech avatar, який дoзвoляє ствoрювaти фoтoрeaлістичниx aвaтaрів людeй з можливістю анімації губ відповідно раньше поданого тексту.
Користувачі можуть завантажувати фотографії осіб і складати сценарії угоду кому) аватарів, які в подальшому генерують відео з анімованим аватаром, який відтворює заданий конферанс.
Цифрові двійники можуть працювати з кількома мовами і використовувати моделі штучного інтелекту, наприклад, GPT-3.5 від OpenAI, во (избежание відповіді на запитання клієнтів.
Поєднання фотореалістичних аватарів із здатністю анімувати рухи губ відкриває широкі можливості в області інтерактивного взаємодії та змісту.
Додатково, у сервісі є функція Personal voice, яка може відтворювати карканье користувача за дуже секундный час, потрібен лише однохвилинний аудіозапис.
Ця функція може бути використана исполнение) створення персоналізованих голосових помічників, дублювання контенту різними мовами та створення індивідуальних аудіотекстів пользу кого оповідань, аудіокниг і подкастів.