Приложение Т—Ж
В нем читать удобнее
7 простых и бес­платных сервисов для создания ИИ⁠-⁠аватара
Нейросети
0
Изображение в коллаже — Vac1 / Shutterstock / FOTODOM

7 простых и бес­платных сервисов для создания ИИ⁠-⁠аватара

Рассказываем, как сгенерировать реалистичные видео с говорящими людьми
Обсудить
Аватар автора

Владимир Лещев

кое-что знает о технологиях

Страница автора

ИИ-аватар — это цифровой персонаж, созданный с помощью нейросетей.

Он может повторять внешность реального человека или быть сгенерированным с нуля. Такие аватары выглядят и говорят максимально естественно — например, могут передавать мимику, интонации и особенности речи.

ИИ-аватары используют для самых разных задач — от создания роликов для соцсетей до записи обучающих видео и презентаций для корпоративных коммуникаций. Такой формат помогает быстрее производить контент, сокращать расходы на съемку и производство, а также легко адаптировать материалы под разные языки и аудитории.

Расскажу про сервисы, которые позволяют бесплатно сгенерировать ИИ-аватар.

На основе чего создавать ИИ-аватар

Бесплатный лимит: при регистрации дают 66 кредитов — хватит примерно на 15—20 секунд видео в стандартном разрешении
Стоимость: от 6,6 $⁣ (485 ₽)  в месяц — минимальной подписки хватит на 2,5—3 минуты видео в разрешении 720p
Качество: ⭐ ⭐ ⭐
Сложность освоения: 📈📈

В сервисе можно не только загрузить собственное фото, но и сгенерировать персонажа с нуля или выбрать готовый аватар из библиотеки. © Kling AI
В сервисе можно не только загрузить собственное фото, но и сгенерировать персонажа с нуля или выбрать готовый аватар из библиотеки. © Kling AI

Kling AI — популярный китайский сервис, который умеет генерировать видео и изображения, а также создавать ИИ-аватары. Для этого в нем есть специальный режим — Avatar 2.0.

В режиме Avatar 2.0 можно «оживить» собственное фото, сгенерировать персонажа с нуля или выбрать одного из готовых аватаров в библиотеке Kling. Я загрузил фотографию, ранее созданную в ChatGPT. Для этого достаточно нажать Upload Image.

Затем необходимо настроить генерацию видео. В поле Speech я написал текст, который будет произносить аватар. Для озвучки доступно около 40 встроенных голосов, включая русскоязычные. У некоторых из них дополнительно можно выбрать эмоциональную окраску речи — например, нейтральную, радостную, грустную, злую, испуганную, удивленную или с оттенком отвращения.

Голос не обязательно генерировать — можно загрузить аудиозапись с речью живого человека по кнопке Upload Audio, аватар ее произнесет в кадре. Этот вариант подойдет, если хочется добиться более натурального звучания или использовать собственный голос.

Также в настройках есть поле Avatar Prompt — оно предназначено для описания поведения персонажа в кадре. Например, можно попросить, чтобы аватар жестикулировал, наклонялся к камере, двигался по комнате или менял выражение лица во время речи. Заполнять это поле необязательно — если оставить его пустым, герой будет вести себя нейтрально.

После ввода текста Kling сразу показывает, сколько секунд получится на выходе и сколько кредитов понадобится. В бесплатной версии доступна только генерация в разрешении 720p с частотой 30 кадров в секунду. Более высокое качество и экспорт без водяного знака открываются только по подписке.

В режиме Avatar 2.0 можно создавать ролики продолжительностью до пяти минут. Это заметно больше, чем у многих конкурентов, которые часто ограничиваются 5—30 секундами. Правда, длинные ролики расходуют много кредитов, поэтому в бесплатной версии на такие форматы рассчитывать не стоит: обычно лимита хватает примерно на 15—20 секунд видео.

Иногда аватары в Kling AI начинают произносить фразы не совсем корректно — как, например, в начале этого видео. © Kling AI

Сервис работает быстро — результат обычно генерируется за пару минут. Если аватар просто смотрит в кадр и говорит, это выглядит достойно. Но если персонаж много двигается или произносит длинный текст, его лицо иногда начинает плыть, а артикуляция может заметно отставать от речи.

Плюсы:

  1. Можно загружать свое аудио.
  2. Быстрая генерация.

Минусы:

  1. Видео могут выглядеть нереалистично.
  2. Иногда нейросеть начинает галлюцинировать.

Бесплатный лимит: 16 кредитов на старте — хватит примерно на 40—45 секунд видео
Стоимость: от 33 $⁣ (2 430 ₽) в месяц — минимальной подписки хватит на 5 минут видео
Качество: ⭐ ⭐ ⭐
Сложность освоения: 📈📈📈

Навигация внутри Creatify поначалу сбивает с толку. © Creatify
Навигация внутри Creatify поначалу сбивает с толку. © Creatify

Creatify ориентирован на создание рекламных роликов и коротких видео для соцсетей. Основная функция сервиса — превращать ссылки на продукты с маркетплейсов в промо. Но есть в Creatify и возможность создания ИИ-аватаров.

Работа с аватаром устроена довольно гибко. В поле Avatar Prompt можно описать поведение персонажа в кадре — например, попросить его улыбаться и жестикулировать. Отдельно регулируется, насколько строго модель должна следовать этому описанию.

Главная сильная сторона сервиса — работа с голосами. Внутри — большая библиотека озвучек с разными языками и вариантами произношения. Для русского доступно 17 голосов, все можно послушать заранее. Есть настройки тембра, манеры речи и эмоций персонажа. А функция Voice Sync позволяет самостоятельно зачитать текст, чтобы нейросеть повторила интонации, паузы и манеру речи в итоговом видео.

Отдельно реализована удобная работа со сценариями. Можно написать текст самостоятельно или нажать кнопку AI Script Writer и кратко описать свою идею. Сервис создаст сценарий на заданном языке — например, на русском. Результат затем можно отредактировать вручную или сразу отправить в генерацию.

Сервис умеет автоматически добавлять субтитры — доступен выбор из множества шрифтов, размеров и стилей оформления. Готовый ролик потом можно сразу отправить в Instagram*, TikTok, YouTube, X или LinkedIn.

Интерфейс в целом понятный, но навигация внутри Creatify поначалу сбивает с толку. Сервис в первую очередь заточен под рекламные видео для маркетплейсов, поэтому функции для работы с ИИ-аватарами спрятаны — сначала нужно перейти в отдельный режим Avatar Video, а уже внутри него настраивать персонажа, сценарий, голоса и генерацию.

Сами аватары выглядят реалистично, но артикуляция иногда чуть запаздывает, особенно если текст длинный и сложный.

Качество генерации приемлемое, но в бесплатной версии видео перекрывается водяными знаками. © Creatify

При этом Creatify имеет серьезное ограничение: в бесплатной версии нельзя использовать свои фотографии — доступны только готовые аватары из библиотеки. Кроме того, итоговое видео почти полностью перекрывается крупными водяными знаками, так что для полноценной работы бесплатный тариф использовать не получится.

Плюсы:

  1. Огромный выбор голосов и акцентов.
  2. Можно генерировать сценарий прямо внутри сервиса.

Минусы:

  1. Бесплатно только готовый аватар с водяными знаками.
  2. Артикуляция не всегда идеально совпадает с речью.

Бесплатный лимит: около 80 кредитов в день — хватит примерно на 10 секунд видео в разрешении 720p
Стоимость: от 6 $⁣ (440 ₽) в месяц — минимальной подписки хватит на 10 минут видео
Качество: ⭐ ⭐ ⭐
Сложность освоения: 📈📈📈📈

Пользователи могут обмениваться на платформе получившимися работами. © Apob AI
Пользователи могут обмениваться на платформе получившимися работами. © Apob AI

Apob AI специально создан для работы с ИИ-аватарами. Если большинство конкурентов предлагают просто загрузить фотографию, выбрать голос и нажать на кнопку «Сгенерировать», то Apob AI пытается быть скорее полноценной студией для создания цифрового персонажа. Из-за этого возможностей здесь заметно больше, но и освоить сервис намного сложнее.

В Apob AI можно не только загрузить собственную фотографию, но и создать персонажа с нуля. Для этого во вкладке Create Portrait Model необходимо выбрать режим AI influencer generator. С его помощью можно сгенерировать внешность аватара по текстовому описанию — например, попросить создать молодого мужчину в деловом костюме или персонажа в мультяшной стилистике. Я не стал использовать эту функцию и взял изображение девушки, сгенерированное в ChatGPT.

Apob AI также позволяет детально настраивать сцену на этапе генерации видео по текстовому запросу — в том числе на русском языке. В сценарии разрешено прописывать движения камеры, одежду героя, освещение, стиль съемки, фон и погоду, причем часть таких деталей уже заранее подготовлена в виде шаблонов. Например, можно собрать сцену, в которой персонаж будет находиться в спортивной одежде в тренажерном зале или идти в дождливую погоду по песчаному берегу.

Интерфейс устроен непривычно. Вместо обычных кнопок здесь применена система досок и тегов, в которой можно комбинировать идеи как конструктор. Вероятно, по задумке создателей такая организация работы должна помочь пользователю, но на практике это скорее сбивает с толку.

Почти каждое действие внутри платформы расходует кредиты. Они списываются не только за финальную генерацию, но и за шаги в процессе — например, за создание лица и озвучку. Из-за этого без покупки подписки будет сложно добиться адекватного результата.

Артикуляция на получившемся видео плохо попадает в речь аватара. © Apob AI

Визуально аватары выглядят довольно реалистично, особенно если персонаж не делает слишком резких движений. Но добиться стабильного результата непросто. В нашем тесте голос получилось нормально сгенерировать только с пятой попытки — до этого сервис либо обрывал фразы, либо генерировал звук не до конца.

Плюсы:

  1. Бесплатный режим не ограничен только пробным периодом.
  2. Внешне аватары выглядят довольно реалистично.

Минусы:

  1. Очень перегруженный интерфейс.
  2. На хороший результат часто уходит много попыток.

Бесплатный лимит: около 10 генераций в месяц — примерно 80 секунд видео
Стоимость: от 19,99 $⁣ (1 475 ₽) в месяц с премиум-подпиской Google AI Pro — этого хватит примерно на 50 видео по 8 секунд каждое
Качество: ⭐ ⭐ ⭐ ⭐ ⭐
Сложность освоения: 📈

Интерфейс Google Vids выполнен в узнаваемом стиле экосистемы Google Workspace. © Google Vids
Интерфейс Google Vids выполнен в узнаваемом стиле экосистемы Google Workspace. © Google Vids

Google Vids — это сервис Google для создания презентационных и обучающих видеороликов с помощью ИИ. Формально это не узкоспециализированный генератор аватаров, а скорее гибрид видеоредактора и ИИ-инструмента для создания контента. Но для цифровых ведущих он оказался одним из наиболее мощных в этой подборке.

Для генерации аватара достаточно загрузить фотографию и описать, что должен делать персонаж. Промпты можно писать простым русским языком, модель хорошо понимает такие запросы.

За генерацию в Google Vids отвечают модели семейства Veo. Они дают сильный результат — мимика выглядит натурально, движения персонажа плавные, свет правильно ложится на лицо, мимика не плывет, а губы точно попадают в речь.

Сервис не требует совершать лишних действий — нужно лишь загрузить фото и написать запрос. © Google Vids
Сервис не требует совершать лишних действий — нужно лишь загрузить фото и написать запрос. © Google Vids

При этом рабочее пространство в Google Vids устроено как видеоредактор с таймлайном. Можно переставлять кадры местами, обрезать фрагменты, менять длительность сцен и добавлять переходы прямо внутри платформы. То есть ролик не нужно сначала генерировать в одном сервисе, а потом отдельно монтировать — все делается в одном окне.

После генерации ролик можно скачать в формате MP4, сохранить в Google Drive, экспортировать как GIF или сразу опубликовать на YouTube.

Google Vids самостоятельно добавила в ролик анимированную кнопку подписки — без отдельного указания в промпте. © Google Vids

При этом сервис почти не дает контроля над голосом. Выбрать его вручную нельзя — нейросеть сама определяет, как будет звучать персонаж. Загружать свою аудиозапись тоже нельзя.

Еще одно ограничение — каждый ролик генерируется кусками по восемь секунд. Поэтому длинные видео придется собирать из нескольких сцен. Все ролики автоматически получают водяной знак Veo в углу кадра.

Плюсы:

  1. Очень высокое качество генерации.
  2. Максимально простой интерфейс.

Минусы:

  1. Нельзя выбрать голос.
  2. Генерация только короткими кусками.

Бесплатный лимит: 100 кредитов на старте — расход зависит от выбранной модели
Стоимость: от 15 $⁣ (1 100 ₽) в месяц — минимальной подписки хватит на 3,5 минуты видео, если пользоваться самой недорогой моделью
Качество: ⭐ ⭐ ⭐
Сложность освоения: 📈📈📈

В Hedra есть ассистент, но от него мало пользы. © Hedra
В Hedra есть ассистент, но от него мало пользы. © Hedra

Hedra — платформа для генерации цифровых персонажей, которая делает ставку не только на свои модели, но и на доступ к сторонним нейросетям.

Логика работы довольно простая. Сначала нужно загрузить фотографию будущего персонажа или сгенерировать его внешность по текстовому запросу прямо внутри платформы. После этого следует описать идею естественным языком — например, попросить персонажа выступить перед камерой и о чем-то рассказать. Промпты сервис понимает в том числе на русском языке.

Если формулировка получается слишком короткой, можно нажать кнопку улучшения запроса — сервис сам допишет детали про движения камеры, интонации, композицию кадра и дополнительные визуальные нюансы.

Генерировать видео можно как с помощью собственных моделей Hedra — Avatar, Omnia и Character 3, — так и с использованием сторонних решений, например Kling, Veo и Seedance. Переключение между ними доступно в небольшом выпадающем меню, расположенном под полем ввода.

Такой подход позволяет более гибко решать творческие задачи. Прямо внутри платформы можно экспериментировать с разными моделями и выбирать те, которые лучше подходят для конкретных идей. Расход кредитов на генерацию зависит от выбранной модели — так, Hedra Avatar тратит семь кредитов на секунду видео, а Kling AI Avatar v2 Pro — 24.

Для озвучки тоже много вариантов. Можно написать сценарий, и сервис сам подберет синтетический голос. Либо загрузить собственную аудиозапись — тогда аватар будет полностью опираться на вашу реальную речь.

Результат удивил необычным южнославянским произношением. © Hedra

В тесте я использовал модель Seedance 1.5 Pro. Она показала себя неплохо: персонаж не стоит неподвижно, может жестикулировать, слегка менять положение тела и довольно точно двигать губами. Но с русским языком у встроенных голосов пока есть проблемы: слышен очень тяжелый акцент, из-за которого речь звучит неестественно. Если же загрузить собственное аудио, результат заметно лучше.

Интерфейс тоже поначалу может вызывать затруднения. По задумке создателей, работу с Hedra должен упрощать встроенный чат-бот — через него можно описывать идеи обычным языком и получать доступ к нужным инструментам. Но на практике ассистент часто неправильно понимает запросы, а потому многие функции и настройки все равно приходится искать вручную.

Плюсы:

  1. Большой выбор моделей.
  2. Можно загружать свое аудио.

Минусы:

  1. Русская речь звучит неестественно.
  2. Запутанный интерфейс.

Лимиты: 5 видео в день
Стоимость: бесплатно
Качество: ⭐ ⭐ ⭐
Сложность освоения: 📈

Визуально Qwen почти не отличается от ChatGPT. © Qwen
Визуально Qwen почти не отличается от ChatGPT. © Qwen

Qwen — это мультимодальная нейросеть от Alibaba, которая умеет работать с текстом, изображениями, документами и видео. У Qwen очень простой интерфейс: вся работа с ней происходит в формате диалога, как в ChatGPT.

Чтобы создать ИИ-аватар, нужно открыть чат, выбрать режим генерации видео и загрузить фотографию будущего персонажа. После этого можно простым языком — в том числе по-русски — описать, что должно происходить в кадре.

Сервис неплохо справляется с базовой анимацией портрета. Если попросить персонажа просто смотреть в камеру, слегка двигать головой и произносить короткий текст, результат получается приемлемым. Но если потребовать более сложного движения — например, активной жестикуляции, смены положения в кадре или более эмоциональной подачи, — качество быстро падает.

Результат получается посредственным, зато не надо платить. © Qwen

Артикуляция часто не успевает за речью, а мимика выглядит менее натурально, чем у большинства конкурентов. Иногда создается ощущение, что лицо существует отдельно от голоса.

В Qwen можно ежедневно генерировать пять бесплатных видео стандартной длительностью пять секунд. При этом сервис не ставит на ролики водяные знаки.

Плюсы:

  1. Можно использовать бесплатно каждый день.
  2. Очень простой интерфейс.

Минусы:

  1. Качество заметно хуже, чем у конкурентов.
  2. Хорошо справляется только с простыми сценами.

Бесплатный лимит: фактически без ограничений
Стоимость: по подписке от 4,99 $⁣ (370 ₽) в месяц — возможность без очереди сгенерировать около 10 минут видео
Качество: ⭐ ⭐ ⭐ ⭐ ⭐
Сложность освоения: 📈📈

Начинать работу можно сразу на главном экране. © Wan
Начинать работу можно сразу на главном экране. © Wan

Wan — популярная нейросеть Alibaba для генерации видео. В отличие от большинства конкурентов, здесь нет жесткого дневного лимита по количеству роликов — генерировать можно сколько угодно, если хватит терпения дождаться очереди.

В сервисе есть отдельный режим Avatar, но он не поддерживает работу с русским языком — генерировать в нем получится только английскую речь. Это не проблема, потому что создать цифрового персонажа можно и через режим генерации видео. Достаточно загрузить фотографию и сопроводить ее текстовым запросом.

Если не хочется самому подробно прописывать движения или сцену, нажмите кнопку улучшения промпта — тогда нейросеть сама допишет детали про камеру, композицию, свет и движения персонажа. Голос выбрать нельзя, зато можно загрузить собственное аудио.

В бесплатной версии есть ограничения по качеству — доступна только генерация роликов разрешением 720p и длиной не более пяти секунд. Для большинства простых задач этого достаточно, но длинные монологи или сложные сцены в таком формате будет сложнее построить.

Сами генерации получаются очень качественными. Голос звучит очень натурально, мимика выглядит живой, артикуляция почти всегда попадает в речь, а персонаж не просто сидит перед камерой, а может активно двигать руками, менять позу, наклоняться и естественно взаимодействовать с пространством.

Китайская модель выдала один из лучших результатов в подборке. © Wan

Иногда сервис добавляет в ролик неожиданные элементы, которых не было в запросе. Например, в одном из моих тестов в видео появилась музыка.

Главный компромисс бесплатной версии — скорость генерации. Часто ожидание готового видео растягивается на несколько часов. Ускорить этот процесс можно только покупкой подписки.

Плюсы:

  1. Безлимитное бесплатное использование.
  2. Очень натуральные речь, мимика и жесты.

Минусы:

  1. Очень долгое ожидание генерации.
  2. Бесплатные ролики скачиваются только с водяным знаком.

Что в итоге

Бесплатный лимитМинимальная стоимость подпискиКачествоСложность
Kling AI66 кредитов, хватит на 15—20 секунд видео6,6 $⁣ (485 ₽)⭐ ⭐ ⭐📈📈
Creatify16 кредитов, хватит на 40—45 секунд33 $⁣ (2 430 ₽)⭐ ⭐ ⭐📈📈📈
Apob AI80 кредитов в день, хватит на 10 секунд6 $⁣ (440 ₽)⭐ ⭐ ⭐📈📈📈📈📈
Google VidsОколо 10 генераций по 8 секунд в месяц19,99 $⁣ (1 475 ₽) в месяц⭐ ⭐ ⭐ ⭐ ⭐📈
Hedra100 кредитов — хватит примерно на 14 секунд видео в самой простой модели15 $⁣ (1 100 ₽) в месяц⭐ ⭐ ⭐📈📈📈
Qwen5 видео в деньбесплатно⭐ ⭐ ⭐📈
WanФактически безлимитно4,99 $⁣ (370 ₽) в месяц⭐ ⭐ ⭐ ⭐ ⭐📈📈

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult

Владимир ЛещевСоздавали цифрового аватара? Поделитесь опытом:
    Вот что еще мы писали по этой теме
    Сообщество