Приложение Т—Ж
В нем читать удобнее

Google выпустила Nano Banana Pro: что умеет продвинутая версия лучшего «нейрофотошопа»

12
Google выпустила Nano Banana Pro: что умеет продвинутая версия лучшего «нейрофотошопа»
Аватар автора

Даша Лейзаренко

полная «бонанза»

Страница автора

20 ноября Google представила обновленную нейросеть Nano Banana, получившую приставку Pro.

Nano Banana — ИИ-генератор картинок от Google. Версия Pro научилась «рассуждать» в ходе генерации и точнее редактировать изображения. За последнюю способность еще прошлое поколение модели прозвали убийцей «Фотошопа».

Расскажу подробнее.

УЧЕБНИК Т—Ж
Как нейросети могут изменить жизнь

От рецепта ужина до изучения языков — собрали десятки рабочих и бытовых сценариев в бесплатном курсе

Баннер

Что умеет Nano Banana Pro

Генератор изображений работает на третьем поколении модели Gemini Pro, которую Google показал 19 ноября  . Вот чему научилась нейросеть в новой версии.

«Рассуждать». Nano Banana Pro опирается на знания о мире и «размышляет» в ходе генерации. А еще может выйти в интернет, если нужна актуальная информация.

В процессе «размышления» Nano Banana Pro генерирует до трех картинок и проверяет их на совпадение с запросом. Пользователю показывают только финальное изображение.

Функцию «размышления» модель применяет в большинстве сложных запросов — например, чтобы менять детали на картинке или превращать черновые наброски в иллюстрации.

Набросок, который я отправила в Nano Banana Pro
Иллюстрация, которую нейросеть создала на основе наброска
1/2
Набросок, который я отправила в Nano Banana Pro
Так выглядит процесс «размышлений». Хотя я задавала запрос на русском, они все равно на английском
Так выглядит процесс «размышлений». Хотя я задавала запрос на русском, они все равно на английском

Генерировать разборчивый текст и переводить. Можно указать, какой шрифт нужен, или имитировать разные варианты рукописного текста. Удобно для плакатов, схем, инструкций и мокапов.

Еще Nano Banana Pro умеет переводить надписи на изображениях. Она перегенерирует картинку без потери деталей, изменив только текст. В Google предупреждают, что модель может ошибаться в грамматике и орфографии.

Попросила перевести слово Jamones на картинке
Nano Banana Pro верно перевела слово и сохранила стиль шрифта
1/2
Попросила перевести слово Jamones на картинке

Точнее редактировать картинки. Nano Banana Pro научилась точечно менять ракурсы, цветокоррекцию, глубину резкости, освещение без потери деталей оригинального изображения. Например, модель может переделать дневную сцену в ночную.

В Google отмечают, что при сложном редактировании Nano Banana Pro иногда выдает неестественный результат с артефактами и странными деталями. Так вышло и у меня.

Попросила Nano Banana Pro превратить это фото в ночное
Город как будто сгенерировался с нуля, но ракурс сохранился
1/2
Попросила Nano Banana Pro превратить это фото в ночное

Сохранять внешний вид героев. Модель умеет объединять до 14 объектов и до пяти персонажей с разных кадров и создавать на их основе новые картинки, сохраняя единообразие. Можно помещать персонажей в другие локации или переодевать.

Это действительно работает: в моем случае Nano Banana Pro объединила пять животных с фотографий в разном освещении. Правда, фон получился немного странным, потому что скомбинировался с тех же снимков.

Я попросила нейросеть объединить котов и собак с разных картинок в одну
Внешность не потерялась, и даже пропорции правильные
1/2
Я попросила нейросеть объединить котов и собак с разных картинок в одну

Генерировать серии картинок. По одному запросу Nano Banana Pro создает несколько кадров, которые идут друг за другом. Модель сама напишет историю и придумает раскадровку — таким образом можно сгенерировать серию максимум из 10 изображений.

Я попросила создать раскадровку из 10 картинок с синим котом, но нейросеть выдала только шесть кадров, причем на одном изображении. В сгенерированной истории особого смысла я не нашла.

Nano Banana Pro поддерживает генерацию картинок в любых соотношениях сторон и с разрешением 1K, 2K или 4K.

Я загрузила такую картинку и попросила сделать раскадровку истории про кота в Стамбуле в этом же стиле
Что получилось: кот живет на улице, потом оказывается во дворце и пьет чай с человеком
1/2
Я загрузила такую картинку и попросила сделать раскадровку истории про кота в Стамбуле в этом же стиле

Где доступна Nano Banana Pro

В чат-боте Gemini. Модель доступна для всех. Чтобы воспользоваться ей, смените IP-адрес с российского на иностранный и перейдите на сайт чат-бота. Зарегистрируйтесь и под строкой для ввода запроса нажмите «Изображение».

На сайте убедитесь, что у вас выбрана опция «Думающая модель с 3 Pro» — это Gemini 3 Pro и Nano Banana Pro. В приложении под полем для ввода запроса вручную выберите модель 3 Pro вместо Flash 2.5.

Для всех пользователей есть лимиты на генерацию в Nano Banana Pro, для платных подписчиков — более щедрые. Google не раскрывает, какие именно. Например, у меня в бесплатной версии получилось сгенерировать только три картинки.

Быстрая модель не подойдет
Быстрая модель не подойдет

В Google AI Studio. Это официальный сайт Google, где можно протестировать разные ранние модели. Смените IP-адрес с российского на иностранный и перейдите на сайт. Зарегистрируйтесь и на главной странице нажмите Try Nano Banana Pro.

Через API или Vertex AI Studio. Вариант для разработчиков, чтобы встроить модель в собственный сервис с помощью своего ключа. Доступно только платно.

В сервисах Google. Nano Banana Pro интегрировали в «Google Презентации» и площадку для генерации аудиоподкастов NotebookLM. В них можно создавать более качественные иллюстрации и инфографики.

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult

Даша ЛейзаренкоУже попробовали Nano Banana Pro? Поделитесь впечатлениями:
  • ДмитрийВещи, которые pro делает лучше обычной: + в целом запросы упростились. Если вы храните подборку "100 промптов для nano banana", удаляйте из закладок. Нейронка теперь понимает с полуслова, с опечатками, без обязательных ранее глаголов и уточнений. + крутить камерой (можно сказать поверни камеру вокруг объекта на столько-то градусов, или покажи вид от такого-то объекта в такую-то сторону, или просто "вид сверху") - обычная банана этого вообще не умела. + замена лиц. Теперь можно загрузить 2 картинки, написать что-нибудь типа "замени мужчине в темной одежде на первом изображении лицо по референсу из воторого изображения". Раньше нейронка это делала плохо, особенно если на фото несколько человек или лица исходника и референса примерно похожи. + работа с абстракциями. Первая нейронка, которая прошла мой тест по запросу "Mobius strip made of denim. A red metal tube runs along the ribbon's surface in the center. The background is light gray.". То есть она уже имеет представления об сложных с т.з. топологии фигурах и способна с ними работать. - всё ещё не работает нормально с цветом и контрастом. В этом плане она хуже flux.kontext и не может сделать даже простую цветокоррекцию из фотошопа. Для реставрации выцветших цветных фото не подходит.35
  • Александр КотПопросил разместить оборудование в выделенной специально зоне. Ниже сравнение, что сделала предыдущая версия и думающая версия Pro. Как говорится - почувствуйте разницу.2
  • Александр КотАлександр,7
  • Angelocheck Light" Хотя я задавала запрос на русском, они все равно на английском" - Само собой разумеется! Умник просто перевёл ваш запрос на свой понятный язык (английский), а потом поработал. Поэтому в случае наличия в личном употреблении английского лучше не удлинять цепочку.1
  • Dm DmДаже раньше это был огонь, а сейчас огнище просто. Что будет дальше..4
  • ЗлатеникаДмитрий, этот комментарий должен был быть вместо статьи )5
  • Обычный человекМиньоны, общий сбор0
  • Комок нервовС одной стороны прогресс есть прогресс, с дру пгой - ждем очередную лавину блевотного нейрослопа по всему интернету)1
  • Виктор Кузнецовне реально интересная вещь, с каждым днем все легче и легче нас обмануть... ну прогресс требует "жертв"0
  • Ооо что-то интересное, попробую0
  • 0
  • Капитан ФьючерсОбычная программа. Неспециалисту она не поможет избежать косяков, которые он не знает. Так что дизайнеры работы не лишаться.0
Сообщество