Токены в нейросетях: зачем нужны, как их считают и где выгоднее покупать

Нейросети

30.06.26

Сгенерированное изображение — Лев Переулков / Midjourney

Токены в нейросетях: зачем нужны, как их считают и где выгоднее покупать

Спойлер: предложения мобильных операторов не очень выгодны

Обсудить

Владимир Лещев

кое-что знает о технологиях

Страница автора

Токен — это единица, в которой нейросети измеряют текст и считают стоимость работы.

Теперь «токены» начали продавать и мобильные операторы, но под этим словом они нередко понимают совсем другое. Расскажу, что такое токены на самом деле, сколько они стоят у разработчиков ИИ и сколько придется переплатить за них у мобильных операторов.

Что такое токены и как они работают

Токены — это базовые единицы информации, которыми оперирует ИИ. Прежде чем обработать текст, изображение, аудио или другой контент, модель преобразует его в последовательность токенов. Именно в таком виде нейросеть анализирует полученные данные, хранит контекст и генерирует ответ.

При этом различают входные и выходные токены. Входные токены — это запрос пользователя и весь контекст диалога. Выходные токены — ответ модели. Чем больше токенов модель получает на вход и генерирует в ответ, тем дороже обходится ее работа. Поэтому большинство разработчиков выставляет счета и устанавливают лимиты именно в токенах, а не в количестве слов, символов или запросов.

Примеры задач и приблизительный объем токенов, которые будут на них потрачены

Задача	Вход	Выход
Короткий вопрос и несложный ответ	5—20	50—80
Запрос на деловое письмо	200—400	400—800
Резюме статьи на 10 тысяч знаков	8 000—12 000	500—1 500
Генерация функции на Python с объяснением	50—100	950—3 000

При тарификации учитывают оба направления. Причем выходные токены везде стоят значительно дороже входных, потому что генерация ответа требует больше вычислений, чем чтение запроса.

Количество токенов можно измерить. Большинство разработчиков ИИ-моделей публикует собственные инструменты для подсчета токенов либо объясняет способ таких вычислений в своей документации. Например, у OpenAI есть онлайн-токенизатор, который помогает посмотреть, на сколько токенов разобьется запрос пользователя.

Взлет и падение токенмаксинга: почему компании сначала поощряли использование ИИ сотрудниками, а потом стали ограничивать

Заранее подсчитать можно лишь количество входных токенов. Стоимость ответа всегда известна только после — ИИ сам решает, сколько написать. При этом «думающие» модели вроде GPT-5.5 или Claude Opus 4.8 генерируют скрытые токены рассуждений — пользователь их не видит, но они тарифицируются как выходные, и видимый ответ на 500 токенов может реально стоить 2 000 и больше.

Сколько текста помещается в один токен, зависит от языка и особенностей модели. В английском один токен в среднем соответствует трем-четырем символам, а в русском — полутора-двум. Поэтому русскоязычные запросы при прочих равных обычно расходуют больше токенов, чем англоязычные. Для кода токены считаются так же, как и для обычного текста.

Для других типов контента объем токенов рассчитывают иначе. Разные вендоры делают это по-разному. Например, когда вы отправляете в ChatGPT картинку, он разбивает ее на маленькие квадраты по 32 × 32 пикселя. Затем количество этих фрагментов умножается на специальные коэффициенты — это и будет количество токенов, необходимых для задачи.

Так, изображение 1 024 × 1 024 пикселя будет разделено на 1 024 квадрата. Модель GPT 5.4 nano имеет коэффициент 2,46. Значит, выполнение задачи потратит 1 024 × 2,46 = 2 519 токенов.

Сколько стоят токены у разработчиков нейросетей

Большинству пользователей не нужно покупать токены напрямую. Они оформляют подписку на чат-бота, например ChatGPT, Claude или Gemini, и получают доступ к модели за фиксированную ежемесячную плату.

Такие подписки работают по принципу разумного использования — компании не раскрывают точные лимиты в токенах и могут менять их в зависимости от нагрузки на серверы. Из-за этого активные пользователи нередко упираются в ограничения неожиданно быстро. Anthropic, например, регулярно корректирует лимиты Claude, а пользователи часто жалуются на непредсказуемое исчерпание доступного объема запросов.

Claude: как пользоваться нейросетью бесплатно и правда ли она лучше ChatGPT

Для профессионалов, компаний и продвинутых пользователей существует второй вариант — доступ через API. В этом случае модель не используют через официальный веб-интерфейс, а подключают напрямую к сайту, приложению или внутреннему сервису. При работе через API клиент платит только за фактически обработанный объем данных. Такой подход делает расходы предсказуемыми и позволяет точно контролировать бюджет.

Все крупные разработчики продают доступ к моделям через API по одной схеме: цена за миллион токенов, отдельно вход и выход. Ниже — актуальные тарифы на июнь 2026 года.

Сколько стоят токены у разных разработчиков

Разработчик	Модель	Миллион входных токенов	Миллион выходных токенов
OpenAI	GPT-5.5 pro	30 $	180 $
OpenAI	GPT-5.5	5 $	30 $
OpenAI	GPT-5.4	2,5 $	15 $
OpenAI	GPT-5.4 mini	0,75 $	4,5 $
OpenAI	GPT-5.4 nano	0,2 $	1,25 $
Anthropic	Claude Opus 4.8	5 $	25 $
Anthropic	Claude Sonnet 4.6	3 $	15 $
Anthropic	Claude Haiku 4.5	1 $	5 $
Google	Gemini 3.1 Pro Preview	2 $	12 $
Google	Gemini 3.5 Flash	1,5 $	9 $
Google	Gemini 2.5 Pro	1,25 $	10 $
DeepSeek	V4 Pro	0,435 $	0,87 $
DeepSeek	V4 Flash	0,14 $	0,28 $

Таким образом, цены у разных вендоров могут различаться в десятки или даже сотни раз. Например, выходные токены в китайском DeepSeek V4 Pro примерно в 34 раза дешевле, чем у GPT-5.5, хотя модель считается одной из наиболее мощных на рынке.

При этом следует учитывать, что оплатить API зарубежных разработчиков российской картой обычно нельзя. Чаще всего приходится пользоваться услугами тех или иных посредников, которые берут за свои услуги комиссию. Поэтому фактическая стоимость токенов для пользователей из России может оказаться выше официальных тарифов.

Еще у всех крупных игроков есть скидочные механики. Одна из них — кэширование повторяющихся запросов. Например, если компания снова и снова отправляет модели большой системный промпт с правилами работы чат-бота, модель может не обрабатывать этот фрагмент заново при каждом обращении. Вместо этого система использует уже подготовленный результат, поэтому стоимость таких входных токенов обычно снижается примерно на 90%.

Второй популярный инструмент — пакетная обработка. Подходит для задач, которым не нужен мгновенный ответ, например массового анализа документов, автоматической разметки данных или генерации описаний товаров для интернет-магазина. Такие запросы обрабатываются не в реальном времени, а спустя несколько часов. Взамен вендоры обычно предоставляют скидку около 50%.

Сколько берут операторы и за что вы переплачиваете

Покупать токены напрямую у разработчиков — вариант для тех, кто работает с API: компаний, профессионалов и продвинутых пользователей. Для большинства людей такой подход избыточен, поскольку требует самостоятельной настройки и управления доступом к модели. Но и обычные подписки вроде ChatGPT Plus или Claude Pro не всегда удобны: их нельзя оплатить российской банковской картой напрямую.

На этом фоне на рынке появились предложения прямого доступа к нейросетям от операторов связи. Логика простая: подключаешь услугу у своего мобильного провайдера, платишь в рублях по тарифу и можешь сразу пользоваться популярными моделями. Звучит привлекательно. Но если разобраться в деталях, оказывается, что под словом «токены» операторы часто понимают совсем не то же самое, что разработчики ИИ. Расскажу, что именно продают российским абонентам и сколько это стоит на самом деле.

Платите за нейросети? Расскажите почему

«Билайн» первым запустил подобную опцию в России. Оператор предлагает Ai-токены — внутреннюю валюту для доступа к популярным ИИ-моделям. Несмотря на название, работают они совсем не так, как обычные токены. Каждому запросу заранее присвоена фиксированная стоимость вне зависимости от объема. Например, один запрос к урезанной модели семейства GPT-5 стоит один токен, к DeepSeek — три, к Claude Sonnet 4.5 — 30, к Claude Opus 4.1 — 150, к GPT-5 Pro — 300, а генерация видео в Veo 3 обойдется в 4 000 токенов.

Во всех основных тарифах оператора бесплатно дают 300 Ai-токенов ежемесячно, остаток переносится. Звучит щедро, пока не пересчитаешь в запросы.

Сколько запросов можно отправить бесплатно

Модель	Количество запросов
GPT-5 nano	300
DeepSeek	100
GPT-5	20
Claude Sonnet 4.5	10
Claude Opus 4.1	2
GPT-image	1

То есть бесплатный пакет — это от одного до трех обращений к серьезной модели в день. Чтобы спросить рецепт хватит, но для работы — нет.

Дополнительные Ai-токены можно купить: имеются пакеты от 1 500 до 8 000 токенов стоимостью от 300 до 1 500 ₽ в месяц. Получается около 19—20 копеек за один операторский токен.

Сравним с прямой ценой API на том же типичном запросе с 500 входных токенов и 1 000 выходных. Для расчетов я использовал модели, которые оператор раскрывает явно. Часть GPT-моделей «Билайн» описывает без указания конкретной версии, поэтому корректно сравнить их невозможно.

Сравнение цены запроса у «Билайна» и напрямую через API

Модель	Цена запроса у «Билайна»	Цена прямого запроса через API	Переплата
Claude Sonnet 4.5	5,6 ₽	1,2 ₽	в 4,5 раза
Claude Opus 4.1	28 ₽	6 ₽	в 5 раз
Gemini 2.5 Flash	0,37 ₽	0,19 ₽	в 1,9 раза
Gemini 2.5 Pro	2,80 ₽	0,77 ₽	в 3,6 раза

При этом в списке доступных нейросетей встречаются устаревшие версии — например, Claude Opus 4.1, хотя актуальная модель у Anthropic — Opus 4.8

МТС продает тариф с безлимитным доступом к собственному чат-боту за 890 ₽ в месяц. Для повседневных задач этого может быть достаточно, но разработчики, аналитики и другие профессиональные пользователи обычно предпочитают более мощные модели OpenAI, Anthropic и Google.

Gemini: как пользоваться нейросетевым чат-ботом Google

«Мегафон» пошел другим путем. Вместо единой внутренней валюты оператор продает готовые пакеты, разделенные по типам задач. Например, 200 запросов к языковым моделям обойдутся в 59 ₽ в месяц, а генерация 200 изображений — в 900 ₽ в месяц.

Доступен выбор из множества популярных моделей — например, DeepSeek V4, GPT 5.5, Gemini 3.1 Pro и Claude Opus 4.7. Есть даже бесплатные 20 запросов в неделю к ChatGPT.

Для сравнения возьмем типичный запрос объемом 500 входных и 1 000 выходных токенов. Для «Мегафона» расчеты сделаны исходя из максимальных пакетов, поскольку в пересчете на один запрос они оказываются наиболее выгодными.

Сравнение цены запроса у «Мегафона» и напрямую через API

Модель и пакет	Цена запроса у «Мегафона»	Цена прямого запроса через API	Переплата
DeepSeek V4 (пакет GPT)	0,2 ₽	0,025 ₽	в 7,8 раза
GPT 5.5 (пакет GPT Plus)	2,5 ₽	2,4 ₽	в 1,1 раза
Gemini 3.1 Pro (пакет GPT Plus)	2,5 ₽	0,94 ₽	в 2,7 раза
Claude Sonnet 4.6 (пакет Claude)	3 ₽	1,2 ₽	в 2,5 раза
Claude Opus 4.7 (пакет Claude)	14,98 ₽	1,99 ₽	в 7,5 раза

Важно учитывать, что в пакете Claude обращения к Opus 4.7, флагманской модели Anthropic предыдущего поколения, тарифицируются по специальному коэффициенту: один запрос к модели списывает сразу пять единиц лимита. Поэтому тариф, который формально обещает 100 запросов, на деле позволяет обратиться к Opus не более 20 раз.

Что можно использовать вместо API и пакетов операторов

Если не хочется заморачиваться с покупкой токенов напрямую у разработчиков или переплачивать за накрутки у операторов, можно рассмотреть альтернативные варианты. Вот наиболее реалистичные опции.

Российские нейросети. Продвинутые ИИ-функции Алисы «Яндекса» стоят 100 ₽ в месяц поверх базовой подписки на «Яндекс Плюс». У Сбера есть GigaChat с полностью бесплатным доступом.

Это самый дешевый и простой путь. Для бытовых запросов их возможностей хватает с запасом. Но по качеству ответов на сложных задачах вроде кодинга, длинных документов и аналитики отечественные модели пока ощутимо уступают западным.

Нейросеть Алиса: что умеет чат-⁠бот «Яндекса» и как им пользоваться

Агрегаторы нейросетей. BotHub, GoGPT, SYNTX и десятки других сервисов продают доступ к тем же ChatGPT, Claude и Gemini за рубли, без необходимости менять IP и заводить зарубежную карту. Модели оплаты у таких сервисов разные: кто-то предлагает подписку, а кто-то берет деньги за фактический объем услуг.

Наценка у агрегаторов тоже есть, но она обычно заметно ниже операторской. При этом выбор моделей шире, а лимиты честнее. Минус — непрозрачность: заранее посчитать стоимость запроса в таких сервисах бывает сложно.

API через посредников. Этот вариант подходит продвинутым пользователям. Различные реселлеры API позволяют пополнять баланс в удобных платежных системах и получать доступ сразу к нескольким моделям через единый интерфейс. Наценка у таких сервисов обычно ниже, чем у прочих посредников, поэтому итоговая стоимость использования оказывается близка к прямым ценам разработчиков.

Но здесь есть свои риски. Во-первых, все запросы проходят через инфраструктуру посредника, поэтому доверять ему чувствительные данные стоит с осторожностью. Во-вторых, услуги посредников и обход региональных ограничений нарушают правила большинства разработчиков, а потому ваш аккаунт могут заблокировать.

Что в итоге

Токены — это базовые единицы информации, которыми оперирует ИИ. Разработчики используют их при подсчете объема обработанных данных, когда выставляют счета за использование своих моделей через API.
Стоимость токенов у разных разработчиков отличается в десятки раз. Самые мощные модели обычно обходятся дороже.
«Токены» у сотовых операторов — это другое. В большинстве случаев речь идет о внутренней валюте, которой присваивается фиксированная стоимость обращения к той или иной модели независимо от фактической нагрузки.
Доступ к нейросетям через операторов почти всегда стоит дороже. Размер переплаты зависит от модели и тарифа, но в отдельных случаях может достигать нескольких раз по сравнению с использованием API.
Для большинства пользователей удобнее могут оказаться другие варианты. Для повседневных задач подойдут российские нейросети, агрегаторы дают доступ к зарубежным моделям без необходимости обходить ограничения, а покупка API через посредников позволяет приблизиться к прямым ценам разработчиков.

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult