Автономные ИИ-агенты требуют больше вычислительных ресурсов, что ведет к росту затрат на токены. Бизнес внедряет новые практики для контроля расходов.
Компании, активно использующие ИИ-агентов, сталкиваются с ростом расходов на токены. Автономные системы потребляют значительно больше ресурсов, чем обычные запросы к чат-ботам.
По оценкам аналитиков, потребление токенов ИИ-агентами будет расти. Например, аналитик Goldman Sachs Джим Шнайдер ожидает, что за четыре года оно вырастет в 24 раза.
Для контроля затрат компании отслеживают потребление токенов в реальном времени. Сервис Priceline использует внутренние дашборды и ежемесячные отчеты. Если сотрудник расходует аномально много токенов, с ним обсуждают причины.
Другой подход — подбор оптимальной модели ИИ для конкретной задачи. Для простых операций компании используют более компактные или открытые системы, экономя на дорогих моделях.
Внедряются практики управления облачными затратами. Поставщик ПО Smartsheet поручил контроль расходов FinOps-команде, настроил автоматические предупреждения о приближении к лимитам и открыл дашборды по отделам.
Некоторые компании показывают подразделениям реальную стоимость работы с ИИ. Системы showback, где сотрудники видят стоимость своих запросов, или chargeback, когда расходы списываются на бюджет подразделения, могут сократить затраты на 20–30%.
Расходы растут, несмотря на снижение цен на токены. По данным Bain & Company, с декабря 2024 по декабрь 2025 года цены на токены снизились на 50%, но потребление выросло в 4,5 раза. Компании также используют старые, небольшие и open-source модели, а некоторые запускают их на собственном оборудовании.
Главное — привязать расходы на ИИ к измеримым бизнес-результатам, таким как рост выручки или ускорение разработки.

