Сергей Нотевский
Шаблоны
English version

Non-prod cost sheet

Шаблон для расчёта non-prod мощности, резерва и стоимости принятого результата.

Прикладной уровень
v0.1
Обновлено 23 мая 2026 г.
Руководители ИИ-платформ
CTO
MLOps-инженеры
template
finops
self-hosted
Хранится только в этом браузере.

Назначение

Self-hosted стоимость нельзя считать только по продовым GPU. Этот шаблон фиксирует мощности, которые не обслуживают пользовательский трафик напрямую, но входят в экономику сценария.

Cost sheet

prod

prod instances

Рабочий контур и целевая утилизация.

stage

stage

Проверка релизов, совместимость и canary prep.

debug

test / debug

Воспроизведение багов, профилирование и подбор флагов.

canary

canary

Отдельная мощность под безопасную выкатку.

reserve

reserve

Пики, деградации и резервный маршрут.

evals

eval runs

Проверки качества, бенчмарки и регрессии.

outcome

accepted result rate

Доля результатов, которые реально принимаются.

owner

owner

Кто ревьюит стоимость и принимает компромисс.

Cache-aware cost

Поля для расчёта:

  • S: стабильные токены;
  • D: динамические токены;
  • O: выходные токены;
  • h: ожидаемый и фактический hit rate;
  • agent_steps;
  • retries;
  • fallback_rate;
  • cost_per_accepted_result;
  • cache_regression_after_deploy.

Связанные главы

On this page