Тексты

Тексты про ИИ-платформы в боевой эксплуатации.

Пишу о том, что начинается после демо: кеш, стоимость, инференс, агенты, качество, наблюдаемость и ответственность.

Кеш префиксаСтоимость инференсаАгентыvLLMКонтроль качестваНаблюдаемость

Ключевые тексты

Материалы, из которых собирается хэндбук.

Habr

Циклы агентов, стабильный список инструментов и промпт, который не ломает кеш.

Habr

Метки времени, плавающий порядок инструментов, круговая маршрутизация и срок жизни KV-cache.

Habr

Почему выбор модели нельзя считать только по цене токенов.

Habr

Как навыки агентов связаны с инструментами, RAG, MCP и архитектурой агентных систем.

Habr

Рабочий контекст, деградация качества и границы длинных контекстных окон.

Habr

Чем отличаются одиночный вызов LLM, процесс, RAG и агентный цикл.

Habr

Почему выбор модели нельзя сводить к красивой форме ответа.

Habr

Контекст, качество, стоимость, юрисдикция и другие параметры выбора модели.

Заметки про ИИ-платформы, vLLM, агентов и работу в боевой эксплуатации.

Длинные технические разборы про кеш, стоимость, инференс и запуск ИИ-сценариев.

Короткие заметки, ссылки, наблюдения и черновые мысли про ИИ-платформы в боевой эксплуатации.