Тексты

Тексты про ИИ-платформы в боевой эксплуатации.

Пишу о том, что начинается после демо: кеш, стоимость, инференс, агенты, качество, наблюдаемость и ответственность.

Кеш префиксаСтоимость инференсаАгентыvLLMКонтроль качестваНаблюдаемость

Ключевые тексты

Материалы, из которых собирается хэндбук.

Habr

Короткий промпт не значит дешёвый

Циклы агентов, стабильный список инструментов и промпт, который не ломает кеш.

Habr

Кеш префикса: 7 анти-паттернов

Метки времени, плавающий порядок инструментов, круговая маршрутизация и срок жизни KV-cache.

Habr

Стоимость модели с учётом кеша

Почему выбор модели нельзя считать только по цене токенов.

Habr

Agent Skills: больше, чем папка с промптами

Как навыки агентов связаны с инструментами, RAG, MCP и архитектурой агентных систем.

Habr

Почему миллион токенов не решает проблему контекста

Рабочий контекст, деградация качества и границы длинных контекстных окон.

Habr

ИИ-агенты на примере Deep Research

Чем отличаются одиночный вызов LLM, процесс, RAG и агентный цикл.

Habr

Как стиль ответа влияет на рейтинг LLM

Почему выбор модели нельзя сводить к красивой форме ответа.

Habr

Как выбирать LLM для продукта

Контекст, качество, стоимость, юрисдикция и другие параметры выбора модели.

Telegram

AI да парен!

Заметки про ИИ-платформы, vLLM, агентов и работу в боевой эксплуатации.

Статьи на Habr

Длинные технические разборы про кеш, стоимость, инференс и запуск ИИ-сценариев.

Telegram-канал

Короткие заметки, ссылки, наблюдения и черновые мысли про ИИ-платформы в боевой эксплуатации.