Ключевые тексты
Материалы, из которых собирается хэндбук.
Habr
Короткий промпт не значит дешёвый
Циклы агентов, стабильный список инструментов и промпт, который не ломает кеш.
Habr
Кеш префикса: 7 анти-паттернов
Метки времени, плавающий порядок инструментов, круговая маршрутизация и срок жизни KV-cache.
Habr
Стоимость модели с учётом кеша
Почему выбор модели нельзя считать только по цене токенов.
Habr
Agent Skills: больше, чем папка с промптами
Как навыки агентов связаны с инструментами, RAG, MCP и архитектурой агентных систем.
Habr
Почему миллион токенов не решает проблему контекста
Рабочий контекст, деградация качества и границы длинных контекстных окон.
Habr
ИИ-агенты на примере Deep Research
Чем отличаются одиночный вызов LLM, процесс, RAG и агентный цикл.
Habr
Как стиль ответа влияет на рейтинг LLM
Почему выбор модели нельзя сводить к красивой форме ответа.
Habr
Как выбирать LLM для продукта
Контекст, качество, стоимость, юрисдикция и другие параметры выбора модели.
Telegram
AI да парен!
Заметки про ИИ-платформы, vLLM, агентов и работу в боевой эксплуатации.
Статьи на Habr
Длинные технические разборы про кеш, стоимость, инференс и запуск ИИ-сценариев.
Telegram-канал
Короткие заметки, ссылки, наблюдения и черновые мысли про ИИ-платформы в боевой эксплуатации.