Телеком 2-я линия

Один из крупнейших телеком-операторов

Автоматизация 2-й линии поддержки. Агент классифицирует обращение, подбирает сценарий из матрицы, собирает данные из биллинга, CRM и базы знаний, формирует ответ в корпоративном тоне. Оператор проверяет — а не пишет.

Задача

2-я линия поддержки крупного телеком-оператора — это сотни тысяч обращений в месяц. Тарифы, баланс, подписки, непонятные списания, подключение и отключение услуг. Оператор получает тикет, читает переписку с 1-й линией, лезет в несколько внутренних систем за контекстом (биллинг, CRM, управление услугами, история транзакций), собирает ответ. На одно обращение уходит 15–25 минут.

Отдельный запрос несложный, проблема в масштабе. 80% обращений типовые, но каждое требует ручного сбора контекста из 3–5 систем и соблюдения сценария ответа — для каждой темы и подтемы свой скрипт. Оператор тратит большую часть времени не на решение проблемы клиента, а на сбор контекста: открыть одну систему, посмотреть баланс, открыть другую, проверить историю списаний, открыть третью, найти подходящий скрипт. Это ручной труд, замаскированный под интеллектуальный. И масштабируется он только линейно — больше обращений означает больше людей.

Почему это сложнее, чем кажется

На слайде автоматизация поддержки выглядит просто: берём AI, подключаем к системам, получаем ответы. В реальности между слайдом и продакшеном — несколько ловушек, каждая из которых может похоронить проект.

Внутренние системы оператора закрыты так же, как для внешнего подрядчика. Чтобы агент мог запросить баланс клиента или историю списаний, ему нужно пройти те же проверки безопасности, что и сотрудник за корпоративным ноутбуком. На тестовых данных всё работает идеально, а подключение к боевым системам вскрывает проблемы, которые никто не закладывал в сроки.

AI должен говорить голосом бренда. «Ваш баланс составляет 342 рубля» и «На счету 342 рубля» — технически одно и то же, но для бренда разница принципиальная. Название компании пишется строчными без кавычек, рубли — полностью без сокращений, эмоциональные фразы вроде «понимаю вашу боль» запрещены. Корпоративный тон оказался настолько трудной задачей, что формулировки шлифовали больше 60 раз на реальных диалогах.

Одного умного агента на все случаи жизни не хватает. Ранний прототип — один агент на все темы — справлялся с типовыми запросами, но путался в нестандартных, нарушал порядок действий и иногда отвечал на вопросы, на которые отвечать не должен. Архитектуру пришлось пересобирать трижды, пока не нашли баланс между гибкостью AI и жёсткостью корпоративных скриптов.

Корпоративная документация — не статичный файл, а живая система. Тарифы меняются, акции запускаются и заканчиваются, условия подписок пересматриваются — статьи в базе знаний обновляются постоянно. Агент, который ссылается на прошлогодние условия, наносит больше вреда, чем тот, который честно говорит «не знаю». А чтобы находить нужную статью по смыслу клиентского вопроса — нужен отдельный поисковый индекс.

Что попробовали и выкинули

Не всё, что было построено, дожило до продакшена. Проект прошёл четыре архитектурных фазы — каждая следующая отбрасывала часть предыдущей.

Подход	Что случилось	Итог
Четыре синхронных агента (MVP)	Три агента извлекали одни и те же данные из сообщения параллельно, четвёртый генерировал ответ. Дублирование, медленно, негибко	Пересобрали в одного агента с инструментами
Один агент с зашитыми ответами инструментов	Быстро, но инструменты возвращали одни и те же тестовые данные вместо реальных. Любое изменение на стороне оператора ломало всё	Единый интерфейс к системам оператора с заменяемыми модулями
Отдельный агент-редактор для тона	Добавил задержку на каждый ответ, не улучшил качество. Тон нельзя чинить пост-процессингом	Правила тона встроены в инструкции основного агента
Один агент на все темы без сценариев	Справлялся с типовыми запросами, но на нестандартных нарушал порядок действий, пропускал шаги и отвечал на вопросы, на которые отвечать не должен	Классификация темы и подтемы отдельными агентами + матрица сценариев в базе данных

Как устроено

Финальная архитектура — результат трёх пересборок. Ключевое решение: разделить «понять, что спросили» и «что с этим делать» на разные агенты с разной степенью свободы.

Классификация работает в два шага: первый агент выбирает тему из динамического списка в базе, второй сужает до подтемы — видит только варианты выбранной темы, а не весь справочник. Оба работают в режиме жёсткого выбора и обязаны объяснить решение — не для клиента, а для отладки: если ошибка, видно где именно.

Для каждой пары тема + подтема в базе лежит конкретный план действий: какие данные запросить, из каких систем, в каком порядке, что ответить. Этот план становится приоритетной инструкцией для основного агента — он обязан следовать ему, а не импровизировать.

Когда приходит обращение, конвейер запускает классификацию и поиск по документации параллельно. Для бизнеса важны два следствия этой архитектуры: классификация предсказуема (один и тот же вопрос всегда попадает в одну и ту же категорию), а аналитик может изменить логику работы агента, поправив одну строку в таблице сценариев — без участия разработчиков и без нового релиза.

Если агент не справляется или тема выходит за его границы, обращение уходит живому оператору — с категорией причины и кратким описанием ситуации, чтобы тот не начинал разговор с нуля.

Документация оператора синхронизируется с поисковыми хранилищами отдельным сервисом. Он забирает статьи из корпоративной базы знаний, раскрывает внутренние сокращения через глоссарий (без этого модель путается в корпоративном жаргоне) и загружает в оба хранилища. Если запись в одно из них упала — второе откатывается, чтобы поиск и данные не рассинхронились. В итоге тарифы и условия обновляются в одном месте — агент подхватывает изменения автоматически.

Агент знает свои границы — и они прописаны явно, в порядке убывания приоритета. Вопрос не по теме услуг оператора — вежливый отказ. Расторжение договора, финансовые претензии, возврат средств — автоматический перевод на живого оператора, без попыток решить самостоятельно. Только после этих проверок агент переходит к работе по сценарию. Для бизнеса это означает управляемые риски: агент никогда не ответит на вопрос, на который отвечать не должен.

Что под капотом — полная карта системы

ОБРАЩЕНИЕ

телефон · регион · история переписки с 1-й линией

параллельно

КЛАССИФИКАЦИЯ

понять, что спросили — детерминированно, без импровизации

Классификатор темы агент, t=0.0

жёсткий выбор: ровно одна тема из динамического списка

обоснование выбора — для отладки, не для клиента

Классификатор подтемы агент, t=0.0

видит только подтемы выбранной темы, не весь справочник

Матрица сценариев PostgreSQL

тема + подтема → план: вопрос, действие, стратегия, тип завершения, доступ

аналитик правит строку в базе — агент сразу работает по-новому

ПОИСК

найти релевантную документацию — по смыслу и с точными данными

Векторизация запроса text-embedding-3-small, 1536 dims

текст обращения → числовое представление для поиска

Поиск по смыслу Weaviate, cosine

коллекция Minerva, порог 0.5, до 5 фрагментов

текст без таблиц — таблицы портят качество поиска

Точные данные PostgreSQL

полный текст с таблицами, ценами, условиями

дедупликация по фрагменту и по статье

Синхронизация Temporal

Minerva → нарезка → векторизация → запись в оба хранилища

глоссарий раскрывает корпоративные сокращения

транзакционная запись: сбой одного хранилища откатывает второе

три слоя контекста →

сценарий из матрицы фрагменты документации правила корпоративного тона

СБОРКА КОНТЕКСТА в порядке убывания приоритета

роль · язык · текущая дата

фильтр офф-топика ← 1-й приоритет

не про услуги оператора → вежливый отказ

правила эскалации ← 2-й приоритет

расторжение, претензия, возврат → оператор с контекстом

правила вызова инструментов

корпоративный тон 60+ итераций на реальных диалогах

фрагменты документации ← из поиска

приоритетная инструкция ← из матрицы

ИСПОЛНЕНИЕ основной агент, t=0.2

следует сценарию — собирает данные, формирует ответ

7 инструментов

баланс рубли, ГБ, минуты, СМС, бонусы тариф и услуги название, плата, пакеты, опции транзакции последние 3 дня, фильтр по типу детали списания что за услуга, сколько стоит, как часто статья из базы условия тарифа из корпоративной БЗ подключённые услуги полный список активных сервисов поиск по документации только если сценарий разрешает

границы агента

офф-топик → вежливый отказ

расторжение / претензия / возврат → оператор с контекстом

сложный случай → оператор с контекстом

оператор получает категорию причины и описание ситуации

ОТВЕТ

сохранение в Messages (PostgreSQL)

логирование токенов и вызовов инструментов

оператор проверяет готовый ответ и отправляет

3 агента · 7 инструментов · 2 хранилища · ETL-сервис · матрица сценариев
pydantic-ai · Weaviate · PostgreSQL · FastAPI · Temporal
Qwen 3 235B — жёсткий выбор (t=0.0) для классификации, свободная генерация (t=0.2) для ответов

Результат

После запуска на боевом трафике клиент заказал расширение системы на новые категории обращений. Не доработку, не исправление — масштабирование работающей архитектуры.

Оператор больше не собирает контекст из внутренних систем вручную — это делает агент. Работа оператора сводится к проверке и отправке готового ответа. То, на что раньше уходило 15–25 минут, собирается за секунды. Матрица сценариев и корпоративный тон продолжают шлифоваться на реальных диалогах — это непрерывный процесс, который не заканчивается с релизом.

7 недель от прототипа до продакшена

3 пересборки архитектуры

60+ итераций формулировок

5 внутренних систем подключены

4 подхода попробовали и выкинули

721 коммит за проект

7 недель от прототипа до продакшена

3 пересборки архитектуры

60+ итераций формулировок

5 внутренних систем подключены

4 подхода попробовали и выкинули

721 коммит за проект

Модули платформы в этом проекте

Чат и агенты pydantic-ai

Каскад из трёх агентов: два классификатора в режиме жёсткого выбора определяют тему и подтему, основной агент с семью инструментами исполняет сценарий

Документы Weaviate

Двойной индекс базы знаний: одно хранилище для поиска по смыслу (текст без таблиц), другое для точных данных (полный текст с таблицами). Автоматическая синхронизация с корпоративной базой знаний

Инференс

Qwen 3 235B: режим жёсткого выбора для классификации обращений, свободный режим для генерации ответов в корпоративном тоне

Guardrails

Иерархия правил с явными приоритетами: фильтрация офф-топика, автоматическая эскалация на оператора, жёсткие ограничения корпоративного тона

Все модули платформы →

Расскажите, какой процесс хотите разобрать.

Ответим, подходит ли задача для AI-агентов, и если да, предложим конкретный план.

или напишите напрямую — ilya@manaraga.ai