Перейти до основного вмісту

Холодний старт

Імпорт контрактів

Масовий імпорт контрактів і документів у базу знань.

Використання

npx tsx scripts/import-contracts.ts

Що робить

  1. Сканує каталог з файлами контрактів (PDF, DOCX, TXT)
  2. Створює базу знань, якщо її ще нема
  3. Завантажує кожен файл разом із метаданими
  4. Ставить ingestion-джоби у чергу для обробки

Воркфлоу

Скрипт — частина pipeline холодного старту:

import-contracts.ts → [ingestion pipeline processes files] → knowledge base ready

Після запуску відстежуйте статус документів через:

GET /api/v1/knowledge/documents?status=processing

Аналіз чатів

Аналізуйте chat-export файли, щоб витягнути intent-патерни для засіду класифікатора намірів.

Використання

npx tsx scripts/analyze-chats.ts

Що робить

  1. Парсить chat-exports WhatsApp або Telegram
  2. Кластеризує подібні повідомлення за змістом
  3. Виявляє повторювані патерни запитань
  4. Створює таксономію намірів
  5. Віддає JSON у форматі, придатному для seed-intents.ts

Воркфлоу

Скрипт — перший крок pipeline холодного старту:

analyze-chats.ts → [produces intent JSON] → seed-intents.ts → intent examples ready

Вихід

Результат аналізу містить записи намірів із:

  • intentName — виявлений ідентифікатор наміру
  • phrases — приклади фраз для наміру
  • count — частота в історії чатів

Seed intents

Масово засідіть приклади намірів із готового результату аналізу.

Використання

npx tsx scripts/seed-intents.ts --input ./analysis.json --namespace legal

Аргументи

ПрапорецьОбовʼязковийОпис
--inputтакШлях до JSON-файлу з intent-записами
--namespaceтакІмʼя цільового простору імен

Формат вхідних даних

[
{
"intentName": "leave_policy",
"phrases": ["How many vacation days do I have?", "What is the leave policy?"]
}
]

Що робить

  1. Читає JSON-файл з intent-записами
  2. Дедуплікує по (intentName, phrase) — пропускає вже існуючі приклади
  3. Генерує ембединги для кожної фрази (batch size 32)
  4. Апсертить записи IntentExample разом із вкладеними векторами
  5. Показує прогрес-бар під час обробки

Воркфлоу

Це другий крок pipeline холодного старту:

analyze-chats.ts → [produces intent JSON] → seed-intents.ts → intent classification ready

Після засіду класифікатор намірів використовує ці приклади для векторної класифікації вхідних повідомлень.