первое очевидное решение и почему оно не работает в твоём кейсе. — Дообучение модели или алаймент

данные - ресурсы - время

плюс - - LLM будет корректно отвечать и редко ошибаться минусы

  • ОЧЕНЬ долго и дорого
  • Нужен большой обучающий датасет под каждый кейс
  • Легко переобучить и поучить низкое качество на тесте после трейна
  • Плохо решает мелкие специфические кейсы

MALLM

что такое RAG - Retrieval Augmented Generation

Retrieval Augmented - поиск и извлечение релевантной информации, Generation - генерация ответа пользователю с учетом найденной информации

чанкинг - langchane векторная бд - milvus

https://habr.com/ru/companies/ruvds/articles/541502/

zookerper как средство связи агентов друг с другом

о оценке LLM https://habr.com/ru/articles/846748/

Мультиагентная архит

Мульагентные большие языковые модели (MALLM) –

В последнее время большой скачок в развитии получили большие языковые модели (Large Language Model, LLM),

Синергия Мультиагентных Систем и Больших Языковых Моделей: Концепция MALLM