первое очевидное решение и почему оно не работает в твоём кейсе. — Дообучение модели или алаймент
данные - ресурсы - время
плюс - - LLM будет корректно отвечать и редко ошибаться минусы
- ОЧЕНЬ долго и дорого
- Нужен большой обучающий датасет под каждый кейс
- Легко переобучить и поучить низкое качество на тесте после трейна
- Плохо решает мелкие специфические кейсы
MALLM
что такое RAG - Retrieval Augmented Generation
Retrieval Augmented - поиск и извлечение релевантной информации, Generation - генерация ответа пользователю с учетом найденной информации
чанкинг - langchane векторная бд - milvus
https://habr.com/ru/companies/ruvds/articles/541502/
zookerper как средство связи агентов друг с другом
о оценке LLM https://habr.com/ru/articles/846748/
Мультиагентная архит
Мульагентные большие языковые модели (MALLM) –
В последнее время большой скачок в развитии получили большие языковые модели (Large Language Model, LLM),
Синергия Мультиагентных Систем и Больших Языковых Моделей: Концепция MALLM