Добрый день!
Вокфлоу из вот этого поста:
выглядит так:
В нем tool Qdrant Knowledge Base возвращает ВСЕ ЗАПИСИ базы данных. Т.е. если вот тут поставить Limit 100 - вернется 100: 2026-02-01_08-00-01.png — Яндекс Диск
И уже потом LLM их пытается отфильтровать и выдать релевантные. На объеме 5-10 записей это может работать. На промышленном объеме это не будет работать. Если вернется 100000 записей, LLM будет их обрабатывать очень долго или вообще не обработает, т.к. не хватит контекстного окна. И это будет очень дорого.
Я взял этот механизм и переработал для своего воркфлоу полностью сохранив схему. На скрине показываю, что этот tool, во-первых, возвращает всю базу (100 записей, т.к. установлен limit 100), 2) во-вторых, возвращает нерелевантные значения (т.е. на этом этапе никакой поиск не происходит, а значит фильтрация происходит позже): 2026-02-01_08-06-01.png — Яндекс Диск
Кто реально использует Qdrant в своих воркфлоу? Поделитесь, пожалуйста, опытом, как сделать, чтобы возвращались именно релевантные результаты?