Комбинация RAG и Tool Agent
Объединение RAG и Tool Agent создаёт мощный гибрид: агент может искать в базе знаний (RAG) и вызывать внешние инструменты (APIs, вычисления) — при этом самостоятельно решая, что использовать.
Архитектура «Tool Agent + RAG»
Агент анализирует запрос и решает: использовать Retriever Tool для поиска в векторной БД, или вызвать внешний API, или оба варианта. Например, на вопрос «Какова цена товара X?» агент ищет в Pinecone (RAG), а на вопрос «Какая погода сейчас?» — вызывает внешний API.
Преимущество перед чистым RAG
Агент сам решает, когда искать в базе знаний, а когда отвечать из общих знаний LLM или вызывать внешний API. Это делает систему значительно гибче.
Настройка Pinecone
Для работы с Pinecone необходимо:
- Создать аккаунт на pinecone.io и получить API-ключ
- Создать Index с параметрами: Dimensions = 1536 (для text-embedding-3-small), Metric = cosine
- Использовать Document Store в Flowise для загрузки документов
- Подключить Retriever Tool к Tool Agent
Создание рабочего процесса
Рекомендуется создавать два отдельных потока:
- Поток индексации — загрузка документов через Document Store в Pinecone
- Поток агента — Tool Agent с подключённым Retriever Tool (Pinecone) + другие инструменты
Retriever Tool
Настройка Retriever Tool:
- Name — понятное имя, например
search_knowledge_base - Description — когда использовать и для чего. Это критически важно для правильной маршрутизации!
- Retriever — подключение к Pinecone с теми же настройками Embeddings
- Top-K — обычно 4 достаточно