4.7
Скачать PDF

Tool Agent с RAG и Pinecone

20 мин чтения

Комбинация RAG и Tool Agent

Объединение RAG и Tool Agent создаёт мощный гибрид: агент может искать в базе знаний (RAG) и вызывать внешние инструменты (APIs, вычисления) — при этом самостоятельно решая, что использовать.

Архитектура «Tool Agent + RAG»

Агент анализирует запрос и решает: использовать Retriever Tool для поиска в векторной БД, или вызвать внешний API, или оба варианта. Например, на вопрос «Какова цена товара X?» агент ищет в Pinecone (RAG), а на вопрос «Какая погода сейчас?» — вызывает внешний API.

Преимущество перед чистым RAG

Агент сам решает, когда искать в базе знаний, а когда отвечать из общих знаний LLM или вызывать внешний API. Это делает систему значительно гибче.

Настройка Pinecone

Для работы с Pinecone необходимо:

  1. Создать аккаунт на pinecone.io и получить API-ключ
  2. Создать Index с параметрами: Dimensions = 1536 (для text-embedding-3-small), Metric = cosine
  3. Использовать Document Store в Flowise для загрузки документов
  4. Подключить Retriever Tool к Tool Agent

Создание рабочего процесса

Рекомендуется создавать два отдельных потока:

  • Поток индексации — загрузка документов через Document Store в Pinecone
  • Поток агента — Tool Agent с подключённым Retriever Tool (Pinecone) + другие инструменты

Retriever Tool

Настройка Retriever Tool:

  • Name — понятное имя, например search_knowledge_base
  • Description — когда использовать и для чего. Это критически важно для правильной маршрутизации!
  • Retriever — подключение к Pinecone с теми же настройками Embeddings
  • Top-K — обычно 4 достаточно

Ключевые выводы

  • Комбинация RAG + Tool Agent создаёт гибридного агента с доступом к базе знаний и внешним API
  • Используйте два отдельных потока: для индексации и для агента
  • Pinecone обеспечивает постоянное хранение данных (в отличие от In-Memory)
  • Описание Retriever Tool определяет, когда агент будет обращаться к базе знаний
  • Top-K = 4 — хороший баланс для большинства задач

Полезные ресурсы