[筆記] AI agents for beginners 第五課: What Is agentic RAG 課後心得

TL;DR Agentic RAG 是 RAG(檢索增強生成)的進階版,它結合「代理人(Agent)」的規劃與判斷能力,能夠將使用者的複雜查詢拆解成多步驟任務,結合資料庫檢索與外部工具呼叫,並具備記憶與學習能力。簡單來說,它讓 LLM 不只會找資料,還會動腦解題、學習改進,能處理更複雜、更實用的問題。 第五堂課的主題是最近非常熱門的一個進階技術概念:「 Agentic RAG 」。這是我學習剛後整理出來的筆記跟心得,希望能幫助大家更好地理解它是什麼、跟基本 RAG 有什麼不同,以及它的實際應用潛力! RAG 是什麼? 在介紹 Agentic RAG 之前,先簡單回顧一下 RAG 的基本概念: RAG (Retrieval-Augmented Generation)是一種讓大型語言模型(LLM) 從資料庫中檢索相關資訊,並加進模型的上下文 來回答使用者問題的技術。 這樣的設計能讓 LLM 給出的答案不再只是來自訓練資料,而是結合了最新、最即時的資訊。 影片中提到: 「RAG 能夠讓 LLM 根據使用者查詢,從資料庫中檢索資訊,並加到 context 中以提供更相關的回應。」 那什麼是 Agentic RAG? Agentic RAG 是在 RAG 基礎上的進化版!它結合了「 代理人 (Agent) 的智慧」來強化整個資訊檢索與回應流程。 查詢分析與規劃 :Agent 會先分析使用者的問題,並規劃成一連串的任務。 多步驟與多系統處理 :能夠處理需要經過多個系統、多個步驟才能回答的複雜問題。 資訊驗證與迭代 :如果第一次檢索結果不足,Agent 會重新發出工具呼叫直到找到答案。 長期記憶 :Agent 能記住先前的嘗試,避免重複錯誤、越來越聰明! 影片還開玩笑說:「我其實更想叫它 Adaptive RAG!」 實作技巧:Prompt Augmentation 為了讓 Agent 運作更聰明,可以使用 Prompt Augmentation 技術來加強提示內容。 例如透過設計 PromptPlugin ,在使用者提出查詢後,自動加入更多指示。 這能引導 Agent 先判斷 context 是否足夠,再決定是否呼叫工具函式。 Agentic RAG 的三個實際應用範例 ...