[筆記] AI agents for beginners 第一課: What are AI Agents 課後心得

這將會是 AI Agents for beginners 這一系列課程學習心得的第一篇文章,主要是記錄以學習 AI Agent 新手的角度所習得的內容以及心得收獲

TL;DR

AI Agents 是一種具備理解能力、記憶能力與使用工具能力的智慧系統,能根據使用者的自然語言指令,自動規劃與執行任務。其核心由 大型語言模型(LLM)記憶(短期與長期)、以及可操作的外部工具組成。課程透過一個模擬旅行規劃助手的程式碼示例,展示了 Agent 如何回應使用者需求、學習偏好並調整建議。這是進入 AI 自主應用開發的重要起點。

筆記內容

這份文件是基於 "What are AI agents?" 課程第一課的內容,旨在介紹 AI Agent的基本概念、構成要素以及如何開始建構它們。本課程將帶領學習者從概念到程式碼,涵蓋建構 AI Agent 的基礎知識。

什麼是 AI Agent?

AI Agent是一種能夠識別使用者請求的任務、建立完成該任務的計畫並執行該計畫行動的系統。它們結合了多個關鍵組件,使其能夠進行推理、記憶和利用工具來達成目標。

AI Agent 的核心組成部分:

  • 大型語言模型 (LLM): LLM 是 AI Agent 推理能力的核心。它負責解析使用者請求,理解任務,並制定執行計畫。課程中提到,LLM 的推理能力包括「識別使用者請求的任務,建立完成該任務的計畫並執行該計畫的行動」。
  • 記憶 (Memory): 記憶讓 AI Agent 能夠儲存和利用資訊來改進其表現。記憶分為兩種:
    • 短期記憶 (Short-term memory): 使用者與 Agent 之間的對話上下文,讓 Agent 能夠記住當前的互動狀況。
    • 長期記憶 (Long-term memory): 資料的集合,讓 Agent 隨時間在完成任務方面有所改進,例如記住使用者偏好。
  • 工具 (Tools): AI Agent 能夠存取和利用的外部資源或功能,以執行特定行動,例如:
    • 透過 API 存取的服務
    • 幫助確定採取何種行動的資料
    • 用於向 Agent 傳送資訊的功能

AI Agent 如何運作?

Agent 利用 LLM 來識別使用者想要完成的任務,利用記憶來收集完成任務所需的資訊和資料,並確定完成任務所需的可用工具。

課程中以「刷牙」作比喻:需要計畫(何時何地刷)、工具(牙刷與牙膏)、短期記憶(目前是否刷了上排牙齒)、長期記憶(對牙膏的偏好)。

建構 AI Agent:實際範例與程式碼

課程展示了使用 Microsoft 的 Semantic Kernel 與 GitHub 上的 agentic framework 建構 AI Agent 的範例。採用了 GPT-4o mini 模型。

範例中建立了一個「目的地」外掛程式 (Destinations Plugin),包含全球不同城市列表,並有一個功能能隨機回傳一個城市。

模擬互動範例如下:

  • 使用者請求:「plan me a day trip」(為我規劃一個一日遊)。Agent 利用 LLM 解釋請求。
  • Agent 回應:發現沒有指定城市,呼叫隨機目的地功能,建議「Sydney」。
  • 使用者不滿意,要求重規劃:「don’t really like this destination...」
  • Agent 再次使用記憶與工具:避免重複,改建議「Rio De Janeiro」。

這展示了 AI Agent 如何利用推理、記憶與工具來調整回應與行動。

展望未來

下一章節將探討不同的 agentic framework,包括它們的工作方式、差異和優點。

總結:AI Agent 透過整合大型語言模型、記憶與工具,能夠理解與執行使用者指令,並依據互動進行調整與學習,是建構智慧應用的基礎。

心得感想

作為一個 AI 初學者,這堂課給了我一個非常清楚且具體的切入點。過去我總覺得「AI Agent」是個抽象又高深的概念,但透過這次的學習,我第一次真正理解它的運作邏輯:原來只要把「理解(LLM)+記憶+工具」這三個概念串起來,就能構成一個有思考、有行動力的智能系統。

程式碼範例的旅行規劃案例非常貼近生活,讓我看到 AI Agent 其實不只是理論,而是可以應用在解決真實問題的工具。特別是看到 Agent 如何根據使用者的反應(「不喜歡這個目的地」)自動做出調整,真的讓我感受到它的靈活與潛力。

雖然一開始對於像 Semantic Kernel 或 agentic framework 這些名詞還有點陌生,但在跟著課程範例操作後,漸漸可以理解它們是如何協助我們更容易地建構出一個 AI Agent 。

總之,這次的學習讓我不再只是「使用 AI」,而開始理解如何打造一個可以落地解決現實問題的 AI Agent。也激發了我想進一步探索更多 AI Agent 應用場景的興趣與好奇心。

留言

這個網誌中的熱門文章

【海外婚紗】道具行李篇

[Android] 內部儲存體(Internal Storage)的檔案系統讀寫(File I/O)