發表文章

目前顯示的是有「AI Agents for beginners」標籤的文章

[筆記] AI agents for beginners 第九課: Metacognition Design Pattern 課後心得

圖片
Metacognition Design Pattern:AI 自我反思的力量 TL;DR 本篇文章介紹 AI 中的「後設認知設計模式」,即讓 AI Agent 具備「思考關於思考」的能力,能記錄使用者偏好、分析自身決策並隨時間持續改進。透過機票預訂的範例與程式碼展示,說明如何實作出能記憶、反思並適應不同情境與需求的智能代理。 摘要 這份簡報文件基於「How can AI agents improve?」的影片與課程內容,深入探討後設認知(Metacognition)在 AI Agent 提升能力中的核心角色。後設認知使 Agent 能夠自我反思、自我調整,提升透明性、適應性與決策品質,特別適用於需要理解上下文與長期偏好的場景。 後設認知的定義與應用 定義: 「思考關於思考」,即讓 AI 不只反應輸入,還能反思自己的運作與回應邏輯。 應用: AI 可藉由數據與分析,識別錯誤、優化決策與規劃。 “AI agents can use data and analysis to identify errors and make improvements in its planning and responses.” 後設認知對 AI Agent 的優勢 持續進化: 從使用者互動中學習、修正並成長。 推理透明: 能表達其決策依據,更容易讓使用者信任。 適應環境: 可根據使用情境動態調整策略。 “It allows agentic systems to be more transparent on its reasoning and decision making… making it more adaptable.” ✈️ 實例:預訂機票的後設認知應用 課程中以「幫我預訂最佳航班」為例,說明後設認知如何協助 AI 理解並持續考量使用者偏好(如價格、時間、航空公司等)作為決策依據。 “Metacognition comes into play… enabling the agent to reflect on this decision of how it’s defining the best flight.” 程式碼範例:追蹤客戶偏好 Agent 內部維護 customerPreference...

[筆記] AI agents for beginners 第八課: How to use a multi-AI agent system 課後心得

圖片
TL;DR 這篇文章介紹 Multiple Agent AI System 的概念與應用方式,說明在單一 AI 難以處理複雜任務時,如何透過多個角色明確的 AI 協同完成目標。文中涵蓋三種設計模式(群組聊天、任務移交、協同過濾),並以「前台建議者 + 禮賓審核者」的範例,示範如何透過角色分工與對話控制,提高 AI 輸出的品質與真實感。 文件來源: 擷取自「如何使用多 AI 代理系統」影片與相關課程資源 核心主題 本來源詳細探討了在人工智慧應用中採用多個 AI 代理(agent)協同工作的設計模式,以及這種模式的優勢、不同類型和實作範例。 主要概念與事實 多代理設計模式的定義 多代理設計模式是指「多個 AI Agent 一起工作以完成一個共同目標或任務」。 "to put it simply the multi agent design pattern is where we have multiple AI agents working together to complete a common goal or task" 使用多代理的時機 當單一 AI 代理不足以有效率或全面地完成複雜任務時,可以考慮使用多代理系統。多代理系統能提供更精煉或多角度的結果,例如透過協作或審查機制。 多代理系統的控制與可見性 多代理系統中存在控制對話流程和選擇代理的機制,例如: Termination function(終止函數) :定義代理之間互動結束的條件,例如當特定代理批准了結果時。 Selection process(選擇過程) :定義對話如何進行,例如輪流發言或根據規則選擇發言者。 不同的多代理設計模式 Group Chat (群組聊天) 類似人類的群組聊天,每條訊息廣播給所有代理。通常由一個 group chat manager (通常是另一個 AI 代理)來選擇處理任務的代理。 應用範例: 航空客服應用,有專門處理訂位、客訴或航班狀態查詢的代理,將顧客訊息路由至正確代理。 "there is group chat where just like a group chat with your friends and colleague...

[筆記] AI agents for beginners 第七課: What Is the AI Agent Planning Design Pattern 課後心得

圖片
TL;DR 這堂課講解了讓 AI Agent 更聰明處理複雜任務的方法,叫做「 規劃設計模式(Planning Design Pattern) 」。 簡單來說,就是讓 AI 把一件大事(像是規劃整趟旅行)分解成很多小任務(訂機票、找住宿、排行程…),然後每一小段都可以自己處理,甚至交給不同的 Agent 幫忙。這樣不只更有邏輯,還能讓整體流程自動化又可控! 本章的要點如下: ✅ 讓 AI 學會「規劃」和「分工」,不再是一個指令只做一件事的單工思維 ✅ 使用工具像 Pydantic 來結構化輸出,讓每個步驟都清楚可交棒 ✅ 加入「驗證機制」,確保 AI 輸出的內容完整又符合格式 ✅ 最酷的是,LLM 還可以理解「家庭友善」這種模糊條件,把人類的語意變成具體任務! 概要 本章說明了一種讓 AI Agent 有能力處理複雜任務的方式: 規劃設計模式 (Planning Design Pattern)。它的核心概念是把大型任務分解為更小、可管理的子任務,進而交由不同 Agent 或流程來執行,提升效率與可靠性。 核心概念與重點 規劃設計模式的定義與功能 讓 AI 能夠理解任務的整體結構,拆解為可執行的步驟 來源指出:「規劃設計模式使這一點更加清晰,透過讓 AI Agent 列出構成更複雜任務的子任務。」 複雜任務 → 子任務範例 例如:規劃 3 天的度假行程可拆分為: 預訂機票 訂飯店 安排交通 設計每日活動 多 Agent 協作 當系統中有多個 Agent,可以分頭處理子任務,效率更高。 來源說:「這真的有影響力的是與多個 Agents 協作... 子任務由不同 Agent 或流程完成。」 結構化輸出 + 驗證 輸出格式可以使用 JSON 或透過工具如 Pydantic 處理 這使資料可以交由下游的 Agent、流程、工具等繼續處理 結構化輸出 + 驗證機制 → 提高準確性與可持續運作 使用 Pydantic 進行結構定義 可定義: 任務清單 每個子任務所屬的 Agent 每項任務需要的欄位格式與驗證條件 LLM 的加值能力 不像傳統 API 調用,LL...

[筆記] AI agents for beginners 第六課: How to build effective AI agents 課後心得

圖片
TL;DR 建立有效 AI 代理的 3 大關鍵: 1. 系統訊息框架(System Message Framework): 以清楚可擴展的方式定義 AI 代理的角色、語氣與行為,並透過 LLM 生成具體系統訊息,讓提示設計變得更可控、更易迭代。 2. 人機協作架構(Human-in-the-Loop): 在 AI 執行關鍵任務前加入人類批准或介入機制,讓代理更可靠,尤其適合多代理協作的應用情境。 3. 安全與隱私考量: 開發 AI Agent 時需評估潛在安全風險與用戶資料保護,雖影片中僅略提,但書面章節中有更完整內容。 簡而言之,透過 系統化設計提示 、 納入人類監督 與 關注資料安全 ,才能打造真正 可信賴又有效的 AI Agent 。 核心主題: 本課程探討了建立有效且值得信賴的 AI Agent的關鍵方法,特別著重於以下三個方面: 系統訊息框架 (System Message Framework) 人機協作架構 (Human in the Loop Architecture) 安全性與隱私 主要觀點和重要事實: 系統訊息的重要性: 「系統訊息是我們作為 AI Agent 創建者在處理 LLM 時可以產生最大影響和控制的地方之一。」它對於設定清晰的指令至關重要,以確保 AI Agent 執行我們期望的操作。 系統訊息框架的工作原理: 這個框架的核心是使用一個基本的系統訊息作為輸入,然後由一個經過特別設定的 LLM(擁有用於生成系統訊息的模板)來生成一個更詳細和具體的系統訊息。這個生成的系統訊息會涵蓋代理的「職責、語氣、風格、互動指令以及任何額外說明。」 迭代式提示設計: 「在開發 Agent 時,尤其是在處理更複雜的場景時,很少能在第一次、第二次甚至第三次就獲得完美的提示。」提示設計是一個迭代的過程,系統訊息框架允許通過修改生成模板來更有效地進行迭代,從而提高所有代理的效能。 系統訊息框架的優勢: 可擴展性 (Scalable) 和可重複性 (Repeatable): 使生成提示的過程更有效率。 提高提示品質: 生成的系統訊息更清晰、更具體。 簡化迭代過程: 輕鬆調整模板,進而改進所有代理的提示。 人機協作的需求: 「在處理任務的過程,您可能會建立需要人類批准或介入...

[筆記] AI agents for beginners 第四課: What Is the Agent Tool Use Design Pattern 課後心得

圖片
TL;DR 第四課主題開始探討 AI Agent 的「 工具使用設計模式 」(Tool Use Design Pattern)概念,個人覺得這對於理解 Agent 如何透過工具真的與所處的 context 進行互動,並觀察行動之後環境的變化,擬定下一個動作計劃直到完成目標 task 的模式很有幫助 為什麼需要工具? 我們都知道大型語言模型(LLM)很強大,可以直接生成文字內容來回覆我們的問題。但有些任務,光靠 LLM 自己是做不到的,例如: 查看即時的航班狀態 進行精確的數學計算 查詢最新的客戶資料 這時候,就像人類需要工具一樣,AI Agent 也需要「工具」來完成這些超出它們本身能力的任務。 什麼是工具使用設計模式? 簡單來說,「 工具使用設計模式 」就是一種方法,它讓大型語言模型 (LLM) 能夠與外部工具互動 。這些工具可以是: 計算機(calculators) API(例如查詢航班狀態的 API) 應用程式內部的特定功能(例如處理貨幣兌換的 function) 透過這個設計模式,AI Agent 就能夠 藉助外部工具來執行或驗證資訊 ,而不僅僅是依賴它自己學到的訓練資料。 學會使用工具的好處(實際應用範例) 學會這個模式,我們的 AI Agent 能做的事情就更多了: 處理資料查詢: Agent 可以使用 生成程式碼的工具 來建立資料庫查詢,從客戶資料庫中取得即時資訊。 與現有系統整合: Agent 可以連接到像 CRM(客戶關係管理系統)這樣的系統,直接回答客戶訂位相關問題, 減少人工介入 。 自動化複雜工作流程: Agent 可以 組合使用不同的工具 來自動化流程,例如處理電子郵件並將資訊轉發, 提高效率 。 工具呼叫的小細節(以 Semantic Kernel 為例) 課程中提到了使用 Semantic Kernel 這個框架來實作工具呼叫。我們學到了一些設定方式: 自動(Auto): 讓 Agent 自行判斷是否需要呼叫工具函式。 必要(Required): 根據情境, 強制要求 Agent 呼叫特定函式 。 這些設定讓我們可以依需求更靈活地控制 Agent 的行為。 實際操作:一個旅遊 Agent 的例子...

[筆記] AI agents for beginners 第三課: How to design good AI agents 課後心得

圖片
TL;DR 設計優良 AI Agent 的關鍵在於三個核心原則: 空間 (設計互動環境)、 時間 (考量長期互動關係)、 核心 (擁抱不確定性並提供透明控制)。透過明確說明 Agent 能力、提供使用者控制選項,以及運用具體範例(如旅遊助手),可以提升使用者信任與互動體驗。 第三章筆記:設計優良 AI Agent 的關鍵原則 三大設計原則 1. 空間(Space) Agent 所運作的環境應該設計得能夠連接事件、人物與知識,並且能根據使用者需求靈活切換於前台與後台。 重要應用: 在 UI/UX 設計中,清楚地向使用者說明 Agent 的用途與限制。 這是 Agent 工作所在的環境。在這個空間中,應該專注於連接事件、人物和知識。Agent 應該易於發現,同時能夠根據使用者需求在前台和後台之間切換。 2. 時間(Time) 設計良好的 Agent 應該能隨著時間持續學習與進步,累積與使用者互動的歷史,提供更一致且個人化的回應。 重要應用: 結合過去互動紀錄、實作「反思設計模式」,讓使用者能看到自己的提示歷史。 這是 Agent 隨著時間與使用者互動的方式。這很重要,因為如果我們設計得足夠好,Agent 可以隨著時間改進。 3. 核心(Core) 核心原則在於擁抱不確定性,並透過透明設計與控制選項來建立使用者的信任。 重要應用: 讓使用者像操作影片一樣,擁有開關、暫停、字幕等控制權限。 由於我們允許 LLMs 制定計畫並執行這些計畫,不確定性是 Agent 設計的關鍵部分,透過賦予人類使用者可見的控制和反饋工具來建立信任和透明度在這裡非常重要。 💡 實際應用範例:旅遊 Agent 課程中展示了一個旅遊規劃 Agent 的範例,使用 Semantic Kernel 與 GitHub models。這個範例體現了三大原則的應用: 開場白即自我介紹其功能:規劃度假、一日遊、隨機地點建議等 引導使用者提供進一步資訊(如是否指定地點) 明確聲明自身能力與限制,幫助建立信任 在這種情況下,我們要修改它…以應用我們剛剛談到的設計原則,我們要向使用者明確說明這個 Agent 的能力,並給予它一些建議,說明我們希望看到 Agent 完成哪些互動。 透明度與控制權 來源強調:「好的 Ag...

[筆記] AI agents for beginners 第二課: Which AI agent framework to use 課後心得

圖片
TL;DR 代理框架是開發 AI 代理的工具集合,協助管理代理的行為、環境脈絡與協作。在這堂課提供了初學者三種微軟的解決方案,可從 Azure AI 代理服務 起步,它提供簡單的單代理整合環境;進階應用可考慮 Semantic Kernel (企業級、支援多語言與模型服務)或 Autogen (研究導向、易於實驗)。實際操作程式碼是理解這些框架最有效的方法。 第二章筆記:探索 Agent Frameworks 什麼是 Agent Frameworks ? Agent Frameworks 是協助開發人員建構 AI Agent 的工具,讓他們能夠更有效地管理 Agent 的工作、理解環境脈絡、促進 Agent 之間的協作,以及觀察與評估 Agent 的效能。 我們為什麼需要使用 Agent Frameworks ? Agent Frameworks 能幫助我們更好地控制 AI Agent,特別是在多代理協作完成任務的情境中。它們能管理上下文資訊、決定 Agent 分工、促進溝通與合作,並提供觀察與效能評估工具。 如何選擇合適的 Agent Frameworks ? 本課程關注的範疇都是微軟底下的解決方案,課程中提到了三種不同的 frameworks 以及其適合應用的情境 Azure AI Agent Service: 適合初學者與單一代理應用,可與 Azure 生態整合。 Semantic Kernel: 企業級框架,支援 C#、Java、Python 等語言,提供模型服務連接器。 Autogen: 研究導向,適合實驗與測試最新代理技術。 建議從簡單的單代理工具(如 Azure)開始,根據需求再轉向支援多代理的進階框架(如 Semantic Kernel 或 Autogen)。 Azure AI Agent Service 的主要特點 目前設計以單一代理為主,透過程式碼或 UI 使用,且能與 Azure 現有服務無縫整合,適合初學者快速上手。 Semantic Kernel 框架重點 專為企業級應用設計,支援多種語言與模型整合,注重開發者體驗,適合生產環境部署。 Autogen 框架特色 由 Microsoft Research 開發,專注於實驗與測試最新代理研究成果,是探索創新概念的好選...

[筆記] AI agents for beginners 第一課: What are AI Agents 課後心得

圖片
這將會是 AI Agents for beginners 這一系列課程 學習心得的第一篇文章,主要是記錄以學習 AI Agent 新手的角度所習得的內容以及心得收獲 TL;DR AI Agents 是一種具備 理解能力、記憶能力與使用工具能力 的智慧系統,能根據使用者的自然語言指令, 自動規劃與執行任務 。其核心由 大型語言模型(LLM) 、 記憶(短期與長期) 、以及 可操作的外部工具 組成。課程透過一個模擬旅行規劃助手的程式碼示例,展示了 Agent 如何回應使用者需求、學習偏好並調整建議。這是進入 AI 自主應用開發的重要起點。 筆記內容 這份文件是基於 "What are AI agents?" 課程第一課的內容,旨在介紹 AI Agent的基本概念、構成要素以及如何開始建構它們。本課程將帶領學習者從概念到程式碼,涵蓋建構 AI Agent 的基礎知識。 什麼是 AI Agent? AI Agent是一種能夠識別使用者請求的任務、建立完成該任務的計畫並執行該計畫行動的系統。它們結合了多個關鍵組件,使其能夠進行推理、記憶和利用工具來達成目標。 AI Agent 的核心組成部分: 大型語言模型 (LLM) : LLM 是 AI Agent 推理能力的核心。它負責解析使用者請求,理解任務,並制定執行計畫。課程中提到,LLM 的推理能力包括「識別使用者請求的任務,建立完成該任務的計畫並執行該計畫的行動」。 記憶 (Memory) : 記憶讓 AI Agent 能夠儲存和利用資訊來改進其表現。記憶分為兩種: 短期記憶 (Short-term memory) : 使用者與 Agent 之間的對話上下文,讓 Agent 能夠記住當前的互動狀況。 長期記憶 (Long-term memory) : 資料的集合,讓 Agent 隨時間在完成任務方面有所改進,例如記住使用者偏好。 工具 (Tools) : AI Agent 能夠存取和利用的外部資源或功能,以執行特定行動,例如: 透過 API 存取的服務 幫助確定採取何種行動的資料 用於向 Agent 傳送資訊的功能 AI Agent 如何運作...