MoreRSS

site iconRaymond | 雷蒙修改

94 年生,ENTJ,出生于台北。26 歲離開職場成為自僱者,經營「雷蒙三十」與「柚智夫妻」品牌,分享聰明工作、好好生活的方案。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

Raymond | 雷蒙的 RSS 预览

白話文教學:AI 怎麼幫你操控軟體?API、CLI、MCP、瀏覽器控制的選擇邏輯

2026-03-18 20:22:20

此系列文為:AI Agent 教學;一次看完整的教學系列文,歡迎加入 AI 共學島訂閱服務

怎麼讓 AI 更有效幫你控制、代操工具?

到底該怎麼讓 AI 能直接在 WordPress / Ghost 上發文、編輯標籤、優化 SEO,或者直接幫你爬 Notion Database 的資料?API 跟 MCP 差在哪裡?哪個好用?

你可能有遇過:「AI 不是很厲害嗎?怎麼連發一篇文章都搞不定?」

問題出在:你沒給它正確的工具權限讓它走了一條最笨的路

很多人(包括 AI 本身)在選擇「怎麼操控軟體」這事上,常常會選錯路線。

這一篇,快速讓你補齊 AI Agent 的基本知識,讓你知道如何讓 AI 擁有正確的工具能力


五種操控軟體的方式,一張圖看懂

AI 操控軟體的五種方式排行

前陣子好友 Yuanlin Lin(Zeabur 創辦人)在 Threads 上寫了一則很棒的科普文1,把 API、GUI、CLI、MCP、Browser Use 這些技術名詞解釋得很清楚。

我打算用我的理解方式重新整理,再加上我自己玩了三年 AI、幾個月的 AI Agent 的經驗,希望給小白、非工程師的一個快速整理。

先給你一張對照表:

方法 白話說明 速度 穩定度 誰在用
API 程式直接呼叫程式 極快 極高 工程師、AI Agent
CLI 在終端機打指令 工程師、進階用戶、AI Agent
MCP 幫 AI 包好的「工具包」 AI 工具(Claude Code 等)
GUI 你平常用的 App 畫面 普通人類
Browser Use AI 模擬人類點按鈕 最慢 最低 AI Agent(最後手段)

API:程式和程式之間的暗號

API(Application Programming Interface,應用程式介面)就是「讓程式可以呼叫另一個程式的接口」。

想像你要寄一封 email:打開 Gmail、點「撰寫」、填收件人、打內容、按傳送。這是人類的方式,也就是 GUI(Graphical User Interface,圖形使用者介面),我們看著畫面點來點去,是最直覺的操作。

但你每按一個按鈕,Gmail 背後其實都在呼叫 Google 的 API。那個漂亮的介面,只是把「呼叫 API」這件事包裝成你看得懂的按鈕。

如果你能讓 AI Agent 直接透過 API 控制,你其實就不用自己繞一圈去按按鈕?

這就是 AI 時代最核心的觀念轉換,讓軟體的操作回到本質、最簡單直接的作法。

CLI:API 的人性化版本

CLI(Command Line Interface,命令列介面)就是在終端機裡打指令。

它介於 API 和 GUI 之間 — 沒有漂亮畫面,但用人類看得懂的語言文字,例如:

gmail send --to [email protected] --subject "月報" --body "附件如附"

一行指令搞定。不用打開 Gmail、不用等畫面載入、不用點撰寫再填四個欄位。

CLI 在 AI 時代特別重要的三個理由:

  1. 比 GUI 穩定:App 會改版、按鈕會搬家,但指令格式幾乎不會變
  2. 比 Browser Use 快:不用打開瀏覽器、等頁面載入
  3. 比 API 更適合 AI 使用:指令是簡單英文單字,AI 不容易寫錯

MCP:幫 AI 預先包好的工具包

MCP(Model Context Protocol,模型上下文協議)是 2024 年底 Anthropic 提出的開放標準。

※ 未來我也會寫一篇《MCP 入門與推薦》文章,推薦一些我有安裝的 MCP。

讓我先簡單說:MCP 就是有人幫你把 API 和 CLI 包裝成 AI 可以直接拿來用的工具。

沒有 MCP 的時候,AI 要先去查文件、搞懂 API 格式、寫程式呼叫;有了 MCP,AI 直接從工具清單裡挑一個來用,幾秒搞定。

但 MCP 也有它的限制,不是什麼都用 MCP

  • 要等別人開發 MCP Server 你才能用
  • 不是所有 AI 工具都完整支援
  • 裝太多 MCP 會佔用 AI 的記憶空間(Context Window,上下文窗口)

舉個實際案例來說:Notion 官方推出的 MCP2 就比 Notion API(Application Programming Interface)功能少蠻多的;WordPress 也是

所以這兩個工具,我都還是用 API,功能全面,反正你也是叫 AI Agent 幫你讀官方的 API 文檔,也不是你自己讀,重點是功能權限能不能全開。

所以我一律都建議,直接讓 AI 幫你查:「你要的工具,在 MCP 跟 API 上,功能跟使用上的差異?」

它會直接評估後告訴你,哪個是更好的選擇,該怎麼做。

wordpress mcp vs api differences 2026 03 18 1
當你要安裝 MCP 前,可以直接問 AI,讓它給你比較表格最準

Browser Use:最後才用的大絕招

Browser Use(瀏覽器自動化操控)就是讓 AI 打開瀏覽器,像真人一樣操作網頁,點按鈕、填表單、截圖。

技術上常用的工具包括 PlaywrightPuppeteer 這類瀏覽器自動化框架。

聽起來很厲害對吧?但老實說,這是所有方式裡面最慢、最不穩定的

為什麼?因為網頁會改版。今天那個按鈕在左邊,明天改版可能搬到右邊,AI 就找不到了。

打個比方來說,你讓 AI 控制瀏覽器來發一篇電子報、填寫表單,大概要花上 5~10 分鐘,但透過 API 可能是幾秒鐘的任務。

讓 AI 模仿人類操作 vs 讓 AI 直接跟系統對話

我的實戰經驗:選錯路線的代價

跑了半年 AI 助理之後,我踩過的坑可以整理成一條很清楚的優先順序:

能用 API / CLI → 就不要用 MCP
能用 MCP → 就不要用 Browser Use
Browser Use → 是真的沒有其他路的最後手段

案例一:爬文 or 抓個人 Notion 內容

  • 錯誤路線:用 Playwright(瀏覽器自動化工具)打開 Notion 網頁 → 載入慢、格式亂、常常失敗
  • 正確路線:用 Notion API→ 3 秒拿到完美結構化資料;別人的網頁用 Firecrawl3

案例二:抓別人的 Facebook 貼文

  • 沒有 API 可用(Facebook 不開放抓別人的貼文)
  • 正確路線:這時候才用 Playwright(瀏覽器自動化)打開頁面去抓

看到了嗎?Browser Use(瀏覽器自動化)不是不好,而是它應該是你「沒有其他路」的時候才走的路。


那 Agent-Browser 呢?用 AI 操控桌面 App

最近還有一個新工具叫 agent-browser,它可以讓 AI 直接操控 Electron 架構的桌面 App:Slack、Discord、VS Code、甚至 Obsidian4

※ 背後原理是: 幾乎所有 Electron 架構的應用程式都會暴露 Chrome DevTools Protocol(CDP,Chrome 開發者工具協議)埠口(常見如 --remote-debugging-port=9222)。 只要開啟這個偵錯埠口,我們熟悉的瀏覽器自動化工具(例如 Playwright)就能像控制 Headless Chrome 一樣去操控桌面軟體了。

agent-browser 操控 Slack 桌面版的示範

聽起來很酷,但我的判斷是:對大部分人來說,目前不需要。

原因和 Browser Use 一樣 — 如果這些軟體已經有 API 或 CLI,直接用就好了。我用 Discord Bot API 發訊息,比讓 AI 打開 Discord App 去點按鈕快一百倍。

agent-browser 真正有價值的場景:某個軟體完全沒有 API,也沒有 CLI,你又非得自動化不可。這種情況在企業內部的老系統比較常見,一般人很少遇到。


延伸閱讀:想知道讓 AI 看懂網頁的具體工具比較,可以看這篇 讓 AI 助理看懂網頁:三大抓取工具完整比較


一個簡單的決策流程

下次你想讓 AI 幫你自動化某件事,可以照這個順序想:

1. 這個服務有 API(應用程式介面)嗎?
   → 有:直接用 API(最快最穩)

2. 有人做好 MCP(模型上下文協議)了嗎?
   → 有:裝 MCP,讓 AI 直接用(方便)

3. 有 CLI(命令列工具)嗎?
   → 有:讓 AI 下指令(快又穩)

4. 以上都沒有?
   → Browser Use / agent-browser(最後手段)

大部分主流服務(Notion、Google、WordPress、GitHub、Slack)都有 API,所以你幾乎不需要走到第 4 步。


想從零開始學 AI 自動化?推薦閱讀:100 小時掌握自動化工作術;或看看 21 天我用 Claude Code 打造了一整套 AI 分身助理的實戰紀錄。


給非工程師的重點整理

如果你不是工程師,記住這幾件事就夠了:

  1. AI 操控軟體的最佳方式是 API(應用程式介面)和 CLI(命令列介面),不用模擬人類去點按鈕
  2. MCP(Model Context Protocol,模型上下文協議)是幫你把 API 包裝好的工具包,讓 AI 可以直接用,不用自己寫程式
  3. Browser Use(瀏覽器自動化)是最後手段,不是預設方案,速度慢、容易壞、而且貴(消耗大量 token)
  4. 選對路線的差距是秒和分鐘的差距,長期累積下來影響巨大

讓 AI 用它擅長的方式工作(API、CLI),而不是逼它模仿人類的方式工作(點按鈕)。這是 AI 時代最重要的自動化觀念。

還有一點,現在我選擇工具時,如果沒有開放 API 的工具,基本都是不考慮的


延伸閱讀


文章註腳

  1. Yuanlin Lin — 一篇文章看懂 API、GUI、Browser Use、CLI、MCP、Skills:本文的靈感來源,從工程師角度的完整科普 ↩︎
  2. Notion MCP 官方文檔 ↩︎
  3. 關於怎麼讓 AI 助理快速看懂網頁、爬內容抓下來?請看「Firecrawl, Playwright, WebFetch 比較教學文↩︎
  4. Obsidian 2026 年推出 CLI,一律推薦讓 AI Agent 讀這個官方文檔使用。 ↩︎

讓 AI 助理看懂網頁:Firecrawl、Playwright、WebFetch 三大抓取工具完整比較

2026-03-16 23:50:31

問題:AI 看不到網頁內容、無法爬蟲、分析資料?

你有沒有遇過這種情況?

你:「幫我看看這篇文章在講什麼」(貼了一個網址)
AI:「抱歉,我無法直接存取網頁內容...」

這是因為 AI 助理本身看不到網頁,如果他手上沒工具。

解法:給 AI 一組工具,讓它可以「出門看網頁」。

目前主流有三種工具,各有擅長的場景。這篇會幫你搞懂:什麼時候用哪個、怎麼裝、怎麼設定。


三個工具是什麼?用餐廳比喻

AI 助理看網頁的三種方式

想像你想知道一家餐廳的菜單內容:

Firecrawl — 外送平台

你打開外送 App,搜尋餐廳名稱,App 直接把菜單整理好給你看:菜名、價格、照片,排版清清楚楚。

  • 優點:最快、最乾淨、自動整理格式
  • 缺點:如果餐廳沒有上架外送平台(像是私人社群),你就看不到
  • 費用:免費額度每月 500 次,一般使用綽綽有餘

Playwright — 親自走一趟

你出門搭車到餐廳,坐下來翻菜單、跟店員對話、拍照記錄。什麼都看得到,因為你就在現場。

  • 優點:什麼都能看到(包括需要登入的內容、社群貼文)
  • 缺點:比較慢(要開瀏覽器、載入頁面)
  • 費用:完全免費

WebFetch — 打電話問

你直接打電話給餐廳:「請問你們有什麼菜?」對方口頭念給你聽。

  • 優點:最快、零成本
  • 缺點:如果菜單是寫在黑板上的(動態網頁),電話裡聽不到
  • 費用:完全免費

完整比較表

Firecrawl Playwright WebFetch
一句話定位 雲端爬蟲,AI 優化輸出 真實瀏覽器自動化 簡易 HTTP 請求
輸出格式 乾淨的 Markdown 網頁 DOM / 截圖 HTML 轉 Markdown
處理 JavaScript ✅ 可以 ✅ 可以 ❌ 不行
社群媒體 ❌ 會被擋 ✅ 唯一選擇 ❌ 拿到空殼
需要登入的網頁 ❌ 不支援 ✅ 可以模擬登入 ❌ 不支援
速度 ⚡ 快(2~5 秒) 🐢 較慢(5~15 秒) ⚡⚡ 最快(1~2 秒)
費用 免費 500 次/月 完全免費 完全免費
安裝複雜度 需要 API Key 需要安裝瀏覽器引擎 內建,不用裝

什麼時候用哪個?決策流程

收到一個網址,想讓 AI 看內容
    │
    ├─ 是 Notion 頁面?
    │   → 用 Notion API(永遠不用爬蟲工具)
    │
    ├─ 是社群媒體?(FB / IG / Threads / X)
    │   → 直接用 Playwright
    │
    ├─ 是靜態網頁?(GitHub、API 文件、技術部落格)
    │   → 先試 WebFetch(最快),失敗再換
    │
    └─ 一般網頁?(新聞、部落格、產品頁面)
        → 先用 Firecrawl(預設首選)
            ├─ 成功 → 完成
            └─ 失敗 → 換 Playwright

記住這個優先順序:

FirecrawlPlaywrightWebFetch

社群媒體例外,直接跳到 Playwright。


安裝與設定

前提

你已經安裝了 Claude Code(如果還沒,先看 Claude Code 完整入門教學)。

這三個工具都可以透過 MCP(Model Context Protocol)簡單連接的。

► 如果你不知道 MCP 是什麼,先看 MCP 設定入門(系列文章,敬請期待)。


Firecrawl — 雲端爬蟲

Step 1:取得 API Key

  1. firecrawl.dev 註冊帳號
  2. 進入 Dashboard → API Keys
  3. 點「Create API Key」,複製 Key

Step 2:設定 MCP

在 Claude Code 的 MCP 設定檔加入:

{
  "mcpServers": {
    "firecrawl": {
      "command": "npx",
      "args": ["-y", "firecrawl-mcp"],
      "env": {
        "FIRECRAWL_API_KEY": "你的 API Key"
      }
    }
  }
}

Step 3:測試

跟 AI 說:「幫我用 Firecrawl 看一下這個網址的內容」,貼上任意網頁連結。

額度說明

  • Hobby Plan(免費):每月 500 credits
  • 抓一個網頁 = 1 credit
  • 遞迴爬整個網站 = 每個頁面 1 credit(小心使用)
  • 以一般用量來說,一天抓 10~15 個網頁,免費額度用不完

Playwright — AI 用的瀏覽器

Step 1:安裝瀏覽器引擎

打開終端機,執行:

npx playwright install chromium

這會下載一個 Chromium 瀏覽器(約 200MB),AI 會用它來「打開」網頁。

Step 2:設定 MCP

{
  "mcpServers": {
    "playwright": {
      "command": "npx",
      "args": ["@anthropic/mcp-playwright"]
    }
  }
}

Step 3:測試

跟 AI 說:「幫我用 Playwright 打開這個 Threads 貼文,把內容抓下來」。

使用情境

  • 抓 Facebook / Instagram / Threads 的公開貼文
  • 需要截圖的場景(AI 會幫你拍網頁畫面)
  • 需要互動的網頁(點按鈕、填表單、滾動頁面)

WebFetch — 內建工具

不用安裝! 這是 Claude Code 內建的功能。

直接跟 AI 說:「幫我看一下這個 GitHub 頁面在講什麼」,它就會用 WebFetch 去抓。

適合場景

  • GitHub README、API 文件
  • 技術部落格(通常是靜態網頁)
  • 任何不需要 JavaScript 渲染的簡單頁面

不適合

  • 社群媒體(拿到空殼)
  • 需要登入的網頁
  • 重度使用 JavaScript 的 SPA 網站

常見場景對照

我想做的事 用哪個工具 原因
看一篇部落格文章 Firecrawl 輸出乾淨,格式好
抓一篇 Threads 貼文 Playwright 社群媒體只有它能抓
看 GitHub 上的 README WebFetch 靜態頁面,最快
抓 Facebook 粉專貼文 Playwright 社群媒體
查一個 npm 套件的文件 WebFetch 靜態頁面
把一整個網站的內容爬下來 Firecrawl(crawl) 支援遞迴爬取
需要網頁截圖 Playwright 唯一能截圖的
看一篇新聞報導 Firecrawl 新聞網站通常有複雜排版

三個教訓

在實際使用這些工具的過程中,我學到幾件事:

1. 社群媒體不要浪費時間試 Firecrawl

FB、IG、Threads 這些平台會封鎖雲端爬蟲的 IP。每次嘗試都要等它超時失敗才換下一個,白白浪費時間。看到社群媒體的網址,直接用 Playwright。

2. 不要小看 WebFetch

很多時候你只是想快速看一下某個頁面的內容,WebFetch 一秒就搞定。不是所有場景都需要出動 Firecrawl 或 Playwright。

3. 了解「Threads 官方 API」的限制

即使你裝了 Threads API,它也只能操作你自己帳號的貼文(發文、回覆、看數據)。想看別人的貼文?只能靠 Playwright 去「看」公開頁面。這不是工具的問題,而是平台的設計。


💬 想知道更多?歡迎留言給我

或者訂閱免費電子報:https://lifehacker.kit.com/ai-agent

我有打算陸續寫成系列文章,到時候也發信通知你。


總結

一般網頁 → Firecrawl(乾淨快速)
社群媒體 → Playwright(唯一選擇)
靜態文件 → WebFetch(秒速完成)
Notion    → Notion API(專用工具)

三個工具互相補位,覆蓋了 95% 的網頁抓取場景。不用額外花錢買第三方服務,這個組合就是目前 AI Agent 生態圈最主流的配置。


相關閱讀:MCP 設定入門(系列文章,敬請期待)、Claude Code 完整入門教學

21 天,我用 Claude Code 打造了一整套 AI 分身助理記錄

2026-03-13 15:49:30

開場

2 月 8 日深夜,我看完吳哲宇用 OpenClaw + Claude Opus 打造的 AI 助理「Muse」之後,做了一個決定:不用現成的框架,從記憶系統開始,自己蓋一套 AI 人生管理系統。

21 天後的今天,我回頭看,發現這不只是一個「工具專案」。它變成了我的隨身開發助理、工作自動化管家、內容助手,甚至是我的智能家庭管理員。

這篇文章,我想完整記錄這 21 天到底發生了什麼事。

(補充個 murmur,這篇其實 2/28 就寫完了,但後來一直有個很討厭的心態卡著我;我一直在煩惱這系列該怎麼發佈比較好,例如還有一篇草稿叫「如果 2026 年要學 AI Agent 的話,要從哪裡開始」,感覺是不是要當第一篇?結果被自己的「想太多」給拖延了。後來覺得,我何必呢?現在又不是要打造成有系統的課程,只是發個學習筆記,不要思考太多,一直卡在腦袋反而讓我壓力好大。)

所以今天打算把它給發了,突破自己心魔!今年要好好練習,有想法就發,不要一直囤著,這個壞習慣一定要改掉。

228寫好結果一直囤著忘記發-2026-03-07
2/28 寫好,結果一直囤著忘記發

Day Zero:為什麼不用現成的?

先說結論:我研究完龍蝦(OpenClaw)1之後,決定不用它

因為我需要的不是一個「別人幫我套裝好的機器人」,我需要的是,從頭打造、瞭解過程,個人化定制。

打個比方來說,如果用別人幫你打包、套裝好的,就像是領養一個已經 20 歲的成年人,雖然馬上能幹事、也能持續訓練,但你跟他少了 20 年羈絆,你連他怎麼長大的都不知道。

對於我這種樂趣來自「體驗未知、探索過程」的人來說,少了那一丟丟趣味,加上我想要的不只是一個「幫我做事」的工具。我更想要的是,跟著這個 AI 一起進化,讓它記得我是誰、知道我在做什麼、能一起討論、思考工作流和生活上的優化,不僅僅只是幫我做事的 AI 分身。

在 2025 年前,市面上的 AI 應用工具,都有一個根本的問題:它們沒有長期記憶。每次對話都是從零開始。你昨天跟它講的偏好,今天它完全不記得。但有記憶的像是 ChatGPT、Gemini 這些,又只是「網路對話 AI 機器人」,功能不夠全面,很多想讓 AI 代操的任務需求無法做到。

所以龍蝦就是做到「記憶功能強」+「操作介面直覺」+「自帶大量工具」才會如此火爆出圈。於是我的第一步,不是做什麼酷炫的事,專注先讓 AI Agent 擁有好的記憶機制,他才能隨著跟我的工作習慣,哪邊讀取我累積 10 年的內容知識庫、我有用哪些工具,它有哪些權限,知道該朝哪持續進化。(通俗一點來說:畫個大餅,指好願景


第一週:讓 AI 記住我(2/8 — 2/14)

為什麼要從記憶系統開始蓋?

講記憶架構之前,先說一個很根本的問題:為什麼我要把所有東西放在 iCloud 裡,而不是用一般的開發方式?

因為我不只是個開發者,我還是個創作者。

我平常在外面,隨時會需要打開 Obsidian 看草稿、記靈感、查任務進度。我的 Mac mini 24/7 掛著跑 Bot 和自動化,MacBook 是外出工作用的主力機,iPhone 和 iPad 則是隨手查看和輕量編輯。這些裝置如果各自一套系統,我的腦袋會先爆掉。

所以我選了 iCloud 作為整個系統的中樞——所有文檔、記憶、設定,Mac mini、MacBook、手機的 Obsidian,全都看到同一份檔案。

但問題來了:Claude Code 每次開新對話,什麼都不記得。 就算你上一個 session 跟它講了三小時的偏好和專案背景,下一個 session 它完全從零開始。

這就是為什麼「記憶系統」是我蓋的第一個東西,先是讓 AI 在跨裝置、跨時段使用時,不會忘掉我前幾個小時到底在做什麼事情。

(是不是跟養小孩很像?最一開始,你不會去要求他能有多厲害,會多少才藝,是能不能讓它記住你。)

三層記憶架構

我設計了一個三層記憶系統:

  1. MEMORY.md(精煉摘要):每次對話自動載入的前 200 行,存放我的偏好、進行中專案、踩坑筆記。相當於 AI 的「短期工作記憶」。
  2. memory.json(知識圖譜):透過 Memory MCP 建立的實體關係網路。能查詢「雷蒙用過哪些工具」「這個專案跟哪些系統有關」這種關聯性問題。
  3. daily/*.md(每日日誌):每次 session 結束自動寫入的時序紀錄。需要回溯「上週二我們討論了什麼」的時候翻這裡。

核心設計原則是:AI 不需要記住所有細節,但需要知道去哪裡找。

Kairos Discord Bot:第一個「主動推送」

光有記憶還不夠。我希望 AI 能主動找我,而不是等我打開終端機。

所以我在 Mac mini 上部署了 Kairos Discord Bot。一個 24/7 運行的 AI 助理,透過 Discord 私人頻道跟我互動。它每天早上 9 點推送工作簡報,晚上 10 點推送今日回顧,中間還會自動策展社群上值得關注的內容。

延伸閱讀:關於 Kairos 如何用 Claude Code 打造?可以先看 Claude 入門?非工程師也能上手的完整入門教學

技術上是 Python + discord.py,背後呼叫 Claude CLI 來處理所有的 AI 推理。一開始很陽春,但它代表了一個重要的轉變:從「我去找 AI」變成「AI 來找我」

第一週結束時,系統已經能跨設備同步記憶(Mac mini + MacBook 透過 iCloud),Bot 也穩定在跑一些自動化任務了—— 例如早報彙整消息、晚報復盤今日工作學習。


第二週:從自動化到生活整合(2/15 — 2/21)

這一週是爆發期。系統有了記憶和主動推送之後,我開始把各種生活和工作流程接進來。

Gmail 自動化信箱助理

身為一個內容創作者,每天要處理大量的合作邀約、學員客服、講座邀請。以前全部手動處理,每天花 30-60 分鐘在信箱裡。

現在的流程是:

Gmail 收信 → n8n 自動分類 → 寫入 Notion CRM
→ AI 產生回信草稿 → 我只需要審核、潤飾 + 送出

(對 n8n 自動化工作流不熟的話,可以先看這篇入門系列。)

關鍵的踩坑經驗是:回信的模式(回覆/忽略/轉交)必須由 Gmail 標籤決定,絕對不能讓 AI 猜。一開始我讓 AI 判斷要不要回信,結果它把幾封重要的合作信分類成「不需回覆」。後來改成用 Gmail 標籤作為 single source of truth,AI 只負責「依照我過去回信的標準」來生成 80% 的草稿內容,最後優化&寄出在我手上。

Home Assistant 智能家庭

這是我完全沒預期到的副產品。

某天晚上我在設定 HomePod 的 AirPlay,怎麼都配對不成功。我就順手問 Claude Code 能不能幫我查(給了它我家的 HA API 還有 NAS 權限),結果它不只幫我找到問題,還順便幫我重寫了 5 個自動化腳本:

  • 離家自動化:偵測所有人離開 → 關燈 + 關電視 + 調整空調
  • 回家歡迎:開門 → 玄關燈亮 → 客廳燈漸亮 → 播放音樂 → 玄關燈關
  • 廚房人在偵測:mmWave 感測器偵測到人 → 開燈;離開 → 關燈
  • 夜間色溫鎖定:18:00 後全屋鎖定 3500K 暖色溫
  • OpenAI TTS 語音播報:用 GPT-4o-mini-tts 語音合成,透過 HomePod 播放通知

一週之內,從「每次要自己進 HA,覺得很麻煩就一直提不起進去做」,變成了「只要出嘴」的智能家庭助理幫我調查、排錯、設定。這件事讓我深刻體會到,有了 AI 協作之後,很多「以前覺得太麻煩所以一直沒做」的事情,突然變得可以做了

家庭財務管理 Dashboard

另一個「終於做了」的專案。我也把家庭財務的記帳、資產系統建立起來了。

目前只有現金又沒發票的情況下,打開 Discord 跟它說聲:「金園排骨午餐 260 元」,它就會自動幫我記帳、分類,不用打開 APP,不用選分類,還會跟我說「金園排骨,懷念的選擇,我記下來了!」

因為每個月底我只要到雲端發票一次下載 csv,匯入,我們家的所有消費就全部出來,一眼就能看到分類和定期扣款的訂閱費用。

雖然叫他怎麼對帳、去重、分類的機制花了不少時間,但未來完全不用再記帳和財務管理上開一堆 APP,10 幾年累積省下的時間一定更可觀。

目前還整合了美股,除了能看到 Interactivebrokers 盈透證券、Firstrade、台股、支出的整合視圖。以前覺得太複雜就一直擱置,但有了 Claude Code 之後,我只需要描述需求,它就能幫我把 API 串接、資料管道、前端介面全部做好。

最後做出來的版本包含:多平台持倉總覽 + USD/TWD 即時匯率 + 分類支出追蹤 + 週期性付款管理 + 物品到期提醒。

※ 以下截圖的數字為 Demo(還特別做了假資料來展示 😆)


第三週:系統自我演化(2/22 — 2/28)

到了第三週,一個有趣的事情發生了:系統開始優化自己

透過每週自動跑的 /insight 回顧功能,AI 會分析過去一週的所有 session 紀錄,找出重複的摩擦點和可以優化的地方。這讓系統有了「自我反省」的能力。

CLAUDE.md 瘦身:從 768 行到 120 行

CLAUDE.md 是 Claude Code 每次對話都會載入的核心指令檔。隨著功能越加越多,它從最初的幾十行膨脹到了 768 行。問題是:太長的指令會佔用 context window,降低 AI 的表現。

我花了幾天時間做「知識正確分層」:

  • 核心規則留在 CLAUDE.md(120 行)
  • 領域知識搬進 15 個獨立的 Skills(按需載入)
  • 動態記憶放在 MEMORY.md(200 行以內)
  • 一次性決策只記在 daily log

這個過程本身就很像在做人腦的「記憶整理」——不是什麼都要隨時記住,而是建立一個好的索引系統,需要的時候知道去哪裡找。

Skill 品質保證:AI 審 AI

當 Skills 數量到了 15 個,品質控制變成一個問題。我做了一個有點 meta 的東西:用 AI 來審核 AI 的 Skills 品質。

skill-creator v2.0 有 4 個 eval agents:reviewer(逐行審查)、grader(評分)、comparator(跟標準對比)、analyzer(統計分析)。每次建立或更新 Skill,都會自動跑一輪品質檢查。

截圖合成 + AI 配圖

寫教學文的時候,配圖一直是痛點。我做了兩個工具:

  1. screenshot-composite:自動截圖 + 品牌背景合成。踩了一個大坑——Playwright Extension 模式的 DPR 永遠是 1,怎麼設都拿不到 Retina 解析度。最後改用 Chrome CDP 模式才解決。
  2. Gemini 配圖生成工作流:輸入概念描述,自動生成 2K 解析度的資訊圖表。用於教學文的概念圖配圖。例如在「【迷你課】24 小時開始成為遠距工作者」裡的配圖,很有品牌感就是我直接把網址給 AI 說:「看一下這產品介紹頁,有什麼建議配圖嗎?直接生成」,就出現了:
迷你課-24小時開始成為遠距工作者-2026-03-13
▲ 截圖合成 + AI 配圖的實際成果,右下角自動帶品牌浮水印

基礎設施:那些不起眼但很關鍵的事

除了大型專案,二月也做了大量的基礎設施優化:

  • iCloud + Obsidian 效能手術:Vault 從 14GB 瘦到 900MB(用 .nosync 把 node_modules、venv 等開發產物隔離在 iCloud 同步之外)
  • Python 全面升級:3.9 → 3.13,淘汰了 EOL 的舊版本
  • Ghost 託管成本降 40%:$20/月 → $11-12/月(Cloudflare CDN + 關閉多餘服務)
  • Zeabur 專屬主機:從共享升級到 Linode Tokyo 專屬($12/月)2
  • HappyCoder 退役:原本用第三方工具遠端操作 Claude Code,後來 Anthropic 出了官方的 Remote Control,直接換掉
  • 權限模式升到 Bypass:讓 AI 完全自主操作,搭配安全防護(rm → trash、Git 保護規則)
  • Bot Watchdog:crontab 每 15 分鐘自動檢查 Bot 是否存活

內容產出

在做這些系統建設的同時,也沒有停下內容產出。事實上,很多文章就是在建系統的過程中順手寫的——踩了坑就記錄、學到新東西就寫教學。


回頭看:這 21 天到底改變了什麼?

如果要用一句話總結,我會說:AI 從「工具」變成了「夥伴」。

具體來說,有五個本質性的改變:

  • 記憶從零到完整:以前每次對話都要重新解釋背景。現在 AI 記得我的偏好、我的專案進度、我上次做到哪裡、甚至我踩過什麼坑。
  • 從被動到主動:以前是我需要的時候才打開 AI。現在 Kairos Bot 每天主動推送資訊、信箱自動分類產生草稿、智慧家庭自動運作。
  • 從單機到多設備:Mac mini 24/7 運行所有自動化、MacBook 外出工作無縫接續、iPhone 透過 SSH 遠端操作。整個系統不再依賴單一裝置。
  • 從零散到系統化:15 個 Skills、12 個觸發詞 Workflow、Git 規範、檔案歸檔——每個重複性的工作都有了 SOP。不是「每次想辦法」,而是「系統自動跑」。
  • 從指令執行到 AI 分身:最後一個,也是最微妙的變化。到了月底,AI 的權限升到 Bypass,它會主動提議記錄知識、建議寫教學文、發現可複用模式時主動問要不要建 Skill。它不再只是執行指令,而是在共同思考

寫在最後

這套系統還遠遠不是完成品。但 21 天的密集建設之後,它已經在真實地改變我每一天的工作方式了。

你可能會覺得我很厲害,我有工程背景?但其實都不是,只是因為 AI 已經成熟到「出錯率大幅下降」。

一年前的 AI,你可能寫一段程式碼,或是提一段需求要它做一個工具、幫你設計一個工作流,可能每 10 次會有 5 次需要修正。但因為大部分人,沒有比較完善的程式碼或是資訊知識,所以讓你修 5 個錯誤你也不知道怎麼修,最後就打結了,這也是為什麼大家覺得不好用。

但現在你可能跟他提 30 個需求,可能只會有 1 個會遇到錯誤,而且這個錯誤,只要你有方法地跟他來回提問、引導,它就會自己把錯誤解決掉。我現在不需要自己寫每一行程式碼。我需要的是:清楚知道自己要什麼、能判斷 AI 給的方案好不好、以及願意花時間把系統磨到堪用。

也就是說,2026 年的 AI 讓「描述需求 → 創造 something」的門檻大幅降低了。

但但但,這一切的前提,我發現有兩個:

第一是,你對自己的工作和生活極度熱愛。只有熱愛了,你才會更想把時間精力專注在這些重要的事情上,把其他一切瑣事排開。

第二是,你會願意拋棄過往習慣的方式,甚至擁抱「變差」這件事。因為在一開始投入、養它的這三週,基本上工作量是 200% 在起飛,帶來的成效也不明顯。但你得相信做這件事,是有意義的,是會讓你跟它都更好的。

雖然我還沒養過小孩,但我相信 5 歲以前的半獸人都是最辛苦的,所有好的爸媽,也是因為相信這回事,所以變成更好的人。

如果你也在想「AI 到底能不能真的幫到日常生活和工作」?
歡迎持續關注我,我盡量每天排些時間,把一些囤積的筆記發出來,或許對你有些幫助。

💬 想知道更多?歡迎留言給我

或者訂閱免費電子報:https://lifehacker.kit.com/ai-agent

我有打算陸續寫成系列文章,到時候也發信通知你。

如果你也在想「AI 到底能不能真的幫到日常生活和工作」?

我的經驗是:能。但你得從記憶系統開始蓋,當作買一塊土地,按照自己的需求慢慢蓋房子,不要直接去買已經被蓋好的房子,你裝修起來限制會很多,也可能很多功能用不上。雖然打造起來會比較久,但你能 100% 掌握,自己理想的空間、協作的 AI 夥伴。

新時代的電子雞,不只好玩,而且有用。

📍 AI Agent(Claude Code、Codex)系列教學文章


文章註腳

  1. 如果你有想養龍蝦 OpenClaw,可以試試使用 Zeabur 平台,就不用讓自己電腦直接完全被授權,也更安全。 ↩︎
  2. 之後會寫一篇,怎麼選 Zeabur 上的「專用主機」?以及怎麼把舊的專案都搬到新主機。 ↩︎

#175 – Notion 入門線下課登場 / 非工程師的 Claude Code 旅程 / Manny 來了 ®️雷蒙週報

2026-03-08 23:20:52

📸 第 175 期(2026-02-26 ~ 2026-03-08)封面照片:Notion 實作班首場現場

嗨!昨天辦了第一場 Notion 入門實體班,算是圓滿!雖然不是我講,但還是累壞了(一個懸掛的心終於能稍微放下哈哈)

這產品在內部的別名叫做「象山班」(相比訓練營為玉山班 🤣),只收 25 名學生,小班制,出動 4 位助教,在犇亞台北教室,手把手協助學員從 Notion 的底層區塊邏輯到資料庫的基礎。

課後回饋整體 9.1 分、助教評價 9.6 分,以第一場來說還行,讓我最有感的是這條回饋:

「我是訓練營的陣亡學生,這次實體課讓我卡關的地方都被解決了,希望未來多開!」

看來我們當時選擇做實體課的目的有達成:接住線上課程沒被接住的人。

雖然我很喜歡線上自學,可以更自由地安排時間,可以不用這麼尷尬的人與人面對面,但不是每個人都適合純線上學習。有些人就是需要一個空間、一群人、一個可以馬上舉手問的助教。這件事我以前知道,但親眼看到學員從「這是什麼」到「我懂了」的表情變化,才真正體會到。

這場大多的回饋是「內容豐富、時間太短」、「下午進到資料庫後比較聽不懂,要回家多練習」。

五月場要調整的核心很清楚。線上教材跟實體講義要能互補,實作多些,至少讓每個人帶走兩個成果:個人首頁*1(區塊運用能力)、一個主題資料庫(資料庫內容管理方法)。

這週另一件重要的里程碑,是發了一篇 Claude Code 完整入門教學 (這幾天破 29 萬瀏覽量)。把我這個非工程師過去 20 天用 Claude Code 蓋出 AI 分身的過程,整理成一篇精華記錄。從比較現有的 AI 工具到實際應用,希望降低大家嘗試的門檻。未來也計劃,每週把囤在自己筆記系統的學習筆記分享出來,最近正在重新優化 Readwise Reader 的閱讀學習流,下週再來分享我做了什麼改變。

教學的本質,是把你走過的路,鋪成別人能走的路。

不管是在開始推出 Notion 實體班,並由 Notion 訓練營的助教來主講(因為他們就是從零開始學習,並活用在生活工作上的一群人),還是在部落格上寫著 Claude Code 學習過程,都是同一件事。


最後還有件小事想記錄。

週六晚上實作班結束,先是教學團隊的復盤晚餐,吃完後八點多,滑手機發現第十屆的學員竟然也在台北有場見面會——其中還有從美國回來的同學。但餐廳地點有點遠、時間也晚了,有些教學夥伴還得趕回南部,我跟柚子本來打算就在 Discord 上參與互動就好,不過去了。

但後來,我們還是去了。

因為有些人,你不知道下次再見,會是什麼時候。

其中有位學員 J,讓我印象很深刻,人在美國,卻還是跨了十幾個小時的時差跟大家一起上課,我們晚上八點直播,他要早上六點起床參與。後來才知道,他太太前幾年離世了。他在訓練營的最後專案作品,做了一個給太太的回憶錄,也留給自己的兒子跟女兒。那一屆好多同學看完,都被這真摯的作品給打動了。

他用幽默、快樂的聲音說,他正在考慮辭職,雖然他還沒到退休的年紀,但女兒、兒子也 20 多歲有自己生活了,比較想回來臺灣,或到日本學語言,開一段沒有目的地的旅行,開啟自己的第二個人生。我很支持他,也很欣賞他那種「經歷過低谷,還是選擇往前走」的勇氣。

那天晚上快散場時,他把我拉到旁邊,說了一段話。大意是:

謝謝你們創造了這樣的環境,讓不同職業、不同年齡、但都很認真生活的人,有機會相遇。

他的原話比這更溫暖,更有重量。我一時不知道怎麼接,只覺得,其實我也很謝謝他和這些同學。在十幾度的夜晚,一起站在台北車站前的公園裡吹著冷風,跟一群原本只是在網上一起學 Notion 的人,聊近況、聊目標,聊著彼此的人生階段。

第十屆 Notion 訓練營學員台北見面會合照

相聚只有十幾分鐘,卻讓人覺得很溫暖、很熟悉。

這天從教室到公園,我反覆想到同一件事:我們做的從來不只是課程或工具。是替認真的人,留一盞燈。 不管是在實體課終於搞懂資料庫的「陣亡學生」、從美國飛回來,還是那些自己揪團、約聚會的每一位學員;他們找的不只是一堂課,是一個願意接住彼此、持續成長的地方。

當成員開始自己創造連結,這個社群就不是只需要你一直餵養內容了,這也是我的理想狀態。我很幸運,也很開心。接下來,我會繼續趁這沒有訓練營的上半年,訓練好 AI,把日常營運都交出去,把時間釋放出來,讓我能去做些,只有我才能做的重要事。


🤝🏼 重要活動:Manny 直播對談(免費場)

本週五(3/13)晚上 19:30,第四場【超級個體|職人策略課】直播,邀到了 Manny。

不露臉的品牌經營 2026 03 13

我認識 Manny 是 2020 年,那時我剛開始做付費訂閱服務,常常去研究有在創作的人怎麼寫字。覺得他的文字讀起來很順,吐嘈感恰到好處,加上知道他有寫遊戲的粉專,聊起我很喜歡的《原神》就開始追了。

後來慢慢知道他的故事——從遊戲產業分析師、到新創公司,再到推出付費內容訂閱服務《曼報 Pro》,不露臉卻做到近萬人付費訂閱。他跟我很像的一點是,曾經為了追求真正想做的事,數次大幅降薪或轉職,她說:

「我這輩子找工作都是找我想要做的。」

這個 mindset 跟我的路徑很像——好不容易苦讀到成大化工系卻轉系延畢、講師做到年收百萬卻跑去北京從零開始、大公司裡當專案負責人又因為「這不是我想做一輩子的」再次歸零創業。

短短幾年,爬上山峰,看看風景又轉向歸零,只為了找到「什麼是自己技能快樂又能享受痛苦的 Work」。

你也是《曼報》訂戶嗎?有什麼想問問 Manny 的?

記得報名活動,下週一起來交流,歡迎留言留下,如果你遇到他,會想問問他的問題~


📍 本週&即將的重要活動和消息?

  • 3/13(五)19:30 — 超級個體職人策略課 #4|Manny:不露臉、近萬人付費訂閱,為何他要「讓自己不重要」→ 報名連結
  • 3/25(三)城邦學院一人公司創業活動 — 分享從「賣時間」到「建系統」,一人公司如何走出埋頭苦幹的困境
  • Notion 實體實作班 — 5/9、6/6、7/11 三場已排定,預計在四月開放報名,請記得「訂閱電子報」獲得最新資訊。

這週,我的輸入和閱讀?

—文章和學習筆記—

📖 Angie 新書《臺灣製造》— 最難的不是出走,而是回家

參加了之前合作過的 Paul Millerd 的人生伴侶 Angie 的新書發表會。這本書聊的是台灣社會中,名校和主流成功標準帶來的隱形枷鎖。自費出版、有上誠品通路,整場發表會讓人思考:那些我們以為理所當然的「應該」,到底壓住了多少人?

💬 一人工作最危險的狀態:埋頭賣時間

一個人或小團隊最危險的狀態,不是沒客戶,而是有客戶但只會埋頭接案賣時間,沒有停下來思考綜效。從「每小時值多少錢」到「我的系統每小時能產出多少價值」,這中間的轉換是超級個體最關鍵的一步。

🏝️ 用五年打造付費會員社群,怎麼樣了?

趁著新年,把我們經營「生活黑客群島」付費訂閱社群這五年的事,用時間軸梳理了一遍。從 2020 年疫情回台、兩個空行李開始錄 Podcast,到現在有了訓練營、年會、共學團、線下運動活動。這座島,是我們本來沒預期,但一起養大的。

🎨 Anthropic 設計主管:設計流程已死

來自 Claude設計主管 Jenny Wen 在 Lenny’s Podcast 的訪談。當工程師用 AI 能快速實現功能,設計師的時間分配也翻轉了——從 60-70% 畫設計稿,變成 30-40% 設計稿加上 30-40% 直接跟工程師配對工作。Figma 不再是交付工具,而是做空間探索、比較十種不同做法的地方。但對我更有啟發的是,如何選人的標準,完全改變了。我也特別認同這一塊。

—數位工具和 AI 應用—

🤖 非工程師這 20 天用 Claude Code 做了啥

這篇是我花了不少心力整理的完整入門教學。從安裝開始,到我怎麼用 Claude Code 建出 Discord 機器人、自動推送早報、日記生成、資料抓取——全部都是不需要寫程式的人也能做到的。如果你對 AI 寫程式有興趣但一直不知道怎麼開始,這篇就是為你寫的。

📊 Notion Slide — 頁面一鍵變簡報

Notion 新推出 Slide 功能,頁面加個分隔線就能自動分頁變簡報。支援摺疊列表互動和圖片放大。雖然不會取代 Keynote 或 PowerPoint 做精美簡報,但拿來做「用筆記直接上場報告」這個場景非常方便。

✂️ 貼文審稿精華工具 — 讓 AI 學你的寫法

自己做了一個小工具,把過往寫得好的貼文整理成「精華資料庫」,拿來訓練 AI 分身的寫作風格。用 Claude 在通勤回家路上就開發完了——有了 AI,連零碎時間都能拿來做有意義的小專案。

🎯 Claude 額度快到期?用 /insight 來復盤

每週五額度重置前,如果還剩 20% 以上,我會用 Claude Code 的復盤指令,讓它回頭分析這週的對話品質和自己的使用模式。額度要到期了不用浪費,用來看看自己怎麼跟 AI 協作可以更好。

—過往的這一天,好內容回顧—


🔍 雷蒙三十會員限定內容&學員見證:

👉🏼 點此加入Lifehacker Premium 會員


Claude Code 是什麼?從 Claude Cowork 到 Code,非工程師也能上手的完整入門教學

2026-03-06 14:33:54

大部分人經過這 AI 時代的三年,可能有用 ChatGPT、Google Gemini 了,問它問題、請它幫忙翻譯、整理會議紀錄。

但最近一直廣受各公司、老闆、開發者、一人公司創業者推崇的 Claude Code 到底是什麼?我用一篇白話文,快速跟你說說,展開比較,讓你有個判斷,評估你「你適不適合加入」。


先說前提,我可能跟你一樣,不是工程師,大學不是相關科系,也沒學過如何寫程式。

不過過去這三週,我用「自然語言」,純粹用打字跟語音說話,跟我的 AI 分身助理聊天,讓它幫自己打造了一整套「工作和生活管理系統」1。它幫我寫了一個 Discord Bot,每天早上自動推送今天的重要信件、行事曆和待辦事項;每晚自動整理我一天的數位足跡,寫成日記初稿。它能幫我自動抓 Facebook 貼文、建立合作夥伴資料庫、整理人脈互動記錄,甚至幫我把這一週的學習直接彙總,跟我進行對話跟復盤。

但在直接跟你介紹 Claude Code 之前,我想先幫你建立一個清楚的框架。因為現在 AI 工具太多了,如果不先搞懂「它們各自能做到什麼程度」,很容易一頭霧水。(我之前寫過一篇 AI 學習路徑全攻略,把 AI 應用分成三個階段,今天這篇可以看作是那個框架的延伸。)


先搞清楚:AI 工具的三個層級

AI 工具的三個層級:從問答到建造

我把目前主流的 AI 工具分成三個層級,從你最熟悉的開始:

第一階段:AI 聊天工具(ChatGPT、Gemini、Claude.ai)

這是大多數人已經在用的。你在網頁上打字問問題,它回答。

像一個很厲害的顧問,但問題是,它只會「說」,不會「做」。

你問它「幫我寫做一個 Google 表單,我要做個測驗題」,它會把程式碼貼給你。然後呢?你得自己複製、貼上、找到正確的地方執行。如果報錯了,你再把錯誤訊息貼回去問它。

這個來回過程,最終還是你在工作,就像是你請一位顧問幫你寫了施工圖,但蓋房子還是你自己搬磚。

第二階段:Claude Cowork(桌面助手)

今年一月,Anthropic(做 Claude 的公司)推出了一個叫 Cowork 的功能。它住在 Claude 的桌面 App 裡,位置就在 Chat 旁邊的一個獨立 tab。

跟一般聊天最大的差別是:Cowork 能直接動手做事。

你把一個資料夾丟給它,說「幫我把這些收據 PDF 整理成一份報表」,它就會自己打開每一個檔案、辨識金額和日期、重新命名、自動建立 Google Sheets 試算表,甚至幫你寄 email 出去。

它在你的電腦上運作,但跑在一個安全的沙盒環境2裡,不用擔心它亂動你的系統。

如果 AI 聊天是「顧問」,Cowork 就像是一個「虛擬助理」,你交代任務,它自己去處理,完成後回來跟你報告。

這就是我常說的「當 AI 有了工具」,它就能動手做很多事,所以通常是要先連接、授權給 AI:

目前 Claude, Notion AI, Manus3, ChatGPT 都有越來越多的連接整合。也就是這些 AI 應用,通常很方便地幫你列好它可以整合的工具。你把這些工具授權給它,登入你的帳號密碼,它就可以去使用這些工具了,讓你不需要碰到任何的程式碼。

第三階段:Claude Code(終端機裡的工程師)

Claude Code,是這三者中最具「創造力」的。

它跑在你電腦的終端機(Terminal)裡,所以你它能:

  • 直接讀取你電腦裡的文件和整個專案
  • 自己建立檔案、寫程式、修改程式
  • 執行指令、跑測試

如果說聊天 AI 是顧問、Cowork 是助理,那 Claude Code 就是一個坐在你旁邊的全職工程師。你描述你想要什麼,它就幫你從零做出來。

三種比較表

AI 聊天(ChatGPT、Gemini) Claude Cowork Claude Code
在哪裡用 網頁瀏覽器 桌面 App 終端機(CLI)
怎麼運作 你問它答 交代任務,它自己做 你說想要什麼,它寫程式做出來
能做什麼 給你文字和程式碼 操作檔案、瀏覽器、試算表 建專案、寫程式、跑指令、部署
碰你的檔案嗎 不行(要手動上傳) 可以(你授權的應用工具、資料夾) 可以是整個電腦目錄
像什麼 發 LINE 問一個顧問 請一個虛擬助理 請一個工程師坐你旁邊
適合誰 所有人 知識工作者 想做出東西的人

不過,讓我一句話總結上方&提醒:

AI 這種東西不是越強大就用什麼,而是你有什麼需求用什麼。

當你發現你只是想要有人幫你整理很亂的下載項目資料夾、相片,還是直接幫你操作 Excel 試算表,有連接到你平常會用的 APP(如 Canva, PhotoShop, Booking……等),其實 Cowork 就夠用了。除非你真的想要創造一些網頁應用工具,那就會推薦去使用 Claude Code。


Claude Cowork 的真實工作方式

講到這裡,你可能會想:「真的有這麼厲害嗎?」

讓我分享一個故事。

今年一月,科技 Podcast《Startup Ideas Podcast》的主持人 Greg Isenberg 找來了一位特別來賓—— Boris Cherny,Claude Code 的創造者,也就是 Anthropic 內部帶領 Claude Code 團隊的負責人。

Boris 在節目裡做了一件很有說服力的事:他直接現場示範自己怎麼使用這些工具。

claude code boris interview composite
Boris Cherny 在 Startup Ideas Podcast 上示範 Claude Cowork

Cowork 示範:用收據 PDF 做報表

Boris 把一堆沒有命名的收據 PDF 丟進一個資料夾,然後告訴 Cowork:「幫我整理這些收據。」

Cowork 自動打開每一份 PDF,辨識出商家名稱和日期,重新命名檔案,接著建立一份完整的支出試算表——還透過 Chrome 擴充功能打開 Google Sheets,直接填入資料。最後,Boris 跟它說「把這份表寄給某某人」,它就自己寄出去了。

整個過程,Boris 只打了兩三句話。

Boris 總結說:Cowork 不是聊天機器人,它是一個「做事的人」(doer)。

最近在 X(Twitter)上,Cowork 的各種用法討論度超高:

  • @itsolelehmann:「我來教你怎麼設定 Claude,讓它自動建立文件、做簡報、處理你的重複性工作。」——他的教學系列獲得數百萬觀看。
  • @SamElrad:「Claude 現在能分析 Excel 裡的數據,直接產出一份格式化、有品牌風格的 PowerPoint 簡報——一句話搞定。」
  • @rubenhassid:「Cowork 住在你的電腦上。它讀你的檔案、建立文件、做試算表、寫程式碼來回答你——而你永遠不用看到那些程式碼。」

注意,這些人不是在「寫 APP」,而是在處理日常工作

  • 把一堆 PDF 收據整理成一份支出報表
  • 分析問卷數據,自動找出關鍵洞察
  • 整理雜亂的資料夾,自動重新命名和分類
  • 從一份數據報告,直接生成一份完整簡報
  • 把會議錄音逐字稿,轉成結構化的會議紀錄和待辦事項

如果你的需求是這類「整理、分析、產出文件」的工作,Cowork 就非常夠用了,不需要碰到任何程式碼。

使用小技巧

說越具體越好。 別只說「幫我做一個網頁」,而是說「幫我做一個單頁式網頁,有 hero banner、三欄服務介紹、聯絡表單,用繁體中文,手機要能正常看」。

可以連續下指令。 Claude Code 會記得上下文。你可以逐步修改:先做出基本版,再說「加上深色模式」、「按鈕改成圓角」——就像跟一個設計師來回溝通。


Boris 的 Claude Code 日常工作方式

那 Claude Code 又能做到什麼?

你剛剛已經看到了。

因為,上面的 Cowork 應用,就是 Boris 完全用 Claude Code 打造出來的

他在他的社群媒體上分享了一個數據:過去兩個月,他沒有親手寫過任何一行程式碼。100% 都是 AI 產出的。

他有一句話讓我印象深刻:

「一個錯誤但快速的答案,其實比一個正確但慢的答案更浪費時間。」

所以他永遠讓 AI 用最強的模型、搭配思考模式,寧可每次慢一點,但減少來回修正的次數。


雷蒙的真實應用:非工程師用 Claude Code 打造了什麼

Boris 的故事很厲害,但他畢竟是工程師。你可能更想知道,像我這種非工程師,到底能用 Claude Code 做到什麼程度?我來分享我自己的經驗。

網頁小工具集合

我前一週,把我平常工作上很常用到的一些小工具,寫成了一個公開的網頁,包含空白換行轉換器、線上抽獎轉盤、SRT 字幕轉文字稿、AI 浮水印去除、替換品牌浮水印、Email Markdown 編輯器、倒數計時器、AI 流程圖生成器……等。

這些東西基本上就是我跟 Claude Code 提出我的需求,然後讓它一個個建立後打包成網頁小工具。目的就是為了讓我,還有我的團隊夥伴跟外包夥伴可以使用。

這段開發的過程,可以看我這一篇完整的文章:Vibe Coding 學習筆記

我的 AI 分身助理

我經營「雷蒙三十」這個品牌,日常工作包括寫電子報、錄課程、管理社群、回覆合作信。這些事情散落在十幾個工具裡——Notion、Gmail、Google Calendar、Discord、Facebook……

過去幾個月,我用打造了一個 AI 分身助理。具體做了什麼?

Discord Bot(AI 助理機器人):我用 Claude Code 寫了一個 24 小時運行的 AI 助理,它能幫我做很多事:

  • 每天早上 9 點,自動推送今天的行事曆、待辦事項和天氣
  • 每天晚上 10 點,整理今天的數位足跡,產出日記初稿
  • 我丟一個連結,或者說一段我的想法給它,它自動抓取貼文內容、整理成結構化筆記
  • 在團隊頻道裡,成員 @mention 它就能問問題,它會根據我們的知識庫回答

※ 詳細可以來追:我的 AI 分身上班記錄


線上問答系統(LiveBoard):簡易版 Slido

過去,我在課程直播時需要即時互動問答工具,我們是買付費版的 Slido。但如果活動超過 200 人,要一年 USD600,是不少的開支。

我這週去講完課時,一個隨口問問 Claude Code:

「我們如果來打造一個簡易版 Slido,用我目前在 Zeabur 的伺服器,能夠同時多少人?因為 Slido 很多功能我也用不上。」

結果 AI 說:「以你目前的 2vCPU 伺服器來說,可以同時 500 人不是問題。我們來開發嗎?」

於是這兩,天我一步步地把我的需求告訴他,他都幫我從 0 到 1 做出了一個完整的 Web App 還有手機版 —— 有匿名留言、按讚排序、管理者置頂與刪除、回覆功能、投票題組,甚至能撐住超過 200 人同時在線。現在部署在我自己本來舊有的伺服器4上,完全免費。


臉書貼文審稿工具5

我經營 Facebook 五年多,累積了上百篇貼文。我想從中挑出最能代表我風格的文章,建立一個「語氣參考庫」讓 AI 學習我的寫作方式。我跟 Claude Code 描述了需求,它幫我做了一個本地審稿介面。卡片式瀏覽,用快捷鍵快速分類「精選 / 不納入」,還能自動串接 Facebook API 抓取按讚、分享等互動數據。整個過程,我只負責描述「我想要什麼」和「驗收成果」。


關鍵心態:你不需要懂程式,但要懂得描述問題

這個時代因為 AI 工具的成熟,把創造的門檻真的拉得很低了。

所以我們到底要做什麼呢?我的做法&建議是

  1. 先描述我平常的痛點、需求:「我想要一個 Discord Bot,每天早上 9 點推送我的重要郵件,跟建議的回覆草稿給我。」
  2. 讓 Claude Code 規劃:它會跟我說需要哪些東西、打算怎麼做。這邊的 Plan,重點是讓它把你沒說清楚的背景資訊說明白,讓他更好去打造「個人化」的解決方案。
  3. 確認後讓 AI 執行:AI 會自己寫程式、建檔案、安裝套件。
  4. 遇到問題一起解決:一定不可能要求它一次到位。你找外面的真人工程師,也是如此。(而且 AI 一個月只要 600~3000 元,就非常夠用了)它會跟著每次給你的成果,讓你再說出新的需求,或是你覺得哪邊可以調整、哪邊可以更好;接著就這樣一步一步地,將成果完成到你心中的理想。

整個過程,更像是在「管理一個工程師、設計師、行銷企劃……等全方位又願意動手的同事」。

你需要的不是程式能力,而是清楚描述問題的能力驗證結果的耐心


想試試看?從這裡開始

下載 Antigravity——最適合大眾的方式

如果你也想試試看 Claude Code,但看到「終端機」黑黑一片就頭痛(我一開始也是)

我想推薦你一個更友善的入口:Antigravity

Antigravity 是 Google 推出的免費程式編輯器(基於 VS Code),內建了 AI 對話面板。打開之後,左邊是你的檔案和內容,右邊安裝 Claude Code 套件後,就能有跟 ChatGPT 一模一樣的聊天視窗——你直接用告訴它你想做什麼,它就會在左邊即時修改檔案,你可以看到每一行的變化。

安裝只要三步:

  1. Google Antigravity 下載,安裝後打開
  2. 在擴充商店搜尋「Claude Code」,安裝擴充套件
  3. 登入你的 Claude 帳號,就能開始對話了

整個體驗就像在跟 ChatGPT 聊天,但它能直接看到你的所有檔案、直接動手修改,不用你複製貼上任何東西。這是目前我認為最適合一般人入門使用 Claude Code 的方式。

而且還有一個好處,就是 Google 給的額度非常大方。如果你 Claude Code 只有買 20 塊美金的方案,但你有買 Google AI Pro 的話,其實你的 Antigravity 額度應該是用不完的。


進階心法:讓 AI 越用越順手

他的三個心法

Boris 在節目裡分享的設定心法,我覺得對所有人都適用:

1. CLAUDE.md——讓 AI 有「記憶」

Boris 團隊在專案裡放了一個叫 CLAUDE.md 的檔案,裡面記錄所有的規範、偏好、過去犯過的錯。每次 Claude Code 啟動時,都會先讀這個檔案。

他說:「每次 Claude 做錯一件事,我們就把它寫進 CLAUDE.md,它下次就不會再犯。」

等於是幫 AI 建了一本「教訓筆記」,越用越聰明。

2. Plan Mode——先想清楚再動手

Boris 不會直接叫 Claude Code 開始寫程式。他會先進入「規劃模式」(Plan Mode),跟 Claude 來回討論計畫,直到雙方都滿意了,才切換到自動執行模式讓它動手。

他的原則是:「花時間在規劃上,讓 AI 從好的計畫開始執行。

3. 讓 AI 自己驗證自己

Boris 說這是「最重要的一件事」——給 Claude Code 一個方式去測試自己做出來的東西。讓它打開瀏覽器看看網頁長什麼樣、跑跑測試確認功能正常。

這個「自我驗證迴圈」能讓品質提升 2 到 3 倍。

最後,分享幾個我和 Boris 都在用的進階技巧。這裡先列個清單讓你知道有哪些方向,之後我會針對每一個寫更詳細的教學:

  • CLAUDE.md 的威力:在專案資料夾放一個 CLAUDE.md 檔案,寫上你的偏好和規範。就像幫 AI 寫一份「新員工入職手冊」,它每次啟動都會先讀。Boris 團隊每週更新好幾次,犯過的錯全記在裡面。
  • Plan Mode 先行:不要一開始就叫 AI 動手寫程式,先讓它規劃。來回討論幾輪,確認方向對了再執行。
  • 多 Agent 協作:同時開多個 Claude Code 視窗,分別處理不同的任務。這招 Boris 每天都在用。
  • 自我驗證迴圈:讓 AI 自己測試自己做的東西,品質會大幅提升。
  • Slash Commands 自動化:把你常做的流程存成指令,一鍵執行。Boris 說他每天用幾十次。

對哪個心法最感興趣?歡迎在下方留言告訴我,我會優先寫你最想看的教學。


結語:AI 協作的時代已經到了

Claude Code 不會取代工程師,但它讓「會描述問題的人」也能讓電腦幫自己做事。

Boris 說,Claude Code 現在佔全球 GitHub 公開 commit 的 4%,他預測到今年底會到 20%。這個趨勢很清楚——學會跟 AI 協作,就是這個時代最值得投資的技能。

我自己的經驗是:一旦你嘗過「用一句話做出一個工具」的感覺,就回不去了。

今年四月,我會把這段時間實踐 AI Agent 和 Vibe Coding 的經驗,打包成一個迷你課程,幫助更多人少走彎路,快速上手。如果你有興趣,可以先留下你的 Email,之後的最新消息我會第一時間透過電子報通知你:

現在就打開終端機,裝起來試試吧。也許你今天就能做出你想了很久的那個小工具。

📍 AI Agent(Claude Code、Codex)系列教學文章


延伸閱讀


文章註腳

  1. 過幾天,我會補上我這 21 天開發了哪些工具,這個 AI 分身做了啥,進化了什麼。 ↩︎
  2. 沙盒環境(Sandbox Environment)是指一個隔離的、受控的測試空間,用於執行程式碼、測試軟體或分析惡意檔案,而不會影響到實際的生產系統或使用者。它就像一個虛擬的「沙盒」,讓開發者和安全專家可以在其中自由實驗,而不必擔心造成損害。這種環境對於軟體開發、安全研究和應用程式部署前的驗證至關重要。 ↩︎
  3. 我目前覺得大眾最好上手的 AI Agent 工具,其實是 Notion AI & Manus AI 實測指南↩︎
  4. 我的工具部署和專用伺服器,都是透過 Zeabur 買的,這有詳細教學跟全網最划算的 5 折折扣碼↩︎
  5. 關於這個臉書審稿工具的過程說明,我寫在臉書上,未來再發表成獨立的一篇文章吧?因為是完全可以變成「全社群平台」的精華審核工具,不限制臉書,甚至把我 WordPress Blog 引入也行。 ↩︎

用五年打造付費會員社群?生活黑客群島、訂閱服務全紀錄

2026-03-01 15:53:27

「和你一起重新看待生活,找到未來可能的鑰匙,這裡是雷蒙三十。」

一切的起點,要從這一句 Podcast 開場白說起。

2020 年 1 月的時候,帶了兩個空行李回台灣過年,沒想到因為遇上疫情,回不去了。我跟柚子從北京撤退回台灣,之前海外職涯的計劃被打碎,又不想只是當個一般的上班族,所以白天八點從基隆通勤到台北、每天加班到八九點回家,把握睡前的幾小時,開始錄我們的第一個 Podcast 節目:《雷蒙三十》1

回顧當時的筆記,會做 Podcast 的原因,有三個:

  1. 探索自己還有哪些可能性,倒逼自己學習。
  2. 深度訪談身邊有趣的而立人物,30 歲那段時間,他們在做些什麼?
  3. 做一件長期主義的事,從技能、職場工作,還是關係經營

當時的我們都不到 30 歲,但我們隱約知道,距離 30 歲前的這幾年時光,會改寫我們的一生。

為了跟聽眾建立起互動的橋樑,我們成立了臉書社團——那是生活黑客群島的前身。漸漸的,有一群「蒙友」加入,我們一起嘗試了燈塔計劃、筆記交流、個體小聚。

因為這些人最初的支持,讓我們有了勇氣決定離職創業,好好做一件我們真心熱愛的事業,從最初的數位工作術、一人公司、智能宅,還是到現在……

(你認為我們品牌是什麼呢?留言給我吧 👋🏼)

有些故事,就讓時間、走過的路來說吧:


2020|燈塔計劃:每個人都能成為光

六前前的我們,從臉書社團開始經營社群,有趣的是,當時就用了「超級個體」這個概念,回頭看才發現,原來走過的路都算數,都持續累積著。

2020 臉書社群

當時的標語,算是實現了吧:

如果你有過這樣的念頭:在五年內能脫離公司系統,經營自己,以自己熱愛的事生活著,那你就是我們的一份子。1990 年後出生的我們,在未來的世代,還能有多少可能性?

那一年,我們發起了「燈塔計劃」——讓每一位蒙友分享自己正在面對的真實挑戰。我們相信,每個人都能成為一座燈塔,照亮身邊的人。

除了線上的交流,大家也在社團揪起了線下活動:讀書會、桌遊、戶外野餐。見到面的那種感覺很不一樣,就像認識很久的老朋友,每次出遊都聊到不想回家。

那是一個很純粹的起點。沒有商業模式,沒有會員方案,只有一群人,因為對生活的好奇和熱情聚在一起。

2020 社群線下野餐

2021|從付費電子報到 Discord 群島

年初,我把從大學開始擔任講師、遠距工作時,所鑽研的自我管理、職場技能,和新時代數位工作術,寫成一篇篇深度文章,以付費電子報的形式發送給會員——這就是 Lifehacker Premium(付費會員訂閱制)的起點。

當時每則電子報文章,還會附上柚子親筆手繪的「成長錦囊」,好懷念啊。

第一屆復盤訓練營

2021-復盤訓練營.jpg

同年,我們推出了第一屆《復盤訓練營》。這是我們理想中學習的樣貌——用一個完整的服務流程牽引著學員,讓他完成一個有確切效果的學習過程。我們用 Notion 系統打造了網狀學習的生態,讓課程的價值不只是影片,而是後面那個「程」字。

Notion 實戰課程 & 社群搬家

這一年我們也推出了《Notion 實戰課程》和第一屆《Notion 線上訓練營》。

更重要的是,我們正式將社群從臉書社團遷移到 Discord(生活黑客群島)。

為什麼叫「群島」?因為我們相信,每個人都是一座獨立的島嶼,有自己的風景和故事。當島與島之間建立起連結,就不再是孤島,而是一座充滿生命力的群島。


2022|第一次線下年會:看見彼此

這一年,我們第一次舉辦了生活黑客年會。

跟許多會員是第一次見面。雖然大家平常都是「網友」,各自經歷的人生階段也都不同——現場有自稱「青年危機」的年輕會員,也有人生經歷豐富的前輩。但在自我介紹環節,每個人都幫另一個人回答了對方正面臨的人生問題。

那一瞬間的感覺很奇妙,就像一群各自在不同時空前進的人,在那個下午,看見了彼此。


2023|智能宅小聚&線下活動

智能宅小聚

這一年我們開始了「智能宅小聚」,邀請會員來到我們的智能工作宅,聊聊彼此的目標和煩惱。因為我們家空間不大,名額非常有限,有些會員根本是用搶演唱會門票的架勢來報名的!XD

第一場小聚,除了互相交流,有人聊起人類圖,會員分享職涯的難題,或者一起玩桌遊打遊戲;第二場,非常會做菜、烘焙的會員 Maggie 帶著我們做了超好吃的肉桂捲。

在平時,大家各自在自己的時區向前努力。但當這群用心生活的人聚在一起時,即便是第一次見面的網友,卻都能侃侃而談。因為有著不同的經歷,反而能給彼此的煩惱一些建議。

生活不只有一種模式,我們都值得多走出去看看,認識優質的朋友。 —— 有會員這樣說

同一年,我們甚至舉辦了好友瓦基的第一本書的實體簽書會在台中,來了一堆島民蒙友,還有人攜家帶眷,弄得好盛大哈哈:

2023 瓦基簽書會

第二屆年會:熟面孔與新能量

2023 第二屆年會

2023 年會,我們一起策劃了 2024 年的品牌發展方向。不少新會員帶來新的能量和故事,也有去年就見過面的熟面孔。過了一年,每個人都變得不一樣了——更成熟的氣質、更有智慧的底蘊、更自信的表達。

去年的我們彼此還有點生疏,發言時小心翼翼,擔心跟誰說話、怕自己臉盲認錯人。而今年大家卻像老朋友一樣聊天,同時也更參與品牌的創造,讓這個社群留下了更多每個人的痕跡。

「會持續訂閱的原因,不只是這裡能獲得到的乾貨內容,還有這邊的社群生態特別純粹,工作之後很難找到這種真誠分享,願意互助彼此進步的人了。」—— 有位會員自我介紹的時候這樣說。


2024|從智能宅到宜蘭,再到最盛大的感謝年會

這是我們社群活動最豐富的一年。

智能宅小聚持續進化&宜蘭遊牧之旅

我們一起做鬆餅、玩拉密,討論生活的無限可能(光是認真聊聊認識彼此,就花了兩小時 XD)。在場每個人都有自己獨特的故事,就像一場迷你的生命探險旅程。大家一起玩了桌遊。從遊戲中也能發現其他人的個性

十月,我們和島民們一起包車到宜蘭。行程本身很豐富,但更棒的是這群人——大家都有自己的領域專長,讓這趟旅行不只是觀光,而是發覺身邊每個人的閃光點。每一個人身上都是寶藏,在交流之中,從彼此身上獲得更多收穫。

羅技實體空間小聚

隨著我們品牌的成長,越來越多贊助商或合作品牌加入了我們。很感謝羅技(Logitech)讓我們知道有這樣的空間可租借,讓我們可以定期舉辦一些學員與會員的小聚 🙌🏼

這次小聚,大家一起討論如何優化社群互動。會員來自不同專業領域,帶來各種觀點,也提供實際的實體資源,讓許多停留在想法層面的事情變得更有可行性。

2024 羅技小聚

我們的會員不只是「訂閱者」,我們更希望是「有機生態」,他們也實際參與了品牌的創造、見正成長。在另一場小聚中,大家共同策劃了即將到來的感謝年會——從品牌商品到活動主題,聚集所有人的點子,碰撞出只有我們能創造的獨一無二的火花。

生活黑客感謝年會:堪比人生的一場盛會

這,是我們品牌至今辦過最大、最累,也最過癮的一場年會。

我們第三次年會,也是最盛大的一次。不少會員加入了籌備工作團當志願者。年會當天,同個時段有許多活動同時進行。不論是參與者或志願者,都會面臨「選擇」與「取捨」,注定會錯過一些活動。

不少人說,這個年會就像人生一樣呢 XD,當天精華見下方影片吧!

當天除了邀請我們身邊各領域的高手來「黑客短講」,還有設計「蒙友問答牆」和「自由市場」—— 讓島民交換技能,分享自己的興趣,例如有人提供似顏繪、奧修禪卡、動作課、913星球花藝、手作 DIY 吊飾……等。

每一位來到現場的人,看到的都不是活動的全貌,卻都有獨一無二的收穫。

GM
【生活黑客年會心得】志願者 GM 腰果的熱血年會日記
Notion 訓練營學員 GM 以志願者身份參與黑客年會,從籌備到現場全程投入。他用行動力串起活動中的歡笑與感動,也在自由市場與月老攤位中留下獨特記憶。
Logo 2blog.lifehacker.tw

2025|共學團與黑客島運動會

共學團機制

共學團是我們以「學習&行動」為主軸設計的活動——用 40 天在一個主題上,與會員一起踏出第一步並持續行動。「聰明工作」和「好好生活」兩方面的主題都有,從學習數位工具提升生產力,到一起養成新習慣。

黑客島運動會

這是我們第一次嘗試「運動型」的社群活動。既然是跟這群特別的人一起,那肯定要選不曾體驗過的運動!感謝美式躲避球協會的教學安排,讓我們一起享受運動的樂趣,還能看到柚智夫妻相愛相殺的真實畫面(?)

更多當時的故事:黑客島運動會紀實


關於雷蒙三十的 Logo 小巧思

你知道嗎?雷蒙三十的 Logo 藏了三個彩蛋:

  1. 一座島(沒有正確答案的海洋時代)—— 我們都在海洋上漂泊,尋找自己的夥伴、群島
  2. 一座山(還是雙峰山)—— 太陽是個人頭,一個人正在攀登人生的第二座山
  3. 30(把頭歪向左邊)—— 太陽變成零,你會看到數字 30

還有一個小彩蛋:為什麼 Logo 是這個顏色?當初就是以「青色組織」的顏色去延伸設計的——代表著去中心化、自我管理、全人發展的組織理念。


我們本來沒預期,但一起養大了一座島

2025共學團

很多新朋友不知道,訂閱會員服務,最早只是我和柚子想跟一小群人分享工作法、拆解生產力方法的小角落。

結果一路從復盤訓練營,萌發 Notion 訓練營的想法,於是先到 Hahow 開設了【Notion 實戰課程】,再到多種數位工作術的主題課,還有發展出 Notion 講師團,再到去年把這五年經驗濃縮成【超級個體工作術課程】,還有陪伴著我們成長、越來越棒的社群⋯⋯

這是一個我們本來沒預期,但一起變好的一座島。

2026 年,我們重新盤點了這五年的路,推出了全新的訂閱方案。

它可能跟你想像中的「付費社群」不太一樣。我們不再追求給你更多、更厚重的內容2——因為這五年教會我們一件事:真正讓人留下來的,從來不是內容量,而是「這裡有一群什麼樣的人」。

如果你也想從遠距觀望,到實際參與我們正在做的事,
歡迎你加入認識這一群特別棒的人,共創屬於彼此的精神家園:


► 文章註腳&延伸閱讀

  1. 這邊有當時刻了好幾週的網頁,現在看起來十分復古…。今年,會不會有辦法運用 AI 的幫助,釋放我的時間,來重啟呢?有人覺得有需要嗎哈哈 ↩︎
  2. 我們的課程網站上足夠多了,歡迎你自行參觀選購。 ↩︎