2026-03-20 14:30:00
看到 Eo 寫的這篇〈超商店員〉,他說:
我認為所有超商或超市(711、全家、楓康、全聯......)的店員,都應該被機器人櫃員或自助結帳取代。
──Eo
他的出發點,許多是為了保護店員的職業風險──例如結帳可能出錯、無法發揮個人長才、常會遇到奧客、發生危險時要用肉身擋在前線等等。
但是,我覺得店員超重要耶!如果有親切、能跟每個客人聊上幾句的店員,對那家店是超級加分的。
我家旁邊有兩家 7-11,距離差不多,但我幾乎只去店員比較親切的那一家。
那家的店員會注意我每次都買同一個牌子的雞胸肉,然後特別幫我多訂一點;看到我一直把西瓜掃光,隔天店裡就出現了更多西瓜(然後我再全部掃光);會問我兩種蘋果(愛妃 vs. 蜂糖)哪一個比較好吃1,然後當然是會幫我多訂比較好吃的那種;甚至,偶爾還會送我額外的折價券。
所以我認為超商不該自動化嗎?也不是。
現在便利商店的問題,是把人類店員當作機器在用。店員真的太忙了──要收銀、要泡咖啡、要收包裹、要加熱便當、要處理繳費、要上架商品、盤點庫存──忙到眼神都是死的,哪有心情去「當一個人類」?
我覺得聰明的經營者,應該要把全部能自動化的工作都自動化──自助結帳、自助繳費、自動咖啡機、自助包裹寄取、自助加熱。然後,把那些「行為像機器的人類店員」全部換掉,用三倍的薪水聘請「能提供情緒價值的的人類店員」,並且確保他們有餘裕好好當一個人類,並且多進一點西瓜。🍉
2026-03-19 14:00:00
讀到 Eltrac 的這篇文章〈迷失於圖形界面〉,裡面提到一位大學老師,要求學生必須使用特定的繪圖工具,因為這樣才叫「專業」:
「有的同學用 Visio 畫圖,這樣不好,我們作為軟件工程的學生,要使用專業的 UML 繪圖工具。你作為專業的軟件工程學生,連專業的畫圖工具都不會用,怎麼行!?」
──那位要求「專業」的大學老師,出自 Eltrac 的文章
Eltrac 覺得這想法超荒謬,他說這就很像是覺得:
「使用一水檸檬酸溶液來清除水垢是不專業的,應該使用包裝上寫明瞭『水垢清潔劑』的清潔產品,才顯得專業。」
我超級有同感!
而且,為什麼使用「昂貴、包裝精緻、重度行銷」的工具是比較專業呢?我覺得應該正好相反啊!
這些高度商業化工具最擅長的事情,就是把底層複雜的運作邏輯藏起來,套上漂亮的外皮,然後標上看起來「超專業」的價格。它們的行銷套路,就是先向大眾定義「專業」的標準,然後說自己就是那個標準的中心,暗示消費者「如果不用我的產品,你就是不專業」。
我也不是完全反對商業工具,它們在某些情境下確實比較方便。但這些工具的設計目標就是降低門檻、省去麻煩,讓不那麼熟悉技術細節的人也能完成工作。所以,也不是說用這些東西就是「不專業」,只是它們並不能證明身為使用者的你很專業。
有能力用更少、更便宜、更底層、更不精美的工具完成工作的人,通常才是真正專業的人。
在音樂製作圈有一種典型迷思:你必須擁有最新的頂規 MacBook Pro,跑著「專業」的 Logic Pro 或 Pro Tools 軟體,花數千美金買「專業」的外掛程式,配上像是 Kontakt、Spitfire、Serum 這些「專業」的音色庫和合成器,才是「專業」的音樂製作人。
有些人為了看起來「專業」,寧願用盜版的 Serum,也不屑看一眼免費開源、且功能同樣強大的 Surge XT。因為那就不是網路上那些名人在用的啊!
其實,能用一台 2011 年的 ThinkPad X220、開放原始碼的 Ardour 編曲軟體1、免費的 Surge XT 合成器2,加上一台十五年前的 Yamaha Motif 鍵盤,就做出同樣水準音樂的人,在我眼裡看起來可專業多了。
其他領域也是呀!許多人覺得要 Notion 那種花俏介面才叫「專業筆記」,用 Photoshop 才叫「專業修圖」。但事實上,用 Markdown 加資料夾結構作筆記、用 GIMP3 和 Krita4 來處理圖片,反而更不受工具綁架、在各種條件下都能把事情做好。
真正專業的人,反而最不在意自己「看起來」專不專業,因為他們的能力不需要靠工具來證明。
但現實的麻煩是,大部分評判你的人並不專業,所以他們容易被「專業工具」的表象欺騙。在外行人眼中,打開 Photoshop 的人就是比打開 GIMP 的人更「專業」;就好比穿白袍的人看起來就是比穿 T-shirt 的人更懂醫學一樣──哪怕前者只是在玩醫生 cosplay。
我自己在教編曲時就深陷這個矛盾。我是極簡工具派的信徒,真心覺得用最少的資源、最簡單的工具完成工作才是王道。但我也得妥協地告訴學生:「喔,雖然我一直都是這樣做的,但是一般人認為的『專業』做法,是要用那套昂貴的專有軟體。你至少要知道它的存在,這樣在外面才不會被覺得『不專業』喔!」
裝出專業感,其實也是專業的一部分呢!
如果想要變得更專業(真正的那一種),最有效的途徑是學習使用那些更自由、更底層、更不精緻、包裝更少、看起來更「不專業」的工具。因為這樣你就被迫要練出真正的技術,而不是只能依賴商業軟體幫你把一切都打理好。
在你參透了一切之後,你就可以自信地打開你的 ThinkPad X220、Ardour、GIMP 和各種簡陋的工具,做出別人要花十倍預算才能做出的成果──然後被覺得「看起來不專業」。
所以結論是:極簡工具還是平時自己用就好──見客戶的時候,還是帶一台最新的頂規 MacBook Pro,裝上所有介面華麗的盜版專有軟體,讓客戶讚嘆你的「專業程度」吧!
(這篇文章是用不專業的 micro 文字編輯器、搭配不專業的 Markdown 格式寫成的。)
2026-03-18 14:00:00
前幾天洗碗時手滑,把我的 Starbucks 馬克杯摔破了。
意外發生後還不到十分鐘,我人已經出現在家附近的星巴克。在店裡我看上了一款外帶杯造型的咖啡杯──這次是不鏽鋼的,摔不破喔──定價一千出頭。我拿著它走向櫃台,腦中已經在想像回家後用新杯子爽爽喝咖啡的畫面了。
然後熱心的女店員跟我說:
「先生,這個杯子下禮拜會變 85 折喔!要不要我先幫你留?」
雖然是說才省不到 200 塊,但我當下看著店員的眼睛,實在難以霸氣說出:「沒關係唷,我今天就是要買,我買東西不看價格的!」──她是這麼真心地為我著想、想要幫我省錢耶,怎麼可以辜負人家!於是我乖乖留了電話,填了單子,兩手空空地走出店門。
這導致我現在處於一個「沒有咖啡杯」的狀態。這三天,我只能拿平常用來喝冷飲的藍色保溫罐來泡咖啡。
(它就是當事藍色保溫罐)

你可能會想:藍色保溫罐有什麼不好嗎?不都可以裝液體,而且還比馬克杯更保溫呢!
不,並不是這樣。這個保溫罐是直筒型的,瓶口稍微窄、罐身有點深。當我把即溶咖啡粉倒進去的時候,因為光線照不進罐底,很難判斷自己倒進了多少咖啡粉,所以我必須一直橋角度,把罐子歪來歪去反覆確認咖啡粉的量。
而且,我甚至覺得用這個罐子喝咖啡的口感和味道,都跟馬克杯有點不一樣──對對我知道我知道,明明喝的就是最便宜的即溶咖啡,卻還要挑剔這種事,荒不荒謬。
反正我意識到,失去咖啡杯的這幾天,我沒有那麼享受喝咖啡了。我平常一天都會喝兩到三杯的,昨天竟然只喝了一杯!
咖啡杯不是咖啡,但它是「喝咖啡」這件事中不可或缺的一部分。
仔細想想,其他事情不也是這樣嗎:
micro 文字編輯器、機械鍵盤和 Linux 作業系統。如果哪天我被迫要用 Windows 11 配 Word 寫文章,我搞不好就想直接宣佈停更了。星巴克店員、咖啡杯、micro、機械鍵盤、Linux 和床頭燈──看似超級不重要,但當它們消失時,你會驚覺它們才是整個體驗的核心。
你最近是不是每天都心情很好地起床呢?有沒有可能是因為 Wiwi.Blog 每天都準時出現在你的 RSS Reader 裡呢?我就是你的咖啡杯,不用太感謝我沒關係!
2026-03-17 14:30:00
跟朋友聊天,聊到名人 A 過去的八卦。以「結果論」來說,A 做的每個決定,到底是好是壞呢?
「結果論」只是把時間線定格在某個時間點,然後看圖說故事而已。
只要人還活著,故事就還沒結束;自然就沒有所謂「結果論」,只有「截至目前為止劇情是這樣」。
當你做了某個決定,看似沒達成預期的結果,一定會有旁人用「結果論」來酸你,在那邊「你看吧、早就跟你說了吧」。此時一定要記得,故事還沒有「結果」。事實上,在有生之年根本就不可能有「結果」。
等到真正有「結果」的時候,你也已經看不到了。除非你有用 Facebook 或 Instagram,那麼你死後的 AI 分身就可以幫你貼文,評論自己這一生的「結果」了──結果呢,你看吧,每個人的結果都是「反正最後就是死了」。
2026-03-16 13:30:00
2024 年九月時,我寫過一篇〈離線 AI 好爽!〉。
當時我剛買了兩張 NVIDIA RTX 4000,興奮地把各種離線 AI 工具都玩了一輪──Ollama 上的 Gemma 2 和 Llama 3.1 語言模型、FLUX.1 圖片生成、Whisper 語音辨識、Demucs 音樂分軌、Krita + Stable Diffusion 輔助修圖。
一年半過去了,現在的離線 AI 發展得如何了呢?暴雷:一切都進步超級多!
先來玩個遊戲。聽聽看以下兩個語音片段,猜猜看哪一個是我的真人錄音,哪一個只是打字讓 AI 生成的?
「你現在聽到的這段話,可能真的是我說的,也有可能是 AI 在模仿我說話。現在的科技真可怕,我都快要分不出來了。」
片段 1:
片段 2:
片段 1 是 AI 生成,片段 2 才是真的我。是不是很像!
Qwen3-TTS 這個東西太強了,它只需要一段 30 秒的語音樣本,就能複製你的聲音,用你的聲音說任何話。它可以完全離線、單機執行,訓練和生成都超級快,在我的電腦上只要幾秒到十幾秒就可以完成了。
所以,以後如果你聽到「我」在講一些很荒謬的言論,記得那可能不是我喔!
去(2025)年十月,我介紹過 ACE-Step 這個離線音樂生成模型。當時我對它的評價是:「拍子有點怪怪的,好像樂手突然會抽筋一下的感覺,但是作為創意發想工具還不錯」。
還沒過半年,現在 ACE-Step 1.5 版推出了!這一版的「抽筋現象」已經比之前好非常非常多,聲音品質也明顯提升了好幾個等級。以我的體感來說,現在的品質大約已經相當於早期版本的 Suno,只落後它一年左右吧。
它開放原始碼,可以完全離線、單機執行,可以自訂歌詞和風格。跑起來超級快,在我的電腦上只需十幾秒就能生成一首 90 秒的歌曲。
來聽聽看它生成的音樂,風格設定為「jazz fusion」,歌詞是以下這樣:
Wiwi Blog 🎵 Wiwi Blog 🎵
我今天想要吃蛋餅
蛋餅蛋餅我的蛋餅
老闆加蛋,老闆加兩個蛋
只有蛋和餅,不要加醬油膏
我覺得以離線單機模型來說,這品質很令人驚豔耶!照這個速度發展下去,我猜不用一年,我們就能擁有跟當前的 Suno 一樣厲害的離線模型可以用了!到時候每個人都可以在自己的電腦上,離線免費生成超高品質的蛋餅歌,多麼令人期待的未來呀!
FLUX.2 Klein 9B 是一個可以離線、單機執行的圖片生成與編輯模型。只要丟一張照片進去,然後用文字描述你想要它變成怎樣就可以了!
我覺得這個比線上的 Nano Banana 好用太多!Nano Banana 的審查機制之荒謬,根本是把使用者當成幼稚園小朋友,我只不過是想把照片修瘦一點它都不讓我耶!就更別提其他政治更不正確的請求了,用起來超廢的。
(Nano Banana:「你的身材很好,不准修改!」)

離線的 FLUX.2 Klein 可就完全不同了!它完全聽命於你,不論你想要生成各種政治不正確的、有版權疑慮的、母湯的、色色的圖片都沒有問題唷!輸出的圖全部存在自己的電腦上,不會被別人監控,太快樂了!
(左邊是原圖,右邊是 FLUX.2 Klein 的輸出)

(天氣越來越熱了,來吃西瓜吧!)

跟一年半前相比,2026 年的離線語言模型也增強了一個等級。我現在最常用的模型是 Qwen3.5 27B 和 Gemma 3 27B,都是透過 Ollama 執行。
跟 Claude Opus 或 Gemini 3 Pro 這種付費版的旗艦模型比,當然還是有差距。但跟許多免費版的線上模型比的話,其實表現不相上下唷!我甚至覺得這兩個 27B 的小模型寫出來的文章,比免費版的 ChatGPT 更好。
如果你的需求主要是輔助寫作、翻譯、整理重點等文字工作,2026 年的離線模型已經完全夠用。寫程式也比兩年前進步很多,雖然還沒辦法像 Claude Opus 那樣可以直接完成超大專案,但是寫些小東西還是沒問題的!
聽起來很矛盾,但是邏輯很簡單:線上 AI 越強,你就會越依賴它;你越依賴它,就越沒有對它說不的餘地。然後哪天它突然大漲價、加入更多內容審查、順便把你最依賴的功能鎖起來,你除了乖乖接受什麼都做不了。
如果生活上已經離不開 AI,更應該在自己的電腦上留一條完全離線、開放原始碼、不受任何公司控制的「後路」。離線 AI 不一定要比線上的強,光是「它永遠在那裡、不會變、不會漲價、不會審查你」這件事本身,就已經有超大的價值。
當雲端 AI 服務集體大便化、網路斷線、條款說改就改──注意是「當」,不是「如果」──你會很慶幸自己電腦上還有一個會聽你的話、能唱蛋餅歌、能生出可疑圖片的 AI 助手陪著你。
2026-03-15 14:30:00
Vibe Coding(憑感覺寫程式)大概是 2025 年開始最紅的軟體開發方式──程式碼都是 AI 寫的,人類不知道它寫了什麼、用了什麼邏輯、也不想了解,反正能夠跑就好。這種「我不懂,但我不 care」的態度,也是 Vibe Coding 受到批評的主要原因。
我突然想到,古典鋼琴圈不是一直以來都在 Vibe Playing 嗎?為了在升學考或音樂比賽裡「不輸給別人」,老師叫學生硬練遠超過自身程度的曲子,這在台灣的音樂班是常態。作曲家寫了什麼、用了什麼邏輯、為什麼要這樣寫,通通不重要──能夠彈得很快、不要錯音、聽起來很厲害就好。
而且仔細想,古典音樂教育體制其實是超級鼓勵 Vibe Playing 的。比賽和考試拿高分的標準通常是「彈得出來、彈得正確、彈得流暢」,沒有一個項目叫做「請解釋一下剛才這段作曲家做了什麼設計」。這不就很像寫程式時,只管它「能不能跑」的感覺嗎?
假設你完全不懂中文。你的 AI 助理告訴你,想認識一個女生,你就走過去對她說:
「請問你是 Wi-fi 嗎?我感覺我們之間有連線。」
AI 跟你保證「只要講這句,她一定會笑」。你完全不知道這句話是什麼意思,你敢在不查證、不理解的情況下直接講出來嗎?
這就是許多鋼琴學生每天在做的事:譜上說彈這個音、老師說這裡漸強、那裡踩踏板,學生全部照做,但完全不知道為什麼。本質上,這就是在講自己也不知道意思的話,只是流利地講出來。
評論古典鋼琴演奏時,「有說服力」或「沒有說服力」是很常見的說法。
小時候我曾經對這個詞感到困惑──是要用鋼琴說服誰?但長大就懂了。這並不是在指演奏者裝得一副很有自信、表情扭曲、身體搖得很用力的樣子。外表再怎麼裝模作樣都是沒用的。
所謂的「說服力」,是指讓聽眾感受到:「這個人完全知道譜上寫了什麼,知道作曲家有這個意圖──而且沒錯,他知道譜上沒有這樣寫、大家也不是這樣彈的──但他就是決定要這樣詮釋。」是懂了之後做出的決定,不是蒙在鼓裡的憑感覺彈。
Vibe Playing 的相反,就是「說服力」。
不過話說回來,一個非鋼琴專業聽眾,八成聽不出來彈奏者是不是在 Vibe Playing。我身為一個非資訊專業者,在使用一個程式時,其實也不 care 開發者到底懂不懂裡面的每一行程式碼,能用就好了。
會不會有一天,工具變得太方便,導致世界上沒有人能搞懂任何事呢?每個人都只是複製貼上 AI 的話、執行自己看不懂的程式碼、演奏著自己不理解的音符。一切只要憑感覺就可以運作良好了──直到 Wi-fi 斷線的那一天。
請問你是 Wi-fi 嗎?因為少了你,我才發現我什麼都不懂。