MoreRSS

site iconWiwiKuan | 官大為修改

台灣鋼琴家官大為(Wiwi Kuan)的個人部落格。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

WiwiKuan | 官大為的 RSS 预览

人類超商店員

2026-03-20 14:30:00

看到 Eo 寫的這篇〈超商店員〉,他說:

我認為所有超商或超市(711、全家、楓康、全聯......)的店員,都應該被機器人櫃員或自助結帳取代。

──Eo

他的出發點,許多是為了保護店員的職業風險──例如結帳可能出錯、無法發揮個人長才、常會遇到奧客、發生危險時要用肉身擋在前線等等。

但是,我覺得店員超重要!如果有親切、能跟每個客人聊上幾句的店員,對那家店是超級加分的。

我家旁邊有兩家 7-11,距離差不多,但我幾乎只去店員比較親切的那一家。

那家的店員會注意我每次都買同一個牌子的雞胸肉,然後特別幫我多訂一點;看到我一直把西瓜掃光,隔天店裡就出現了更多西瓜(然後我再全部掃光);會問我兩種蘋果(愛妃 vs. 蜂糖)哪一個比較好吃1,然後當然是會幫我多訂比較好吃的那種;甚至,偶爾還會送我額外的折價券

所以我認為超商不該自動化嗎?也不是。

現在便利商店的問題,是把人類店員當作機器在用。店員真的太忙了──要收銀、要泡咖啡、要收包裹、要加熱便當、要處理繳費、要上架商品、盤點庫存──忙到眼神都是死的,哪有心情去「當一個人類」?

我覺得聰明的經營者,應該要把全部能自動化的工作都自動化──自助結帳、自助繳費、自動咖啡機、自助包裹寄取、自助加熱。然後,把那些「行為像機器的人類店員」全部換掉,用三倍的薪水聘請「能提供情緒價值的的人類店員」,並且確保他們有餘裕好好當一個人類,並且多進一點西瓜。🍉

Footnotes

  1. 當然是蜂糖!我不喜歡粉粉爛爛的蘋果。

看起來不專業

2026-03-19 14:00:00

讀到 Eltrac 的這篇文章〈迷失於圖形界面〉,裡面提到一位大學老師,要求學生必須使用特定的繪圖工具,因為這樣才叫「專業」:

「有的同學用 Visio 畫圖,這樣不好,我們作為軟件工程的學生,要使用專業的 UML 繪圖工具。你作為專業的軟件工程學生,連專業的畫圖工具都不會用,怎麼行!?」

──那位要求「專業」的大學老師,出自 Eltrac 的文章

Eltrac 覺得這想法超荒謬,他說這就很像是覺得:

「使用一水檸檬酸溶液來清除水垢是不專業的,應該使用包裝上寫明瞭『水垢清潔劑』的清潔產品,才顯得專業。」

「專業」工具的行銷套路

我超級有同感!

而且,為什麼使用「昂貴、包裝精緻、重度行銷」的工具是比較專業呢?我覺得應該正好相反啊!

這些高度商業化工具最擅長的事情,就是把底層複雜的運作邏輯藏起來,套上漂亮的外皮,然後標上看起來「超專業」的價格。它們的行銷套路,就是先向大眾定義「專業」的標準,然後說自己就是那個標準的中心,暗示消費者「如果不用我的產品,你就是不專業」。

我也不是完全反對商業工具,它們在某些情境下確實比較方便。但這些工具的設計目標就是降低門檻、省去麻煩,讓不那麼熟悉技術細節的人也能完成工作。所以,也不是說用這些東西就是「不專業」,只是它們並不能證明身為使用者的你很專業。

真正的專業,看起來一點都不專業

有能力用更少、更便宜、更底層、更不精美的工具完成工作的人,通常才是真正專業的人。

在音樂製作圈有一種典型迷思:你必須擁有最新的頂規 MacBook Pro專業,跑著「專業」的 Logic Pro專業Pro專業 Tools 軟體,花數千美金買「專業」的外掛程式,配上像是 Kontakt、Spitfire、Serum 這些「專業」的音色庫和合成器,才是「專業」的音樂製作人。

有些人為了看起來「專業」,寧願用盜版的 Serum,也不屑看一眼免費開源、且功能同樣強大的 Surge XT。因為那就不是網路上那些名人在用的啊!

其實,能用一台 2011 年的 ThinkPad X220、開放原始碼的 Ardour 編曲軟體1、免費的 Surge XT 合成器2,加上一台十五年前的 Yamaha Motif 鍵盤,就做出同樣水準音樂的人,在我眼裡看起來可專業多了。

其他領域也是呀!許多人覺得要 Notion 那種花俏介面才叫「專業筆記」,用 Photoshop 才叫「專業修圖」。但事實上,用 Markdown 加資料夾結構作筆記、用 GIMP3 和 Krita4 來處理圖片,反而更不受工具綁架、在各種條件下都能把事情做好。

問題是,評判你的人不專業

真正專業的人,反而最不在意自己「看起來」專不專業,因為他們的能力不需要靠工具來證明。

但現實的麻煩是,大部分評判你的人並不專業,所以他們容易被「專業工具」的表象欺騙。在外行人眼中,打開 Photoshop 的人就是比打開 GIMP 的人更「專業」;就好比穿白袍的人看起來就是比穿 T-shirt 的人更懂醫學一樣──哪怕前者只是在玩醫生 cosplay。

我自己在教編曲時就深陷這個矛盾。我是極簡工具派的信徒,真心覺得用最少的資源、最簡單的工具完成工作才是王道。但我也得妥協地告訴學生:「喔,雖然我一直都是這樣做的,但是一般人認為的『專業』做法,是要用那套昂貴的專有軟體。你至少要知道它的存在,這樣在外面才不會被覺得『不專業』喔!」

裝出專業感,其實也是專業的一部分呢!

所以要怎麼辦?

如果想要變得更專業(真正的那一種),最有效的途徑是學習使用那些更自由、更底層、更不精緻、包裝更少、看起來更「不專業」的工具。因為這樣你就被迫要練出真正的技術,而不是只能依賴商業軟體幫你把一切都打理好。

在你參透了一切之後,你就可以自信地打開你的 ThinkPad X220、Ardour、GIMP 和各種簡陋的工具,做出別人要花十倍預算才能做出的成果──然後被覺得「看起來不專業」。

所以結論是:極簡工具還是平時自己用就好──見客戶的時候,還是帶一台最新的頂規 MacBook Pro,裝上所有介面華麗的盜版專有軟體,讓客戶讚嘆你的「專業程度」吧!

(這篇文章是用不專業的 micro 文字編輯器、搭配不專業的 Markdown 格式寫成的。)

Footnotes

  1. https://ardour.org/

  2. https://surge-synthesizer.github.io/

  3. https://www.gimp.org/

  4. https://krita.org/en/

你不會感謝咖啡杯(直到你摔破它)

2026-03-18 14:00:00

前幾天洗碗時手滑,把我的 Starbucks 馬克杯摔破了。

意外發生後還不到十分鐘,我人已經出現在家附近的星巴克。在店裡我看上了一款外帶杯造型的咖啡杯──這次是不鏽鋼的,摔不破喔──定價一千出頭。我拿著它走向櫃台,腦中已經在想像回家後用新杯子爽爽喝咖啡的畫面了。

然後熱心的女店員跟我說:

「先生,這個杯子下禮拜會變 85 折喔!要不要我先幫你留?」

雖然是說才省不到 200 塊,但我當下看著店員的眼睛,實在難以霸氣說出:「沒關係唷,我今天就是要買,我買東西不看價格我也希望可以這樣」──她是這麼真心地為我著想、想要幫我省錢耶,怎麼可以辜負人家!於是我乖乖留了電話,填了單子,兩手空空地走出店門。

這導致我現在處於一個「沒有咖啡杯」的狀態。這三天,我只能拿平常用來喝冷飲的藍色保溫罐來泡咖啡。

(它就是當事藍色保溫罐)

你可能會想:藍色保溫罐有什麼不好嗎?不都可以裝液體,而且還比馬克杯更保溫呢!

不,並不是這樣。這個保溫罐是直筒型的,瓶口稍微窄、罐身有點深。當我把即溶咖啡粉倒進去的時候,因為光線照不進罐底,很難判斷自己倒進了多少咖啡粉,所以我必須一直橋角度,把罐子歪來歪去反覆確認咖啡粉的量。

而且,我甚至覺得用這個罐子喝咖啡的口感和味道,都跟馬克杯有點不一樣──對對我知道我知道,明明喝的就是最便宜的即溶咖啡,卻還要挑剔這種事,荒不荒謬。

反正我意識到,失去咖啡杯的這幾天,我沒有那麼享受喝咖啡了。我平常一天都會喝兩到三杯的,昨天竟然只喝了一杯!

咖啡杯不是咖啡,但它是「喝咖啡」這件事中不可或缺的一部分。

仔細想想,其他事情不也是這樣嗎:

  • 我每天寫 blog 能寫得開心,也許都要歸功於 micro 文字編輯器機械鍵盤Linux 作業系統。如果哪天我被迫要用 Windows 11 配 Word 寫文章,我搞不好就想直接宣佈停更了。
  • 你睡前喜歡看書,也許只是因為床頭燈剛好是某個特定的色溫、亮度和角度。如果它壞了,或換了另一盞刺眼的白光燈,你也許就改成半夜滑脆了。
  • 我會常去那家星巴克,可能也要感謝那位勸我別買杯子的店員。很有可能接下來幾天,我會因為不想自己泡咖啡而直接去星巴克喝,多花的錢已經可以買原價杯子了。但星巴克的烤雞生吐司三明治實在很好吃,而且我因為她也有了這篇文章的靈感,算起來還是很賺的。

星巴克店員、咖啡杯、micro、機械鍵盤、Linux 和床頭燈──看似超級不重要,但當它們消失時,你會驚覺它們才是整個體驗的核心。

你最近是不是每天都心情很好地起床呢?有沒有可能是因為 Wiwi.Blog 每天都準時出現在你的 RSS Reader 裡呢?我就是你的咖啡杯,不用太感謝我沒關係!

結果論

2026-03-17 14:30:00

跟朋友聊天,聊到名人 A 過去的八卦。以「結果論」來說,A 做的每個決定,到底是好是壞呢?

  • 💑 A 有一個女友 B,交往了九年。
    結果論 → 九年欸!絕對是真愛。
  • 🔥 然後 A 愛上了 C,劈腿被抓包後公開道歉,形象崩潰。
    結果論 → 你看吧,好好的 B 不珍惜,活該,結果人生毀了吧!
  • ✈️ A 公開懺悔,帶 B 出國度假,兩人復合。
    結果論 → 你看吧,B 果然超好,這才是最好的結局。
  • 💔 半年後,A 和 B 還是分手了。
    結果論 → 你看吧,劈過腿的人就是不會改的,早就跟你說了。
  • 💒 A 和 C 交往,然後結婚了,生了兩個小孩,家庭美滿。
    結果論 → 你看吧,勇敢追求真愛才是對的。
  • 📉 最近,A 的最新作品票房慘淡,虧了超多錢。
    結果論 → 你看吧,人品有問題,老天爺是不會幫忙他的。

「結果論」只是把時間線定格在某個時間點,然後看圖說故事而已。

只要人還活著,故事就還沒結束;自然就沒有所謂「結果論」,只有「截至目前為止劇情是這樣」。

當你做了某個決定,看似沒達成預期的結果,一定會有旁人用「結果論」來酸你,在那邊「你看吧、早就跟你說了吧」。此時一定要記得,故事還沒有「結果」。事實上,在有生之年根本就不可能有「結果」。

等到真正有「結果」的時候,你也已經看不到了。除非你有用 Facebook 或 Instagram,那麼你死後的 AI 分身就可以幫你貼文,評論自己這一生的「結果」了──結果呢,你看吧,每個人的結果都是「反正最後就是死了」。

離線 AI 好爽(2026 年版)

2026-03-16 13:30:00

2024 年九月時,我寫過一篇〈離線 AI 好爽!〉。

當時我剛買了兩張 NVIDIA RTX 4000,興奮地把各種離線 AI 工具都玩了一輪──Ollama 上的 Gemma 2 和 Llama 3.1 語言模型、FLUX.1 圖片生成、Whisper 語音辨識、Demucs 音樂分軌、Krita + Stable Diffusion 輔助修圖。

一年半過去了,現在的離線 AI 發展得如何了呢?暴雷:一切都進步超級多!

Qwen3-TTS:離線語音複製、生成

先來玩個遊戲。聽聽看以下兩個語音片段,猜猜看哪一個是我的真人錄音,哪一個只是打字讓 AI 生成的?

「你現在聽到的這段話,可能真的是我說的,也有可能是 AI 在模仿我說話。現在的科技真可怕,我都快要分不出來了。」

片段 1:



片段 2:


點我看答案

片段 1 是 AI 生成,片段 2 才是真的我。是不是很像!

Qwen3-TTS 這個東西太強了,它只需要一段 30 秒的語音樣本,就能複製你的聲音,用你的聲音說任何話。它可以完全離線、單機執行,訓練和生成都超級快,在我的電腦上只要幾秒到十幾秒就可以完成了。

所以,以後如果你聽到「我」在講一些很荒謬的言論,記得那可能不是我喔!

ACE-Step 1.5:離線音樂生成

去(2025)年十月,我介紹過 ACE-Step 這個離線音樂生成模型。當時我對它的評價是:「拍子有點怪怪的,好像樂手突然會抽筋一下的感覺,但是作為創意發想工具還不錯」。

還沒過半年,現在 ACE-Step 1.5 版推出了!這一版的「抽筋現象」已經比之前好非常非常多,聲音品質也明顯提升了好幾個等級。以我的體感來說,現在的品質大約已經相當於早期版本的 Suno,只落後它一年左右吧。

它開放原始碼,可以完全離線、單機執行,可以自訂歌詞和風格。跑起來超級快,在我的電腦上只需十幾秒就能生成一首 90 秒的歌曲。

來聽聽看它生成的音樂,風格設定為「jazz fusion」,歌詞是以下這樣:

Wiwi Blog 🎵 Wiwi Blog 🎵
我今天想要吃蛋餅
蛋餅蛋餅我的蛋餅
老闆加蛋,老闆加兩個蛋
只有蛋和餅,不要加醬油膏



我覺得以離線單機模型來說,這品質很令人驚豔耶!照這個速度發展下去,我猜不用一年,我們就能擁有跟當前的 Suno 一樣厲害的離線模型可以用了!到時候每個人都可以在自己的電腦上,離線免費生成超高品質的蛋餅歌,多麼令人期待的未來呀!

FLUX.2 Klein 9B:大人的離線圖片編輯、生成工具

FLUX.2 Klein 9B 是一個可以離線、單機執行的圖片生成與編輯模型。只要丟一張照片進去,然後用文字描述你想要它變成怎樣就可以了!

我覺得這個比線上的 Nano Banana 好用太多!Nano Banana 的審查機制之荒謬,根本是把使用者當成幼稚園小朋友,我只不過是想把照片修瘦一點它都不讓我耶!就更別提其他政治更不正確的請求了,用起來超廢的。

(Nano Banana:「你的身材很好,不准修改!」)

離線的 FLUX.2 Klein 可就完全不同了!它完全聽命於你,不論你想要生成各種政治不正確的、有版權疑慮的、母湯的、色色的圖片都沒有問題唷!輸出的圖全部存在自己的電腦上,不會被別人監控,太快樂了!

(左邊是原圖,右邊是 FLUX.2 Klein 的輸出)

(天氣越來越熱了,來吃西瓜吧!)

Ollama:很夠用的小型語言模型

跟一年半前相比,2026 年的離線語言模型也增強了一個等級。我現在最常用的模型是 Qwen3.5 27B 和 Gemma 3 27B,都是透過 Ollama 執行。

跟 Claude Opus 或 Gemini 3 Pro 這種付費版的旗艦模型比,當然還是有差距。但跟許多免費版的線上模型比的話,其實表現不相上下唷!我甚至覺得這兩個 27B 的小模型寫出來的文章,比免費版的 ChatGPT 更好。

如果你的需求主要是輔助寫作、翻譯、整理重點等文字工作,2026 年的離線模型已經完全夠用。寫程式也比兩年前進步很多,雖然還沒辦法像 Claude Opus 那樣可以直接完成超大專案,但是寫些小東西還是沒問題的!

線上 AI 越強,你越需要離線 AI

聽起來很矛盾,但是邏輯很簡單:線上 AI 越強,你就會越依賴它;你越依賴它,就越沒有對它說不的餘地。然後哪天它突然大漲價、加入更多內容審查、順便把你最依賴的功能鎖起來,你除了乖乖接受什麼都做不了。

如果生活上已經離不開 AI,更應該在自己的電腦上留一條完全離線、開放原始碼、不受任何公司控制的「後路」。離線 AI 不一定要比線上的強,光是「它永遠在那裡、不會變、不會漲價、不會審查你」這件事本身,就已經有超大的價值。

當雲端 AI 服務集體大便化、網路斷線、條款說改就改──注意是「當」,不是「如果」──你會很慶幸自己電腦上還有一個會聽你的話、能唱蛋餅歌、能生出可疑圖片的 AI 助手陪著你。

Vibe Playing

2026-03-15 14:30:00

Vibe Coding(憑感覺寫程式)大概是 2025 年開始最紅的軟體開發方式──程式碼都是 AI 寫的,人類不知道它寫了什麼、用了什麼邏輯、也不想了解,反正能夠跑就好。這種「我不懂,但我不 care」的態度,也是 Vibe Coding 受到批評的主要原因。

我突然想到,古典鋼琴圈不是一直以來都在 Vibe Playing 嗎?為了在升學考或音樂比賽裡「不輸給別人」,老師叫學生硬練遠超過自身程度的曲子,這在台灣的音樂班是常態。作曲家寫了什麼、用了什麼邏輯、為什麼要這樣寫,通通不重要──能夠彈得很快、不要錯音、聽起來很厲害就好。

而且仔細想,古典音樂教育體制其實是超級鼓勵 Vibe Playing 的。比賽和考試拿高分的標準通常是「彈得出來、彈得正確、彈得流暢」,沒有一個項目叫做「請解釋一下剛才這段作曲家做了什麼設計」。這不就很像寫程式時,只管它「能不能跑」的感覺嗎?

Wi-fi 搭訕法

假設你完全不懂中文。你的 AI 助理告訴你,想認識一個女生,你就走過去對她說:

「請問你是 Wi-fi 嗎?我感覺我們之間有連線。」

AI 跟你保證「只要講這句,她一定會笑」。你完全不知道這句話是什麼意思,你敢在不查證、不理解的情況下直接講出來嗎?

這就是許多鋼琴學生每天在做的事:譜上說彈這個音、老師說這裡漸強、那裡踩踏板,學生全部照做,但完全不知道為什麼。本質上,這就是在講自己也不知道意思的話,只是流利地講出來。

說服力

評論古典鋼琴演奏時,「有說服力」或「沒有說服力」是很常見的說法。

小時候我曾經對這個詞感到困惑──是要用鋼琴說服誰?但長大就懂了。這並不是在指演奏者裝得一副很有自信、表情扭曲、身體搖得很用力的樣子。外表再怎麼裝模作樣都是沒用的。

所謂的「說服力」,是指讓聽眾感受到:「這個人完全知道譜上寫了什麼,知道作曲家有這個意圖──而且沒錯,他知道譜上沒有這樣寫、大家也不是這樣彈的──但他就是決定要這樣詮釋。」是懂了之後做出的決定,不是蒙在鼓裡的憑感覺彈。

Vibe Playing 的相反,就是「說服力」。

沒人能搞懂任何事

不過話說回來,一個非鋼琴專業聽眾,八成聽不出來彈奏者是不是在 Vibe Playing。我身為一個非資訊專業者,在使用一個程式時,其實也不 care 開發者到底懂不懂裡面的每一行程式碼,能用就好了。

會不會有一天,工具變得太方便,導致世界上沒有人能搞懂任何事呢?每個人都只是複製貼上 AI 的話、執行自己看不懂的程式碼、演奏著自己不理解的音符。一切只要憑感覺就可以運作良好了──直到 Wi-fi 斷線的那一天

請問你是 Wi-fi 嗎?因為少了你,我才發現我什麼都不懂。