2026-03-20 07:59:16
这里记录每周值得分享的科技内容,周五发布。
本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系([email protected])。

唐山河头老街景区的轨道车"大唐云车"。(via)
前些天,讨论区有一个帖子,提出一个问题。
如果未来的代码都是 AI 写的,那么我们怎么招聘程序员呢?

程序员负责代码,但代码是 AI 写的,不是程序员写的,那么应该怎么面试他呢?
你仔细想想,这个问题比预想的难多了。
首先,考察他的代码能力不重要(代码不是他写的),更重要的是考察他会不会 AI。只要善于使用 AI,能够产出合格的代码,对公司来说就是合格的人选。
但是,什么样的面试问题,能够考察出一个人是否掌握 AI?下面是我想出的一些问题:
这些问题能识别出 AI 编程高手吗?我完全没有把握。
其次,除了 AI,还要考察什么呢? 这也很不好想。
我应该还会问一些架构问题,你可以不写代码,但要懂怎么组织代码,架构出一个系统。但我也不确定这是必需的,因为 AI 生成的大型系统迟早变成一个黑箱,可能对于架构知识的要求也不是很高。
另外,我还要看看他以前的项目,如果以前他用 AI 做过类似的东西,那么应该问题不大。但这也不可靠,且不说完全类似的项目非常少,就看 AI 进化速度这么快,两年前的经验早不适用了吧。
总之我发现,很难确定什么面试问题是一定有效的,能够可信地筛选出合格的应聘者。AI 颠覆了软件开发,也连带颠覆了程序员面试。大家有好的面试问题吗?
有一点是确定的,面试各种编程细节意义不大了,因为你不需要记住语法细节了,直接问大模型就行。
1、访达小子
苹果公司最近发布了 Macbook Neo,有人注意到,官方的 Tiktok 宣传海报里面出现了一个全新的吉祥物(下图)。

上面海报的左上角有一个玩偶,以前没见过。
这个玩偶明显来自 Mac 电脑的访达工具(Finder),所以被称为"访达小子"(Lil Finder Guy)。

几天后,苹果公司又在一场直播里面,使用了这个形象。

人们纷纷猜测,这到底是偶然的行为,还是苹果公司真的会推出它作为吉祥物?
热心的网友让 AI 绘制了"访达小子"的完整形象。


看上去很可爱,就跟 Labubu 似的,有可能大受欢迎。
2、红外线编码
英国科学家发明了一种新的通信方式,通过热辐射二极管,将数字信号以热量形式传递。

肉眼看不见这种信号(因为它是红外线),也检测不到无线电波,但是它的热量以编码方式散发,在红外线热成像仪上能识别(上图)。
因此,这种方法接收信号需要热成像仪,再传入电脑的解码器。这可能对某些工业和军事场景很有用。
3、机柜种植
家里有多余的服务器机柜,怎么利用起来?

一个国外程序员想到机柜里面有电源,拉线和搁板都很方便,可以用来水培种植。

他买了一些 LED 灯带,用来模拟日照,每一层还安装了一个泵,用来自动进排水。

如果你想在家里种一些暖房植物,或者需要长时间光照的植物,服务器机柜确实是一个很好的方案。

1、我放弃了 Elasticsearch,转而使用 Meilisearch(英文)

Meilisearch 是一种开源的搜索软件,作者介绍怎么用它替代 Elasticsearch。
2、2016 年,我做过一次 AI 写代码创业(中文)

作者徐宥(Eric Xu)回忆他在2016年的 AI 创业,当时他想训练一个大模型,需要25万美元,但是找不到投资人。(@gengxiuli 投稿)
3、信息过载时代,我的漏斗式阅读工作流(中文)

每天有太多东西值得看,作者介绍他的信息处理工作流,通过 AI 过滤出值得读的内容。(@shawnxie94 投稿)
4、编译器的前端与后端(英文)

一篇科普文章,介绍编译器(比如 LLVM)的前端和后端的概念。
5、CSS 的 lh 单位(英文)

CSS 有一个字体大小属性lh,表示行高。
6、寻觅杜鹃花之王(中文)

大树杜鹃是最高大的杜鹃,是一颗会开花的大树(上图),1919年由英国人在云南发现。
后来,这个英国人死在云南,就无人知道哪里有这种杜鹃了,直到1982年才重新在高黎贡山找到。本文讲述这种植物的故事。
1、APTUI

一个 Linux 的终端应用,用于充当 Debian/Ubuntu 安装管理器,管理 APT 软件包。

如果你想尝试 WordPress,但没有服务器,可以使用官方新推出的这个服务,打开上面网址就可以了。
它把所有 PHP 脚本编译成 JS,在本地运行,不需要服务器,而且数据都在你的浏览器,下次打开这个网址,网站数据还在,参见介绍文章。

一个跨平台的图像编辑器,特点就是非常轻量级,可以在浏览器运行,也可以编译成二进制文件。

一个 Mac 抠图软件,大小只有 8MB。(@pangxiaobin 投稿)

macOS 菜单栏久坐提醒工具。(@lifedever 投稿)

一个跨平台的阅读软件,可以悬浮在桌面上,支持单行模式,适合想在工作流里"偷偷读书"的人。(@yaoyao2mm 投稿)
7、锤子便签

开源的网页版锤子便签,可以作为 Skill 调用。(@zhaoolee 投稿)

开源的微信公众号转 RSS 工具。(@tmwgsicp 投稿)
一个很有意思的 Chrome 插件,根据语速调节视频播放速度。如果剧中人说话慢,视频就快速播放,说话快,就慢速播放。
1、VibeGo

Vibe Coding 的开源 Web IDE,支持 Claude Code、Gemini CLI、CodeX、OpenCode 等。(@xxnuo 投稿)
一个开源应用,使用字节 seedream 图像模型,复刻小红书的图文笔记,从一篇可以衍生出另一篇。(@zhanchey 投稿)
3、AICheck

一个 Rust 语言编写的命令行工具,离线检测图片、视频、音频和文档是否由 AI 生成。(@MatrixA 投稿)
4、AionUi

开源的 Cowork 与 OpenClaw 的替代品,自动化各种电脑操作。(@cdxiaodong 投稿)
5、Lumo

一个 Claude Code 的本地桌面工作台,查看成本、Token、会话和编码时段数据。(@zhnd 投稿)

开源的 AI 动漫视频生成系统,只需输入文字剧本,即可自动完成角色提取、分镜设计、关键帧生成、视频合成的全流程。(@twwch 投稿)

网页检测你的机器,能够运行哪些本地的 AI 模型。
2、AI 是怎么回事(中文)

面向普通读者的通俗 AI 原理教程。(@wmyskxz 投稿)
3、TypeScript 数据结构与算法(Algorithms with TypeScript)

免费阅读的英文电子书,使用 TypeScript 语言介绍数据结构和算法。
4、频道冲浪者(Channel Surfer)

这个网页把 Youtube 改成传统的电视频道,每个频道都有节目表,可以切换频道。如果你不知道用 Youtube 看什么,就可以看这个网站。
1、巧妙的古建筑
因为缺乏机械和动力,古代建筑物往往包含了很多巧思。
(1)19世纪的英国麦克尔斯菲尔德运河,由于没有水位落差,需要马拉着船前进。
有时,马的牵引道从河的一边转到了另一边,马这时就需要过河。
为了不解开牵引绳,马就能过河,工程师就设计了"蛇桥",马可以直接走上去,中间还有让牵引绳通过的孔。

(2)法国南部的巴尔贝加尔水磨坊,建于公元2世纪,现在只剩下了遗址。
这个磨坊的位置在山坡上,连续建了16个相互连接的水车,充分利用了水能,每天能够生产25吨面粉,被认为是欧洲第一个大规模工业生产的磨坊。

(3)伊朗纳什提凡的古代风车,建在连片的屋顶上,一根木轴安装了由粘土、稻草和木材做成的立轴式风帆,强风会带动木轴,转动下面屋子里的磨盘,来磨碎谷物。


(4)中国西安的秦代上林苑遗址,发现了战国时期的陶瓷水管,现保存于西安博物院。

1、避免使用定制框架
很多小团队在工作中,往往会发明自己的"定制框架"。
他们原来使用的是通用框架,但有不满意之处,于是决定在通用框架基础上定制自己的框架。
这种"定制框架"有一些共同特点:
(1)由小团队创建,旨在解决他们的痛点;
(2)底层是其他更通用的技术栈或框架;
(3)引入原有技术栈不存在的新概念和术语;
(4)创建者声称这个定制框架"神奇地"解决了许多问题,并推广更多人使用它。
我的个人经验是,"定制框架"非常难用,引入了许多新概念,意图掩盖它带来的更多复杂性。
我建议,大家避免使用"定制框架",原因有下面这些:
(1)定制框架常常声称,它们能消除或隐藏原始框架"不必要的复杂性",但实际上做不到。即使定制框架能很好地处理80%的用例,但是因为引入了新的语法,剩余20%的用例就不如原始框架的灵活性和功能性。
(2)定制框架不易改动。它仅对开发团队的用例建模,以解决他们的特定问题,未来需求变化时,往往跟不上。另外,定制框架通常改动了原始框架的实现细节,而原始框架将来随时可能变动,你修改的细节越多,就越难跟上原始框架的变动。
(3)定制框架反映了开发团队的心理模型,这些团队专注于自己的问题,往往有很强的个人意见。这本身是好事,但也使得定制框架不适合其他人的心理模型。
(4)定制框架往往导致技术栈碎片化。你改动的只是跟你相关的一部分,其他部分保持不变。随着新的层不断增加,框架变得越来越难整体迁移,必须不断改动你原来没改的部分。
(5)定制框架缺乏维护。通用技术往往有一个专门团队或公司来维护,但定制框架通常由一两个创建者拥有。一旦他们离开团队或公司,就很难找到接班人。定制框架很大可能会随着原作者离开而消失,除非在此之前获得了大量采用,才有人愿意接手,而这种情况很少发生。
我不是说,你不要开发自己的框架,而是建议最好遵循三个原则:(1)新概念引入越少越好,(2)优先创建库,而不是框架。(3)不要做现有框架的包装器,而要从零开始构建。
1、
我想要的网络世界,是一个万物皆可塑的世界,让你不由自主地成为创造者。
2、
AI 让软件的成本从代码转移到测试和文档,一套好的测试套件的价值可能比编写代码本身更高。
3、
编程的核心在于抽象,即用一种远离底层技术的高级思维方式来思考代码。
4、
领导力就是让别人去做你想让他们做的事,而且是心甘情愿的。
-- 艾森豪威尔,美国前总统
面试的 AI 作弊----用数字人去面试(#342)
所有代码都是技术债(#292)
一次尴尬的服务器被黑(#242)
最大的机会来自新技术(#192)
(完)
2026-03-13 07:59:16
这里记录每周值得分享的科技内容,周五发布。
本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系([email protected])。

重庆涪陵某景区架设了世界首座"巨石索桥",桥面就是一块块巨石,一不小心就会踏空。(via)
Next.js 是目前排名第一的 JS 框架。平时遇到的 JS 全栈应用,我估计,一半用它开发。

两周前,这个框架被一则新闻颠覆了。
一个 Cloudflare 工程师宣布,他只用一个星期就用 AI 重新实现了 Next.js,起名为 vinext。

事实上,一天就生成产品原型了,后面几天只是在完善。
"真正动手是2月13日,当天晚上,基本功能已经实现。第二天下午,11个路由器做好了10个。第三天,已经部署到我们的服务器,实现了完整的客户端水合。
接下来的几天,主要进行安全加固:修复极端情况,扩展测试套件,提升 API 覆盖率至 94%。"
这个新的实现,比原版 Next.js 性能更好。
"早期基准测试中,构建速度提升了4倍,客户端软件包的体积缩小了57%,生产环境的 Next.js 应用已经直接跑在上面了。"
这个 vinext 的代码已经放出来了。

我觉得,这件事对 Next.js 的打击非常大。
Next.js 是 Vercel 公司的产品,背后有一个大型开发团队,每年都是巨额投入,已经整整做了10年。虽然是开源软件,但是企业版、云服务、插件、皮肤都要收费,去年的年收入达到2亿美元。
这种看似难以逾越的护城河,在 AI 面前不堪一击。一个工程师用了一个星期,就复刻了大团队十年的工作成果,现有的网页应用不改一行代码,放上去就能跑,原版的每个功能都支持。
你知道花了多少钱?Token 费用仅仅为 1100 美元!
这叫 Vercel 怎么再向 Next.js 的开发投钱,客户又怎么愿意再为某个功能付出高昂的使用费。
推而广之,所有的商业软件都受到了重创。代码的护城河不存在了,只要投入一小笔金钱,AI 就能复刻出大型软件。
那么,为了保护自己,软件公司下一步肯定要防止 AI 复刻。
怎么防呢?关键就是测试用例。
Cloudflare 工程师这一次能够复刻成功,主要原因是 Next.js 有完备的文档、庞大的社区文章、以及完整的测试用例。AI 模拟的每一个 API,只要能够通过原有的接口测试,就能确认百分百兼容。
如果拿不到测试用例,谁知道代码行为是否一致,谁敢放到生产环境运行。
可以想象,为了防止复刻,大型软件项目一定会保护自己的测试用例。测试才是新的护城河。

世界最流行的数据库 SQLite,本身代码15.6万行,但是测试用例9205万行,足足大了590倍!
其中,最核心的测试套件 TH3 是闭源的,不公开,主要测试航空、医疗等关键行业的极端情况和边缘案例,属于核心技术资产。正是这些保密用例,才让 SQLite 难以复刻。
无独有偶,就在前两天,另一个开源项目 tldraw 也准备将测试用例闭源。

说实话,保密的测试用例肯定不利于开源项目的发展,但是开发者需要保护自己的利益。在日益强大的 AI 面前,越来越多的软件可能会选择这样做。
AI 复刻软件还有一个版权问题,也引起了很大争议。

Next.js 是最宽松的 MIT 许可证,所以复刻没有版权问题。但是,有人复刻了一个叫做 chardet 的项目,就争议巨大。
chardet 本来采用的许可证,是限制较多的 LGPL,复刻以后改成了 MIT 许可证,引发了原始作者的抗议。
网上的意见也分成了两派。
支持者说,AI 只复刻了功能和接口,代码完全不一样,当然可以更改许可证。
反对者说,GPL 规定了,所有衍生作品都不能更改许可证,AI 复刻就属于衍生。
更麻烦的是,美国法律规定,AI 生成产物无版权,属于公共领域。这意味着,AI 复刻的软件不能设置许可证,设置了无效。
按照这条法律,软件许可证就意义不大了。管你是什么许可证,任何人 AI 复刻一下就能规避,AI 实现的版本一律没有版权。
1、AI 改写脏话
游戏平台 Roblox 宣布,将用 AI 实时修改玩家的对话,让其变得更文明。

以前,如果玩家在游戏里面骂脏话,系统只会将其过滤,显示为 ####,你还是知道他在骂人。
现在,AI 将重新修改整个句子,让表达变得更礼貌、更文明,你就察觉不到对方在骂人。
虽然这样未免有点虚假,但确实有必要。网络论坛也应该跟进,不要让人身攻击毁掉交流氛围。
2、飞机的激光上网
欧洲航天局成功进行了飞机的"激光上网"实验,通过激光将一架飞机与一颗卫星连接,实现了高速通信。

飞机上网现在都通过无线电波,比如星链就通过无线电,让飞机连接卫星。本次实验则是通过激光连接卫星。

上图就是安装在飞机舷窗上的激光终端。
激光通信的优点是带宽大,不受无线频谱的限制,这次实验的上网速度达到了 2.6Gbps,是星链的8到10倍。
缺点是激光与卫星之间必须保持直线,不能有云层和大气的障碍物。所以采用这种方式,大概只有飞到高空时才能上网。
Grammarly 是一个写作服务,提供一个收费功能"专家意见",让专家点评你的文章。

一个国外用户使用该功能时,震惊地发现,点评专家里面有他的前老板(下图),但是他知道老板已经去世了。

原来这不是真人点评,而是 AI 为每个专家建了一个分身,用他们各自的文章进行训练,然后让分身点评你的文章。
这引起了争议,我们是否有权搭建别人的"数字分身",然后冠以原始人物的名义(比如"孔子分身"或者"爱因斯坦分身")?
4、太阳能邮筒
网络通信普及以后,传统的邮筒怎么办?
英国皇家邮政想出一个办法,将英国各地3500个邮筒,变为"太阳能邮筒"。

邮筒顶部加装了太阳能光伏片,功能也从寄信,变成了收寄小包裹。

这样既保存了传统的红色邮筒,成为街道的景观,又为人们邮寄包裹提供了方便。

1、GitHub Issue 标题的注入攻击(英文)

这可能是第一起 AI 模型注入的真实攻击。Cline 项目使用 AI 对 GitHub Issue 进行分类,有人就在标题插入恶意提示词,从而成功拿到 npm 令牌,发布了一个恶意版本。本文告诉你这是怎么做到的。
2、重新评估 AGENTS.md(英文)

最近的一项研究提出,跟推荐做法相反,AGENTS.md 文件对 AI 编码不是促进,而是阻碍。
它只是让模型"思考"得更多(成本上升),生成结果却没有更好(性能下降)。
3、Temporal API 的九年历程(英文)

本周,Temporal API 正式通过了第四阶段。这意味着,它进入了 ES2026 标准,成为了 JavaScript 语法的一部分。本文是这个标准的起草者对九年推进历程的回顾。
4、AI 的胡说测试(英文)

国外有一个 BuillshitBench,专门问 AI 一些胡说八道的问题,看 AI 能不能分辨这是胡说,还是一本正经地回答。
5、原生 CSS 就足够了(英文)

本文展示了 37Signals 公司的 CSS 代码,表明不使用任何框架(比如 Tailwind)和构建工具(比如 Sass),只用原生 CSS 代码完全可以。
6、粪便物理学(英文)

一篇很另类的科普文章,解释为什么动物不管大小,排便时间都在5~19秒之间,平均12秒。
1、KULA

Linux 服务器的监控工具,只有一个二进制文件。

mac 电脑的屏保程序,用彩色的 Ansi 字符画作为屏保图案。
3、upiano

在命令行下模拟钢琴弹奏。

一个开源 Windows 应用,通过图形界面管理 Windows Subsystem for Linux(WSL)发行版。
5、Mole

开源的 Mac 电脑清理和优化工具。
6、PipeGate
一个将内网服务映射到外网的隧道工具,特点是比较简单,就是几个 Python 脚本,并且可以设置 UUID 客户端认证。

一个管理、测试 Webhook 的在线工具,个人可以免费使用。
8、Sentinel

将安卓手机转化为网络摄像头,实现实时监控和图像采集。(@suzuran0 投稿)

Mac 电脑的系统监控、管理面板。(@chentao1006 投稿)

一个 Python 命令行工具,监控本地各种 coding agent(比如 Claude Code、Codex、OpenCode)的使用量。(@MrQianjinsi 投稿)

一个开源的连接器,将各种 AI 编程工具与手机聊天软件相连。(@chenhg5 投稿)

只要在网页插入这个 JS 库,就可以使用自然语言操作页面,比如"点击导航栏的文档链接,总结其内容"。
一个 macOS 沙箱工具,用来在沙箱里运行 AI 编程工具。

一个 GitHub Action,为你的仓库添加一个图形标签(上图),显示该仓库相当于多少 Token,用来大模型的计算量。
1、世界监控(World Monitor)

世界局势的一个实时看板,把各种消息源都放在一个网页里。
2、炼油厂探索

一个动画互动网站,展示炼油厂怎样将石油变成汽柴油。

弹簧笔、打火机等生活小物品的机械装置动画。
1、密码的替代方法
一位程序员发明了一种新的密码方法,你觉得可行吗?
系统向用户展示一副扑克牌,让其从52张牌中依次挑出5张,作为密码。

下次登录时,用户必须按同样顺序挑出同样的5张牌。
1、复杂社会的崩溃
我们都知道,一个软件的复杂度不断上升,超过某个极限后,就会难以维护,最后往往被放弃。
美国历史学家约瑟夫·坦特(Joseph Tainter)认为,人类社会也是如此。如果社会的复杂度超过极限,这个社会最终也会崩溃。

1988年,他出版了一本名为《复杂社会的崩溃》的书,描述了罗马人、玛雅人和查科人等伟大文明的兴衰,试图回答几个世纪以来一直困扰着思想家的一个问题:为什么强大的社会会崩溃?
他认为,原因是这些社会有一个敌人----复杂性。
随着文明的发展,社会增加了越来越多的复杂性:更多的等级制度、更多的官僚机构、更深层次的社会结构。
一开始,新的等级、官僚、组织都是有用的,比如可以增加经济产出、税收等。但到了某个时刻,收益递减规律开始出现,每增加一点复杂度带来的回报越来越少,直至变成零甚至负数。
(1)法律条文和官僚越多,政府开销也就随之上升,长期很可能令社会无法负担。
(2)复杂度变大,会增加社会的不平等,因为能理解所有规则的人就越少,你就越离不开律师。懂规则的人会比其他人占优势。
(3)规则越多,维护和执行这些规则的机构也就越多,不利于社会提高效率。
(4)复杂性最终导致社会各阶层的差距变大,对立也随之而来。
以上因素的共同作用,导致历史上很多强大的社会最终崩溃。
1、
2021年,我感觉做一名优秀的软件工程师棒极了。软件行业蓬勃发展,机会很多,我热爱这份工作,觉得可以永远做下去。
2026年,我已经不确定软件行业十年后会怎样,即使还存在,必定与现在极不相同。我也许能找到出路,也许不得不离开这个行业。无论如何,我热爱的软件工作即将消失。
2、
与强大的 AI 对抗会是什么感觉?
你会感觉自己莫名其妙地弱了不少,AI 做的每件事都超出你的预期。
这就好像你和一位实力强劲的玩家玩一款随机性很强的游戏,你会感觉这位高手总是运气爆棚。
3、
阅读商战书籍是浪费时间。它们将简单的故事变成通用的建议,将偶然的成功转化为普遍的策略,并用激励人心的口号取代复杂的市场。
这些书的成功并不是因为内容正确,而是因为易于阅读并且让读者感觉良好。
4、
我想让 AI 告诉我怎么使用一种全新的、AI 也不会用的工具,就会提示 AI "执行 xxx-tool --help 来了解该工具"(假定工具名字是 xxx-tool),然后 AI 就学会用了。
-- Simon Willison,著名开发者
5、
时间是唯一不可再生的资源。AI 大模型是目前我所知的最便宜的赚取额外时间的方式。
低代码编程,恐怕不会成功(#341)
AI 没有护城河(#291)
中国的增长动力在内陆(#241)
一个程序员的财务独立之路(#191)
(完)
2026-03-12 16:01:06
大家这两天,有没有被"龙虾"(OpenClaw)刷屏?
到处是它的新闻,就连两会代表和新华社都在谈论。真让人跌破眼镜,一个 AI 软件竟能引起这么大的反响。

人们的热情高涨,免费的线下安装活动人满为患,网上的"付费安装"生意兴隆。

很多人大概还不知道,现在有一种最简单的龙虾使用方法:ArkClaw。
简单到你根本不需要操心安装,因为这是一个免安装的方案,它直接内置了龙虾,开箱即用。
我也是昨天才开始用,迫不及待跟大家分享,初步使用的感受。没有用过的同学,也可以把它当作《龙虾零门槛上手》教程,看看龙虾到底是怎么回事。
事情是这样的,老读者可能还记得,我在春节前测评了字节最新发布的 Seed 2.0 模型。

我在文章里说,这是字节目前最强的基础模型,手机豆包用的就是它,测试表现很不错。
字节的同学后来就向我赠送了 Coding Plan 套餐,方便继续测试这个模型,各种 AI 编程工具都可以调用它的 API(当然套餐还包含其他国产模型,也是自由使用)。

本周一,我突然发现,字节的这个 Coding Plan 套餐开通了一个捆绑服务,就是 ArkClaw。
我问了客服才知道,只要现在开通 Coding Plan,就能免费使用龙虾。
也就是说,只要你用字节的 AI 编程套餐,不用多花一分钱,字节就提供一台远程主机,里面安装好了龙虾,你可以自由使用。
需要说明的是,Coding Plan 分成 lite(首月9.9元)和 Pro(首月49.9元)两种套餐。lite 套餐只能免费体验7天,只有 Pro 套餐可以长期使用 ArkClaw。
ArkClaw 属于"云养虾"(又称"云龙虾"),就是把龙虾(OpenClaw)安装在火山方舟(字节的 AI 云服务品牌)的云主机上,它名字里的 ark 就是"方舟"的意思。
除了"云养虾",也可以把龙虾安装在本地计算机。

不了解的朋友可能会好奇,两者有什么区别,我简单说一下。
首先,你要知道OpenClaw 属于自动化软件,它的作用就是让用户使用自然语言描述需求,它通过大模型找出满足需求的方法,然后自动去完成。
当它安装在本地计算机(你的笔记本),就方便自动操作本地文件和本地设备,比如"找出拍摄于去年今日的照片"或者"关闭客厅的智能灯,并查询最近一周的耗电量"。
当它安装在云端,就能 7x24 小时跟各种网络服务互动,比如"收到电子邮件时,自动生成30字的内容摘要,向手机发送通知"。
所以,如果你需要自动化操作网络服务,并且需要长时间在线或者每天定时运行,那么就合适使用"云养虾"。
我给大家看一下,ArkClaw 的样子。
进入控制台,点击"立即创建",创建一个龙虾实例。

创建完成后,就已经安装好了,直接使用。

界面非常简洁,就是一个对话框。ArkClaw 对龙虾的官方控制台做了定制,简化了操作界面。
你可以在对话框里面,跟 AI 模型对话,这跟其他模型的用法并无二致。
举例来说,我们可以让它抓取信息。

可以看到,由于抓取的是动态内容,所以模型想到了很多实施方案,最后顺利完成。
大家要记住,ArkClaw 就是一台远程主机,任何服务器可以用的技术方案,它都能用,这比安装在一般个人工作电脑上的龙虾更强大。
获取信息以后,龙虾可以把这些信息发到手机。
目前,ArkClaw 支持与企业微信、钉钉和飞书绑定。其中,飞书因为是自家的产品,绑定操作最简单,便捷快速,扫码即可。其他两家操作都比较麻烦,具体见官方文档。
点击对话框上方的"飞书配对"按钮。(前面的"消息渠道"按钮,用于绑定企业微信和钉钉。)

系统会打开一个终端窗口,输出一个二维码,飞书扫描后可以创建一个机器人,跟当前的 ArkClaw 实例绑定。

通过这个机器人,你就可以在手机上跟当前这台 ArkClaw 实例对话了。

你也可以在电脑上,通过 ArkClaw 网页控制台,向你的手机发消息。

电脑端输入上面指令后,手机端就会推送消息(下图)。

我们还可以规定,龙虾执行某些任务的时间和频率,也就是定时任务。
首先,使用自然语言,在对话框设置定时任务。

设置完成后,你的手机就会每天收到消息了。
如果要删除定时任务,也是使用自然语言发出指令。
龙虾本身的能力是有限的,总会遇到一些它不知道如何处理的问题。这时,就可以通过 Skill(技能)扩展它的能力,这大大增加了龙虾的用途。
什么是 Skill?简单理解,它就是一个文件包,里面包含了指令和示例,用来教模型如何完成某些特定的任务。
网上已经有很多别人写好、分享出来的 Skill,只要挑一些自己需要的,让龙虾加载,就能扩展对应的能力。网站 ClawHub.ai 就收集龙虾专用 Skill,已经有近20000个了。

我本来想用小红书 SKill 来举例,演示龙虾如何学会写小红书。但是,官方昨天发公告了,最近这样做的人太多了,现在开始封账号了。
那么就换一个例子。

上面截图就是使用自然语言,让龙虾从 ClawHub 网站下载安装高德地图(amap)的技能。
龙虾本来不知道怎么使用高德地图,有了这个技能就学会了,可以从中查询信息。这个技能的具体详细,可以查看它的主页。
使用的时候,也是直接用自然语言描述需求,模型会自己加载调用所需的技能。

上图的截图就是通过高德地图,查询实时路况。
ArkClaw 的其他功能,都在"设置"菜单(下图),比如调整底层模型。

只要是 Coding Plan 套餐提供的模型,这里都能使用。
"设置"菜单还有两个很有用的功能。
一个是"打开终端",它会在网页上打开一个终端窗口,让你通过命令行直接操作 ArkClaw 所在的远程主机。

从上面的终端窗口截图可以看到,ArkClaw 底层是 Ubuntu 系统。
另一个是"配置网盘"。某些情况下,你可能需要向 ArkClaw 上传/下载文件,这个功能允许当前主机与火山引擎的对象存储服务 TOS 绑定,相当于有了一个无限容量的网盘。

以上就是我昨天第一天使用 ArkClaw 的主要内容。
我的感受是,它确实大大简化了龙虾的使用,免安装、开箱即用,让龙虾的操作变得简单直观。通过自然语言加载调用 Skill,也很自然流畅。
它最大的强项就是跟字节生态深度融合,配合得十分丝滑:底层 Seed 2.0 模型 + 飞书推送 + 火山引擎网盘,完全不必复杂的配置。
它是一个跟字节 Coding Plan 捆绑的服务,不用额外付费。相比自己从头搭建"云龙虾",云主机和 AI 模型的费用就省掉了,这是一笔不小的费用。
作为程序员,这个 AI 编程的 Coding Plan + 云龙虾 ArkClaw 主机的捆绑方案,还是很有吸引力的。
(完)