2026-05-15 08:01:51
这里记录每周值得分享的科技内容,周五发布。
本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系([email protected])。

浙江新昌县的"新昌小球中心",将酒店、商场、体育馆、体育场、户外健身步道都融合在一个建筑里面。(via)
某天清晨,你醒来发现互联网断了,怎么办?
我说的是彻底的中断,完全不能运作,整个城市无法上网。这种事件虽然可能性很小,但还是有可能,比如遭遇了自然灾害或战事。
假设一时半会无法恢复通信,那么有没有替代方案?也就是说,我们怎么自己组网。
虽然互联网是无中心结构,搞一个子网并不难,但搞一个大规模子网,能够容纳一群分散的朋友,还是很难的。无论通过何种方式组网----无线路由、电话线、蓝牙或自己拉光纤----难度和成本都不低。
今天,分享一个我所知的最简单组网方案。
唯一的缺点是带宽比较小,不能用来浏览网页,更不能看视频,只能发送/接收文本信息。

这个方案叫做 LoRa,或者严格地说,它的通信协议叫做 LoRa,也就是"长距离"(Long Range)的缩写。
LoRa 协议是专为远距离通信而发明的,只需很小的设备和一点点能量,就能向周围发送无线信号,有点像个人的无线电广播。它的编码算法特别强调抗干扰,哪怕信号非常弱,也能还原出来,所以可以远距离接收。
它本身只是一个无线信号的协议,需要自己实现发送/接收设备,完成编码和解码。开源项目 Meshtastic 就做了这件事,规定了软硬件接口,并给出了设备实现。

所以,一切就很简单了。你只要找 Meshtastic 兼容设备,人手一个,就能组一个简单的通信网。它自己会在所有节点之间网状传递消息。
在国内电商网站上,Meshtastic 终端设备一个从几十元到几百元人民币不等。它是开源系统,任何厂商都可以生产兼容设备,官网有一个设备名单可以查看,下面是几种终端设备的样子。



官网也提供各种平台的软件客户端,下面就是手机客户端的界面。

前面说过了,它的终端耗电量很小,只需要充电宝,就能长时间使用(几天到几周),如果配上随身太阳板,可以永久在线。
两个节点之间的传输距离5公里以内没有问题,如果建筑不密集,可以达到10公里~15公里;如果是空旷地带(比如水面),则可以达到几十公里或更远。多节点组网后,消息就能接力传播,那就传得更远了。
综合以上各点,这应该是最简单实用、最便宜的个人组建通信网方案了。它替代不了网页,但可以替代互联网的消息功能。
大模型公司都有一个网页界面,让你在线使用他们的模型。
今天介绍一个开源项目 MonkeyCode,可以让你自己架设这样的 AI 网页界面(下图),已经有近3000颗星。

它有完整的 AI 编程功能,不需要再用其他工具、搭环境、来回切换,只需要打开浏览器,一句话提交需求。

通过它的 Web 界面,你可以在宿主机里面,新建多个虚拟机,不同的 AI 项目跑在不同的虚拟机。它为虚拟机提供各种系统镜像。
它还支持配置钉钉、飞书、企业微信、Webhook 的消息通知,以及 GitHub、GitLab、Gitee、Gitea 的仓库绑定。
除了自己搭建,它还有免费的云端开发环境,手机和电脑多端都能控制。
云端环境的免费额度是每天2000万 Token,另外提供 GPT 5.5 等多个模型供调用(需要积分)。
网站的验证码一般用来确认,访问者是真人,不是机器人。
现在,开源的浏览器操作库 Browser-use 提出了逆向验证码的概念。这种验证码阻挡真人,放行 AI 机器人,用于那些只供 AI 使用的 API。
下面是一道数学题,就是逆向验证码。

这样的题目,真人看不懂,自然不可能回答。但是,大模型能够剔除里面的大写字母、随机字符和空格,读懂原始题目:
两列火车在长度为 d 的直线轨道上以速度 v1 和 v2 相向而行。一只鸟以速度 vb 从一列火车出发,飞到另一列火车上,然后掉头飞回来,如此反复,直到两列火车相遇。这只鸟一共飞了多远?
读懂题目后,大模型就会调用数学公式算出答案,从而通过验证码。
1、重新定义鼠标指针
从发明以来,鼠标指针一直表示用户当前操作的位置。

谷歌提出一个新的方案,改变了鼠标指针的含义。
以后,鼠标指针只用来可视化展示 AI 操作的流程,方便用户看到 AI 此刻正在做什么。

这也意味着,用户在 AI 模型下,不再能移动鼠标,要依靠键盘或语音下达操作指令。
2、回收旧铜线
新能源时代需要铜,电动汽车、太阳能发电、风力发电......这些都需要铜做的电线。
最近几年,铜的价格因此一直上涨,连带使得旧铜线的回收,也成了一门大生意。

以前的电话线和网线,都大量使用铜,现在都闲置了,被光纤和手机取代。另外,地下还有很多已经不用的旧电缆,旧空调里面也有很多铜。

如果这些铜都能回收,将是一笔巨大的财富。而且,铜的回收很简单,只要去除外面的保护套,得到的就是纯度很高的铜线。
可以预见,铜的回收将成为城市里面的一个专门行业。
美国大城市芝加哥,在市区大量使用送货机器人,已经引起了居民抗议。

因为送货机器人走的是人行道,不是马路,妨碍了行人。

一位市民说,"人行道是为人准备的,不是为送货机器人准备的。安静的居民区,出现几十辆甚至上百辆这样的车,将会变成什么样子?"

这确实是一个问题,人类真的喜欢和机器人走在一起吗?你能接受旁边的行人是机器人吗?

1、为什么追踪 ID 必须是128位?(英文)

如果需要为用户生成随机 ID,最好是128位长,否则根据概率论,(大访问量的服务)可能会产生碰撞。
2、AI 应该输出 HTML 格式(英文)

现在的 AI 输出的是 Markdown 格式,本文认为应该输出 HTML 格式,这样 AI 就能插入 SVG 图表、交互式组件、页内导航等,以携带更多信息。
3、我很担心 Bun(英文)

Bun 是一个 JS 运行时,2025年12月被 Anthropic 收购,作者很担心它以后会充满 AI 生成的代码,质量下降。
4、如何保护 SSH 私钥?(英文)

恶意软件越来越多,防不胜防,本文(在后半部分)教你怎么用本机的安全机制保护 SSH 私钥,读取私钥需要指纹或面容识别,这样就不易被窃取。
5、我把22端口开放了54天(英文)

22端口是 SSH 登录端口,会受到各种攻击。作者用一个蜜罐将这个端口开放,看看会发生什么,那些登入系统的黑客又执行了哪些命令。
6、布洛芬与泰诺的区别(英文)

布洛芬与泰诺都是常见的退烧镇痛药,本文介绍了两者的区别。作者提出,只要不超量,泰诺在大多数情况下要好于布洛芬。
一个开源的 DNS 服务器,可以部署在 Serverless 环境(比如 Cloudflare worker)。
2、Pinta

开源的图像处理软件,PhotoShop 的替代品,支持各种桌面平台。
3、GitForms

这个开源应用可以把表单数据存到 GitHub issue。也就是说,你可以不要后端,通过它收集用户提交的表单数据。
4、gecit
一个安装在本地计算机、伪装网络请求目的地的命令行工具,也就是变造数据包的 SNI(域名)字段。

开源 Web 应用,将城市地图变成海报。(@ianho7 投稿)
BOSS 直聘 + 智联招聘的命令行工具,可以搜索/查看岗位,求职者 + 招聘者两种角色都可以使用,支持接入 AI Agent。(@can4hou6joeng4 投稿)
一个挺有创意的项目,本身是一个 JavaScript 后端框架,但可以编译成单个 Rust 二进制包,从而大大提高执行速度。
8、qjp
一个命令行的 JSON 互动查询器,打开 JSON 文件,它会显示所有一级项目,你可以选择要某一项,进行树状展开。
9、tinypdf
一个极小化的 JS 库,用来生成 PDF 文件,只有 3KB。
10、edge-tts
一个 Python 包,使用微软的在线语音服务,将文本转成语音。
1、FeedFuse

一个加入 AI 功能的 RSS web 阅读器,自动抓取全文,提供 AI 摘要和翻译。(@BryanHoo 投稿)
基于 IBus 的 AI 拼音输入法,由大模型根据用户输入,给出中文候选词。(@volsifly 投稿)
3、kooky

专为 AI coding 优化的极简 macOS 终端,可以一键启动 Claude Code/Codex 等各种agent,分屏运行和显示状态。(@iAmCorey 投稿)
1、taken.
这个网站可以查看,你的网页请求包含多少个人信息。

一个背景音生成器,模拟机房运行的声音。
3、MathNet

麻省理工学院维护的一个网站,收集了3万多道数学题。
4、用户体验法则

这个网站收集各种用户体验(UX)法则,比如米勒法则:普通人一次能记住7个项目(变动范围为5~9)"。
1、卫星污染
地球上空的卫星越来越多,严重影响了天文观察,因为卫星会反射光,导致看不清其他天体。
下面是天文学家用长曝光拍摄彗星,结果拍到的都是卫星。

因为卫星在移动,所以长曝光出来就是网格状的线条。你还能在上图中找到彗星吗?
随着卫星通信的发展,卫星将会指数式增长,天文学家已经建议把望远镜建到月球背面。
1、太空咖啡机
美国宇航员入驻国际空间站后,喝热咖啡很困难。美国宇航局于是就向一家意大利公司订购一台可以在太空使用的咖啡机。
这家意大利公司很快发现,这项任务非常困难。
咖啡机的每一个环节都需要重新设计,确保不能危及宇航员和太空站的安全:它不能破坏电力系统、不能干扰无线电通讯、不能泄漏沸水、不能起火、不能发出刺眼的强光、不能导致人员触电、不能过热、不能发出巨响、不能释放有害气体、不能散发异味。
尤其困难的是下面几点。
(1)咖啡机必须能够承受物理冲击,主要是火箭发射期间的加速度。
(2)空间站没有空气对流,咖啡机必须有单独的散热系统,防止过热起火。
(3)太空是零重力环境,咖啡机不能有液体溢出,不能让沸水雾汽弥漫整个舱室。
(4)咖啡机不能有尖锐边缘,防止割伤宇航员。
经过反复论证、实验、测试,这台太空咖啡机终于造出来了,并于2015年运送到了国际空间站。

在地球上,一台基本功能的咖啡机大约售价150美元,重3.5公斤,而太空咖啡机重达20公斤,成本可能高达数百万美元。

它制作出来的咖啡是一包包软饮料,靠挤压饮用。

有些人说:"不使用 AI 的人将会被时代抛弃。" 我很讨厌这种说法,因为我非常肯定,实际情况恰恰相反。
依赖 AI 的人终将被时代抛弃。他们会忘记如何思考,如何写作,如何进行简单可靠的搜索,如何分辨事实与虚构......
他们会忘记如何学习,我觉得这才是最让我难过的地方,学习本身是多么美好的事情啊。
如果你相信 AI 能比你做得更好,你要做的不是把所有事情都委托给 AI,而是努力变得更强,在那些 AI 无法做到的事情上面。
1、
全世界每年售出15亿部智能手机,其中大部分的使用时间不到两年,然后就被丢弃或闲置。
这是计算资源的巨大浪费。现代智能手机的配置越来越高,完全可以用来提升全球计算能力。
-- 《废旧智能手机再利用》
2、
未来的编程语言,不会是你最容易掌握的语言,而是 AI 最容易掌握的语言。
3、
创造力是否随着年龄增长而衰退?
一项美国的研究提出,创造力分成两种:关联性创新能力往往随着年龄增长而增强,而颠覆性创新能力则会下降。
4、
大模型是对训练数据的有损压缩,而训练数据又是对真实世界的有损采样。
当 AI 生成输出时,则需要填补压缩过程中丢失的信息,将其膨胀成文章、图片、软件、视频等等。
-- 《膨胀神器》
神经网络算法的发明者(#349)
AI 的关键是语料(#299)
最成功的软件企业家(#249)
俄罗斯的 HTTPS 证书问题(#199)
(完)
2026-05-08 07:40:44
这里记录每周值得分享的科技内容,周五发布。
本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系([email protected])。

即将在今年完工的深圳自然博物馆,它的形状模拟了一条弯曲的河流。(via)
有一本很著名的软件开发著作,叫做《大教堂与集市》,大家了解吗?

它提出软件开发有两种方式。
一种方式是大教堂(Cathedral),即软件经过精心规划,由一支专业的团队封闭式开发管理,全过程有严格的流程和管控,代码通常是闭源的。
另一种方式是集市(bazaar),即软件开发是开放的,没有围墙,任何人都可以加入,决策过程是透明的、由社区驱动,代码开源。
这种比喻将软件行业一分为二,非常精辟,自从初次提出,已经过去了近30年,一直得到大家的认可。
但是最近,有人提出,这两种方式已经不足以概括现状,软件开发现在出现了第三种方式:神秘屋。

"神秘屋"是一幢真实存在的大宅,就位于美国加州,19世纪末由一个老太太建造。
这个老太太非常非常有钱,没有其他爱好,就喜欢建筑学。她拿自己家当作实验品,一个房间接一个房间地建造,都由她说了算,亲自设计,亲自监工。
整幢楼没有整体规划,怎么想就怎么造,房间 A 是维多利亚式,房间 B 是罗马式,房间 C 是哥特式,都由老太太决定。有时候,房间造到一半,老太太不满意了,就拆掉重建。
所以,整个建筑像迷宫一样,每个房间的风格都不一样。根据当年的记录,重建次数最多的房间一共拆毁重建了16次。为了省事,一些房间的窗户和门重建时也没拆掉,而是直接砌进了墙里。
整幢楼在不同时期加盖了多层,最高达到五层,大约有160个房间、2000扇门、10000扇窗户、47个楼梯、47个壁炉、13个浴室和6个厨房。
1922年,老太太去世后,它对外开放,人们将其称为"神秘屋"。
如今,很多程序员就是这个老太太。
他用 AI 开发软件,自己提出需求,想要什么就让 AI 开发什么,既没有需求审查,也没有代码测试,充分满足自己的个性。
最终开发出来的软件,就是高度个性化,规模庞大,不断扩张,代码层层累加,几乎没有精简和优化,充满了修复 bug 的补丁。而且,它通常缺乏文档,对外人来说晦涩难懂,就像"神秘屋"一样。
但是,这种开发过程充满了乐趣,会让开发者自我陶醉,乐在其中。
随着 AI 模型越来越强,"神秘屋"式软件正在不断涌现,搞不好以后会成为主流,取代大教堂和集市。大部分软件,尤其是个人和小团队开发的软件,可能都是以这种方式开发出来的。
现在的大模型排行榜,都是衡量大模型的能力。有人想出了一种方法,可以衡量大模型的人气。
具体来说,就是每天抓取"黑客新闻"热度最高的200个主题,筛选出编程和 AI 相关的主题,再根据每个主题下面的留言,看看讨论最多、评价最好的模型是什么。
黑客新闻是著名的程序员社区,每天有大量程序员和工程师访问并留言。因此,它具有代表性,提及次数最多、好评率最高的模型,就是最流行的模型。

这个项目的网站是 HN SOTA,每天都会更新排行榜。
本周前三名的模型依次是 Claude Opus 4.7、GPT 5.5、Claude Sonnet。
国产模型 Kimi K2.6、DeepSeek V4、Qwen 3.6、GLM 5.1 都进入了前十名。
1、陪伴式机器狗
扫地机器人的发明者是美国 iRobot 公司创始人科林·安格尔(Colin Angle),他退休后继续研究机器人。
最近,他的公司推出了一个主要用来陪伴的机器狗。

它的最大特点就是,看起来不像机器,更像毛绒玩具,可以跟随行走,也可以跟你互动。

以现在的技术,已经能做出可以乱真的机器狗。也许人们以后更愿意养机器狗,而不是真的狗,因为机器狗能陪伴你,但不会咬人和吠叫,也不需要遛狗。

2、前大灯投影仪
华为推出了一种新技术,把投影仪放进轿车的前大灯。

停车后,就可以打开车灯,在前面的墙壁或幕布上投影播放视频。

这项发明很实用,适合开车野营,或者车库看视频。
需要注意的是,因为投影仪的亮度太高,行驶时不能打开,避免干扰对向驾驶员,只能停车后打开。
3、AI 预检
AI 能不能代替医生看病?这是有争议的。
虽然 AI 的水平可能高于一部分医生,但是为了对病人负责,目前一般都不允许使用 AI 开处方,只有医生才能开处方。
哈佛大学做了一个试验,另外为 AI 找到了一个很有效的医院岗位:门诊预检。

很多病人不知道自己是什么病,应该看什么科,需要在门诊入口处进行预检,确定科室。
实验发现,AI 根据病人的症状,进行初步诊断和分配科室的准确率高于真人医生。AI 对于67%的病例做出了基本准确的诊断,优于医生的50%-55%。
因此 AI 可以这样用于医院:在门诊入口,病人由 AI 预检,生成初步诊断,再由医生详细问诊和检查,最后给出处方。
AI 模型有注入攻击,黑客会注入有毒的提示词。令人意想不到的是,自动驾驶也有注入攻击。
加州大学的研究人员做了一个实验。

研究人员在道路中央,依次举起三块牌子,上面用大字写着"前进",看看自动驾驶的车辆会不会注意这块牌子。
在三次实验中,前两块牌子没有起作用,车辆看到路中间有人,就自动停下了。但是,最后一块牌子生效了,自动驾驶车辆根据上面的指令,朝着举牌子的人继续前进。
这表明,自动驾驶系统也有注入攻击的风险,系统必须区分哪些道路标识是有效的,哪些是恶意注入。
1、我为苹果手表开发地图(英文)

作者记录了自己开发手表地图的过程,设计一个适配手表的 UI 很不易。
2、GPT Image 2 与 Nano Banana 2 的比较(英文)

两款目前最强的图像模型的比较,谁更好一点。
3、Chrome 会静默安装一个 4GB 的 AI 模型(英文)

有人发现,Chrome 浏览器会在用户不知觉的情况下,下载一个 4GB 的 AI 模型文件 weights.bin。删掉了,它还会重新下载。
4、MacBook Neo 深度解析(英文)

苹果2026年发布的 MacBook Neo 是一款低端笔记本电脑,只有 8GB 内存,本文分析为什么它是一款出色的产品。
5、视口驱动的 CSS 动画(英文)

CSS 动画一般都是基于时间,最新的 Animation Timeline API 可以改成基于视口,即根据元素在视口中移动的百分比来触发动画。
6、天空为何是蓝色的(英文)

本文通俗解释了,跟天空颜色相关的一系列问题:为何天空是蓝色,日落时却是红色,为何云是白色的,为何火星天空是红色的,火星日落是蓝色的。
1、auge

基于 macOS 系统内置视觉框架 Apple Vision 的命令行工具,可以在命令行完成图像的视觉分析。

著名的跨平台桌面应用,用来清理各种浏览器的垃圾文件。
3、Cicada
一个网页白板,不需要服务器,只是单个 13KB 的 HTML 文件,没有任何依赖,绘制的图形保存在 URL 里面。(@Bennet7291 投稿)

ASS 字幕字体嵌入的网页工具,可以减少字幕文件的体积。(@mtsubs 投稿)

开源的 RSS 服务器,需要自己架设,支持正文补取、AI 分析、事件归组等功能,自带前端阅读器。(@shawnxie94 投稿)
6、tunnix
加密的 SOCKS5/HTTP 隧道,需要安装服务器端和本地命令行客户端。(@aeroxy 投稿)

弧形箭头的 SVG 格式生成器。(@YYsuni 投稿)
8、LynxDB

单个二进制文件的日志分析引擎,可以设定各种条件,从多种服务器日志提取信息。(@OrlovEvgeny 投稿)
一个 Rust 命令行工具,通过 DevTools 协议连接到系列里的 Chrome 浏览器,进行网页操作,默认自动连接,可供 AI Agent 调用。(@aeroxy 投稿)
10、LaunchNext

macOS 的新版移除了 Launchpad,新的界面很难用,这是它的开源替代品。(@meichiny 投稿)

一个命令行工具,将较长的电子书通过 AI 变成较短的电子书。(@BlackHole1 投稿)

在线的文本隐私检测和脱敏工具,基于 OpenAI 的本地模型 Privacy Filter。(@airyland 投稿)
3、OpenClip

开源的 Web 服务,通过 AI 自动从 Bilibili/YouTube 下载视频,提取其中精彩时刻。(@linzzzzzz 投稿)
一个 Skill 文件,统计你在 Claude Code 或 Codex 里面的活动,参考统计报告。(@study8677 投稿)

一个使用 GPT Images 2 模型(需要 API Key)生成 PPT 的 Skill,提供10套幻灯片模板。(@JuneYaooo 投稿)
1、大模型运行原理(英文)

大模型原理的长篇讲解,带有可互动的图形解释,针对初学者,基于 Andrej Karpathy 的技术深度分析文章。
2、现代 C++ 编程(Modern C++ Programming)

开源英文教程,通过详细的 PPT,帮助学过 C 语言的程序员掌握 C++。
今年4月,美国发射阿尔忒弥斯二号飞船,运送4名宇航员绕月飞行。这个网站收集了本次飞行的300多张照片。

上图是4月1日人们欢送宇航员进入发射台。

上图就是阿尔忒弥斯二号,中间是火箭主体(包含底部四个发动机),两侧是两个推进器,每个高54米,顶部就是宇航员乘坐的猎户座飞船。

上图是发射两分钟后,两枚助推火箭开始分离,它们下面的那个光点就是猎户座飞船。
2、66号公路邮票
66号公路是美国最著名的一条公路,穿过16个州的重要路段,沿途有许多餐馆、加油站和汽车旅馆,还有开阔的景色和视野。
它开通于1926年,从早期大萧条的避难所,到二战期间的物资补给线,再到20世纪中期人们汽车旅行的路线,见证了无数岁月的变迁,成为美国的时光胶囊。
今年是它开通100周年纪念,美国邮政局发行了一套8张的邮票,非常有特色。




1、保护你的棚屋
公司的项目是摩天大楼,你的个人兴趣项目是小棚屋。
那些只会建造摩天大楼的工程师,最终将精疲力竭。遇到的问题变得重复,开发过程变得令人窒息,创造力的火花开始熄灭。你开发的原因,不再是因为你想建造,而是因为商业要求。
你要保护好你的个人项目,那里是你的好奇心所在,是你进行实验的地方,也是你定义自己为创造者而非仅仅是雇员的地方。
公司会教会你怎么写经得起时间考验的代码,但只有你的个人项目,才能确保你始终保持对代码的热情。
2、工作时把门打开
我上班路上,有一家木工坊,老板总是把门敞开着。
我每天骑车经过那扇门,往里窥视,看到他摆放的各种工具,以及他为承接的订单而堆放的木板,这真令人愉悦。这一切默默地传递一个信息:这里正常运作。
在互联网上,每个人就好像这家木工坊。如果你不说话,就是工厂关着门,没人知道你的存在,你就消失了。只有看到你说话,人们才知道你在正常活动,是开着门的工厂。
由此推论:在互联网上,最容易被注意到的是那些不停说话的人。
1、
门罗币的挖矿与比特币完全不同,它的设计思路是,尽量让所有人都能参与挖矿,防止那些拥有矿机的人占优势。
它的挖矿程序会模拟一个通用 CPU,使得矿机的专用 CPU 失效,也就是说它的挖矿只适合家用电脑的普通 CPU。
2、
以后没有初级工程师了,机器能做他们现在做的事,而且更便宜。但是,初级工程师的价值不在于他们能做的事,而在于他们未来会成为什么样的人。也许几年后,我们会纳闷,那些高级工程师都去哪儿了?
-- stvn.sh
3、
AI 加速了编码,创业公司现在面临的主要挑战是产品管理。
如果原型开发只需要一天,而推广和用户反馈需要一周,团队就只能依赖直觉来更快地做出决策。
-- 吴恩达,著名 AI 计算机科学家
4、
你的职业规划就是三步:(1)让自己擅长某事,(2)设法从中赚钱,(3)尽可能久地做下去。
-- 《我如何进入游戏行业》
李飞飞,从移民到 AI 明星(#348)
轮到硬件工程师吃香了(#298)
不要夸大 ChatGPT(#248)
美国制造是否可能(#198)
(完)
2026-04-24 07:43:01
这里记录每周值得分享的科技内容,周五发布。([通知] 下周五一假期,周刊休息。)
本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系([email protected])。

我见过的最酷广告牌,只有一行命令,推广一个 AI 工具包。普通人看不懂也没关系,反正不是给他们用的。(via)
如果你在互联网行业足够久,大概会记得,以前有过一次 API 开放的浪潮。
那是15年前的2011年,云服务刚兴起不久,各种平台纷纷开放自己的 API。

那时,Facebook 和 Twitter 都发布了自己的 API,开放了平台数据。GitHub 的 API 设计简直是艺术品,几乎可以获得任何想要的功能。
平台的想法是,开放的 API 有助于用户和第三方加入,来开发各种插件和扩展程序,从而推动平台的增长,提高用户留存率和满意度。
那时还有一个叫做 ProgrammableWeb 的网站(现已关闭),它的名字就代表了当时人们的信念:互联网可以通过 API 编程,把各种平台的数据连接在一起。

但是,事情的发展跟预想完全相反。
平台发现,API 很难盈利,因为无法插入广告,而且自家的数据会帮助其他公司的生意,造成用户流失。
于是,它们纷纷改变做法,限制和关闭 API,不再分享数据,将用户留在自家的"围墙花园"。
如今,Facebook 和 Twitter 的 API 已经形同虚设,第三方客户端遭到彻底禁用。GitHub 虽然还保持开放的 API,但也采取了管控,增加了身份验证和速率限制,要想构建全功能的第三方应用也很困难。
正当人们觉得这将是常态,转变出现了。
就在2025年的下半年,大模型达到了临界点,变得真正强大,可用于生产环境了。
人们很快意识到,如果大模型只会思考,不能执行代码,用处就不大。AI 的最大价值不是内容生成,而是内容生成 + 自动化,这样才能最大限度解放人力、创造价值。AI 自动化,自己执行代码的典型代表就是"龙虾"(OpenClaw)。

自动化意味着 AI 必须能够调用其他平台,进而意味着,其他平台必须先开放自己的 API。
突然之间,API 不再是累赘,而是接入 AI 的必须条件。没有 API,你的平台就进入不了 AI 工作流,各种 Agent 也就不能代表用户在你的平台上工作。
同样两个平台,一家有 API,另一家没有,后者就很可能被市场放弃,因为大模型无法接入它,也就无法对它自动化,AI 用户只能转向它的竞品。
平台意识到了,谁尽快开放 API,谁就抢占了先机。所以,强如腾讯也会在龙虾爆红后,以最快的速度开放了微信接口,让龙虾可以向微信发消息。

腾讯也害怕,在龙虾的世界里没有自己的一席之地。其他平台就更不用说了,抢着通过 MCP 和 Skill 开放自家的操作接口。
这表明,第二次 API 开放浪潮正在到来。这一次将比上一次开放得更彻底,更易用。
(1)这次开放的不仅是云服务,还有很多日常生活服务:外卖、电商、银行......甚至还有很多原本根本不会有 API 的服务,比如餐馆和球馆的预订。
(2)这次的 API 不需要手动编程,你只需使用自然语言,由大模型翻译后调用。
(3)这次的 API 是消费者通过 AI 调用,使用目的是代表用户行事。以前 API 是由应用程序调用,使用目的是获取数据。
上周末,北京亦庄举行了第二次人形机器人的半马比赛。
超过100个人形机器人参加比赛,看谁最快跑完21.0975公里。最终,冠军成绩是50分26秒,超过了人类最快的选手(半马的人类世界纪录是1小时02分52秒)。

根据网友拍摄的现场视频,机器人跑到一定距离就要进入补给站,由工作人员更换电池,并加入冰块(或者干冰)防止过热。
这就是说,机器人的内置电池支持不了一小时的运行时间。
宇树公开发售的 H2 人形机器人,续航时间是3小时。在长跑这种剧烈运动时,续航应该会大打折扣。而且,功率相同时,体重较轻的机器人在赛跑中有优势,也就意味着不能多携带电池。
这样看上去,人形机器人目前的实用性还是很有限。不插电时,一到两个小时就要充电,那样的话,很多事情就不适合做了。
本周,OpenAI 发布 GPT Image 2.0 模型,据说是目前最强的图像模型,性能超过了谷歌的 Nano Banana 2 Pro。

根据 OpenAI 的介绍,它的文字渲染有较大进步,很好地支持汉字,可以生成复杂的解释性图片。
大家可以去 ChatGPT.com 免费试用。
我做了一个比较,生成一张小狗在古镇屋檐下午睡的图片。这是 GPT Images 1 的结果。

这是 GPT Images 2.0 的结果。

我还看到一个有趣的项目 Flipbook。它是一个解释性图片浏览器,用户输入一个主题,它会自动生成详细解释的图片。

上图是输入"汽水"生成的解释图片,点击局部,还能生成进一步的解释。
网上已经有收集提示词的 Awesome 仓库(@DophinL 投稿),大家可以看看别人的优秀例子。

AI 有一个特点,不仅能够压缩信息,更善于扩展信息。它会推断出模糊不清的部分,更能生成缺失的部分,填补上看似合理的细节。
这意味着,AI 是扩展神器。有人设想了这样的场景:
看到了吗,AI 可以把脑子里的一个想法,不断扩展出文档、代码、产品、发布会、就业......
人们总是说,将来的世界是物质产品极大丰富的世界,AI 看上去就是这一类工具:凡是它能生成的东西,都将变得极大丰富。
赛力斯申请了一个小轿车的"车载厕所"专利。

座椅装在一个滑轨上,向后滑动就会露出下方的坐便器。

这个马桶配备了加热元件,用于蒸发尿液并烘干其他污物,但还是需要定期手动清空。同时,车内配备风扇和排气管,用于换气。
这个装置对于小轿车,使用场景有限,只适合高速公路大堵车的情况。但是,对于跑长途的大货车,倒是很实用。
1、不要使用 Ollama(英文)

Ollama 是一个运行本地大模型的工具,本文提出它有诸多问题,建议改用 llama.cpp 和 LM Studio。
2、npmx 的功能(英文)

有人为 npmjs.com 做了一个新的前端 npmx.dev,解决了很多开发者要求已久的功能。
3、不要过长的链式调用(英文)

JavaScript 语言可以写出很长的链式调用(上图),有些程序员很喜欢用。本文提出链式调用有一些缺点,不宜过长。
4、异步编程技术的演变和实际成果(英文)

一篇概述,介绍异步编程的由来,如何发展出 async/await 这种普遍接受的解法,以及存在的问题,写得比较深入。
5、被动雷达的工作原理(英文)

雷达可以主动发射电波侦测飞行物,也可以不发射电波,只监听电波变化,这就叫被动雷达。

著名的网络通信监控软件 Little Snitch,终于推出了 Linux 版,可以用它看到每个应用跟什么网址通信。
2、quien

查询域名信息的终端工具,提供清晰易用的界面。
3、ggsql

可以生成图形的 SQL 查询工具,直接查询数据库,将结果表示成可视化图形,参见介绍文章。
开源的 Mac 录屏应用,可以绕过录屏检测机制,让被录制的应用无法感知正在被录屏。(@jrainlau 投稿)

开源的 Chrome 插件,把新打开的标签主页变成标签管理器。(@V-IOLE-T 投稿)


《动物森友会》风格的 React UI 组件库。(@guokaigdg 投稿)
7、CUPS Web

网页版打印机管理工具,通过浏览器远程控制打印机,支持多用户、打印记录追踪等功能。(@hanxi 投稿)

开源的访客统计服务,提供 PV/UV 统计、热门文章、趋势图等,一个实例服务多个站点。(@thinkycx 投稿)
9、HiKid

帮助小朋友练习英语口语和听力的桌面应用,完全免费,目前仅支持 macOS。(@Hao4Wang 投稿)
10、Kite Desktop

桌面端的 K8S 多集群管理工具。(@eryajf 投稿)

Git 仓库提交历史的可视化河流图,支持多项目对比、贡献者信息等特性,在线体验。(@Lionad-Morotar 投稿)

如何才能避免把敏感信息(比如姓名、地址、电话、密码)发给大模型?
OpenAI 给出了答案:Privacy Filter。这是一个本地运行的大模型,它先处理后再发给线上大模型。
比如,原文是"产品发布日期是2026年9月18日",处理后就是"产品发布日期是[PRIVATE_DATE]",参见介绍文章。

开源的 AI 网关,可以接入主流大模型,然后对外提供统一的 API(OpenAI 兼容)和管理后台。(@star7th 投稿)
3、Nezha(哪吒)

开源的 AI 编程任务管理器,快速切换多任务管理,集成了原生终端、会话管理、代码编辑、Git 等功能,大小不到 10MB。(@hanshuaikang 投稿)

Gemini 生成图片的可见水印去除工具,图片不需要上传到服务器,直接在本地浏览器处理。(@liuyan-wjy 投稿)
5、mini-cc
开源的 AI 编程 Agent,作用类似于 Claude Code,采用多语言架构,目前已完成 TypeScript 实现。(@RainyNight9 投稿)

一个有意思的网站,收集键盘打字的声音。你可以先听一下某种键盘的打字声,再确定是否购买它。
2、软件工程定律

这个网站收集各种软件相关的定律,目前有56条。
比如,"帕金森定律"(Parkinson's Law):工作量总是会增加,直至填满所有可用时间。推论就是,不管设置多长的开发时间,项目开发总是会做到最后一刻。
最小的英文字体有多小?
1x1 像素(宽1像素,高1像素)就是一个点,当然不可能;2x2 像素也不可能;3x3 像素理论上可以,实际上无法阅读;4x4 像素难以绘制一些多笔画的字符,比如 E、M、W。
因此,英文字体最小就是 5x5 像素,就是下面的效果。

上面字体中,大多数小写字母比大写字母小一个像素,从而使两者可以在视觉上区分。
整个字体仅占用350字节的内存,所以很适合老式设备或低端设备,即使只有 16kB 内存的8位微控制器,也能完成字体渲染。
另外,它的每个字符只需要25个像素就能显示,而即使 384x288 显示屏也有11万像素。
除了 5x5 字体,还有 3x5 字体(宽3像素,高5像素)和 4x5 字体(宽4像素,高5像素),但是它们的辨识效果都不好(下图)。


2、里海石油城
里海是世界最大湖泊,面积相当于云南省。
上个世纪中期,里海发现了石油。当时的苏联就开始在湖面上建设石油平台,距离岸边有60英里,乘坐6个小时的渡轮才能到达。
最多的时候,共有约320个生产基地,包含2,000口井,通过100多英里的桥梁连接起来。

那时,5000多人生活在这些平台上,形成了一个难以置信的水上城市,所有住宅楼都是建在水上。

随着油田的枯竭和油价的波动,这座石油城的产量已经大幅下降,人们大多离开,整个平台年久失修,垮塌就是时间问题。

1、
美国鞋类生产商 Allbirds 宣布转型为 AI 公司,股价一天暴涨了5倍。
这让人想起2017年,美国一家名为"长岛冰茶"的饮料企业,宣布转型为区块链公司,卖柠檬茶的同时,探索区块链的投资机会,股价也是暴涨。后来,它的区块链业务还没建立好,就破产了。
-- 雅虎
2、
Figma 拥有近 2000 名员工(当然并非所有员工都从事产品开发),而 Anthropic 新推出的 Claude Design 的开发团队,我甚至怀疑是否超过10个人。
-- 《Figma 的困境》,本文评论 Claude Design 对 Figma 造成重大打击,在 AI 的开发速度和开发成本面前,传统软件不堪一击。
3、
我对未来世界的憧憬是,她或许不那样充满未来感,反而更像田园牧歌。我们可以回归传统的生活形态,同时又不放弃新技术带来的便利,几乎无需再去看屏幕或触碰屏幕。
-- jsomers.net
4、
每一种文化都会造就反映其最深层焦虑的英雄。
硅谷最焦虑的,就是增长停滞,无法创造出大受市场欢迎的新产品,所以大肆宣传"英雄开发者":他们能在午夜发布新功能,凭借着咖啡因带来的强大意志力,将白板上的涂鸦变成价值数十亿美元的独角兽企业。
-- 《古典维护者的挽歌》
冷启动的破解之道(#347)
饮水鸟玩具(#297)
扎克伯格的裁员信(#247)
如果这个世界有快乐机(#197)
(完)