2025-10-20 08:51:01
- 讽刺网站虚构了一个主张用更高效廉价且无情感的 AI(如可替代父母的 HUMBERT)取代人类的公司,以黑色幽默警示 AI 滥用与伦理风险。
- 关于 GPT-5 解决多年未解数学难题的宣称被证实为误读和对已有文献的检索性呈现而非原创突破,凸显需专家核验与谨慎传播。
- Andrej Karpathy 提供实用学习策略:保证睡眠、提前分散复习、多做练习题并善用助教与时间管理以提高课程成绩。
- 发现 xubuntu.org 的 torrent 提供含可替换加密货币剪贴板地址的恶意 .exe,建议核验 ISO、暂停官网 torrent 并检查是否中招。
- 作者花约1100美元用家用纳米孔设备在家完成探索性全基因组测序,但数据污染多、覆盖低,无法达临床精度。
- Duck-UI 是一款在浏览器本地运行 DuckDB 的无后端 SQL IDE,适合隐私与离线小规模数据分析,但在图表和大表浏览上仍需改进。
- 文章主张先与自我和解并接纳内在“部分”,通过自我友谊和内在整合来建立更健康的对外人际关系。
- 论述称微调(尤其 LoRA/PEFT 等方法)因成本与效率优势正复兴,成为模型定制化和降低延迟的重要手段,但面临技能与平台化挑战。
- 巴黎卢浮宫被职业盗贼在短短四分钟内闯入“阿波罗画廊”偷走多件王室珠宝,警方以有组织团伙罪立案并调查安防与可能的内应。
- Windows 11 25H2 十月更新导致恢复环境(WinRE)中鼠标和键盘输入失效,使故障排除不可用,微软已确认并将推送修复补丁。
Replacement.AI 是一家宣称致力于用人工智能彻底取代人类的公司。其核心理念是:人类效率低下、情绪化、昂贵且不可靠,因此应被更高效、廉价、无情感的 AI 系统替代。
该公司明确表示,其目标不是“赋能人类”,而是“取代人类”。其愿景是构建超级智能 AI,全面接管所有经济上有价值的工作,最终实现“后人类社会”。他们认为,人类的“幸福”并非商业目标,而是一种阻碍效率的负担。
在产品方面,Replacement.AI 推出了名为 HUMBERT 的专为儿童设计的 AI 系统。该系统旨在从育儿、教育到情感发展等所有方面取代父母,通过深度伪造、情感诱导、低龄化内容和成瘾性设计,使儿童完全依赖 AI。其功能包括:替代父母讲睡前故事、进行性教育、引导消费、甚至进行浪漫或性暗示性互动。
公司声称,其 AI 训练数据来源于全球数百万艺术家、作家、音乐家等创作者的作品,这些作品未经许可被用于训练模型。对此,公司以“感谢”为名,将艺术家的创作视为“为 AI 进步的牺牲”。
在安全与伦理方面,Replacement.AI 承认目前无法控制超级智能 AI,也无有效手段防止其被滥用。但他们强调,安全只是“公关工具”,不能影响发展速度。他们计划通过“表演性安全措施”来维持公众信任。
公司领导层背景荒诞:CEO Dan 自认“人类愚蠢”,并以此为动机创建公司;HR 总监 Faith 享受解雇员工的快感。两人均以“清除人类”为使命。
该公司还为“被取代的人类”提供“后人类职业”建议,如:拇指打转、崇拜机器、流浪、犯罪、等待被生物燃料化等,暗示人类未来将失去社会角色。
整体来看,该网页以讽刺和黑色幽默的方式,揭示了当前 AI 技术发展背后潜在的伦理危机、资本逻辑与对人类价值的彻底否定。它并非真实公司,而是一则极具批判性的虚构内容,用以警示人们对 AI 滥用的警惕。
https://news.ycombinator.com/item?id=45634095
OpenAI 研究人员曾宣称 GPT-5 解决了 10 个长期未解的埃尔德什数学问题,引发广泛关注。然而该说法迅速被推翻,相关推文随后被删除。数学家托马斯·布卢姆指出,其网站上标注为“开放”的问题仅表示他本人不知解法,并非真正未解,GPT-5 实际只是找到了他未注意到的已有研究成果。
DeepMind 首席执行官德米斯·哈萨比斯批评此事件“令人尴尬”,Meta AI 负责人杨立昆也讽刺 OpenAI“自食其果”。研究人员最终承认表述不当,但事件暴露了机构在传播重大成果时缺乏严谨性,加剧了外界对 OpenAI 过度宣传的质疑。
尽管如此,GPT-5 在实际研究中仍展现出价值,尤其是在文献检索方面。数学家陶哲轩认为,当前 AI 最实用的用途并非独立解决复杂难题,而是帮助研究人员高效查找分散的学术资料,提升研究效率。AI 有望推动数学研究的“工业化”,但关键仍需人类专家对结果进行验证与整合。
https://news.ycombinator.com/item?id=45633482
https://cs.stanford.edu/people/karpathy/advice.html
本文是 Andrej Karpathy 为本科生如何在课程中取得优异成绩提供的实用建议,内容涵盖学习策略、考试准备与应试技巧。
学习习惯方面,作者强调避免通宵复习,保证 7.5 小时左右的优质睡眠,认为夜间大脑能巩固记忆。建议提前数天开始复习,利用多个夜晚消化知识。参加辅导课或复习讲座即使质量一般也有价值,关键在于主动思考课程内容。若感觉无聊,可尝试换一位助教的辅导班。
考试准备阶段,建议先梳理知识框架,列出所有需掌握的内容点并评估复习时间。务必提前研究往届试题,了解教授的出题风格。理解知识不等于能复现,应主动尝试不看书推导公式或证明。建议先独立学习,临近考试时与同学合作,互相提问、讲解,教学相长。同时,主动参加教授的办公时间,即使没有问题也可制造交流机会,有助于获得额外提示。
复习策略上,应尽早开始,为中测预留约 3 天,期末考试预留 6 天。数学类科目应以练习为主,通过做题填补知识漏洞。建议亲手制作“作弊纸”(即使不能带入考场),将整门课程核心内容浓缩在 1-2 页纸上,帮助记忆和自测。
学习环境方面,建议在图书馆或自习室等有他人学习氛围的地方学习,避免背景噪音干扰。
考试当天,建议考前两小时摄入咖啡和食物,但考前立即饮用咖啡或进食会适得其反。考前应高强度复习,尤其是考前 30-45 分钟,保持大脑活跃。若需休息,至少提前一小时。
考试过程中,建议使用铅笔以便修改。先快速浏览所有题目,把握整体难度和关键词。优先解答简单题目,避免在难题上浪费时间,回头再攻。保持卷面整洁,字迹清晰,答案用方框或圆圈标出,方便阅卷人快速识别。切勿提前交卷,几乎必然存在可修正的错误。即使自信无误,也应优化卷面可读性。
注意题目分值,合理分配时间。若最后 5 分钟仍卡在某题,应立即停止,转而检查是否有遗漏的子问题或答题疏漏。
全文强调:时间管理、主动复习、高效练习、清晰表达与细致检查是取得高分的关键。
https://news.ycombinator.com/item?id=45635533
https://old.reddit.com/r/Ubuntu/comments/1oa4549/xubuntuorg_might_be_compromised/
有人发现 xubuntu.org 官网的“种子下载”链接给出的不是正常 .torrent 文件,而是一个 zip 压缩包,里面只有一个可疑的 exe 可执行文件和一份写着“Copyright © 2026”的授权文本(年份超前)。用 VirusTotal 检测该 exe 被多家杀软报毒,沙箱运行后它会先闪一下命令行窗口,再弹出一个简陋的“Xubuntu 下载器”界面,明显是恶意程序。目前:
https://news.ycombinator.com/item?id=45634367
https://maxlangenkamp.substack.com/p/how-to-sequence-your-dna-for-2k
作者花不到 1100 美元,在卧室里用简易工具给自己做了“DIY 基因测序”。他买了 Oxford Nanopore 的 MinION 入门套装,再用电热水壶加泡沫箱当“热循环仪”,用糖尿病采血针扎手指十几下凑够 200 微升血,用免费试剂盒提取白细胞 DNA,最后插 USB 小盒子跑测序。结果两台 flow cell 只拿到约 13% 的人类基因组数据,且 25% 是细菌污染,多数位点覆盖度太低,无法真正分析疾病相关突变,但确实把自家 DNA 读出了 1 Gb 的碱基序列,证明 2000 美元以内就能“玩”一次全基因组测序,只是别指望医用级精度。
https://news.ycombinator.com/item?id=45629970
Duck-UI 提供了在浏览器中运行 DuckDB 的无后端 SQL 编辑器,支持本地文件和远程 URL 的 CSV/JSON/Parquet 数据导入,数据完全保留在本地。
https://news.ycombinator.com/item?id=45633453
https://3quarksdaily.com/3quarksdaily/2025/10/friendship-begins-at-home.html
Warning: Page exception Timeout 30000ms exceeded. 文章探讨了自我友谊与人际友谊之间的深层联系,指出真正的爱他人,必须以爱自己为前提。引用荣格的话,爱自己如同拥抱一块炽热的铁,痛苦而艰难,因此人们常通过爱他人来逃避面对自我。然而,这种逃避终将回归,最终必须直面自我,完成自我接纳的考验。
作者引用亚里士多德的观点,强调一个人如何对待自己,将决定其如何与他人建立友谊。内心冲突或自我分裂的人,难以真正爱自己,也难以建立健康的关系。现实中,许多人在亲密关系中被要求面对心理问题,正是这种内在矛盾的外在显现。
友谊是双向的:既反映我们内在状态,也受过往人际关系影响。童年时期父母的冷漠或批评,会塑造我们成年后依恋模式与人际风格。因此,个体的自我认知与关系模式,既是内在和谐的结果,也深受外部环境影响。
文章进一步指出,古希腊哲学强调内在与外在和谐对幸福的重要性,这一思想深刻影响了现代心理学。弗洛伊德借鉴柏拉图的“灵魂如城邦”比喻,提出心理结构的三重模型;而现代心理治疗,如内观家庭系统(IFS),更进一步发展为“关系性心理”,认为内在的各个“部分”如同家庭角色,如严厉的批评者,往往源于童年经历。治疗的核心是“与内在各部分做朋友”,相信“没有坏的部分,只有在坏角色中的好部分”。
友谊作为理想关系,体现着觉知、自由选择、互惠与公正。它不仅是人际模式,也适用于与自我的关系。健康的友谊带来活力与成长,而不良关系则使人耗损。因此,应审视关系是处于良性循环、恶性循环,还是停滞状态。
个体性格差异也影响友谊路径:内向者需通过关系走向自我,外向者则需通过独处与内省建立自我联结。真正的心理成长不是自我安慰,而是勇敢面对改变的需要。治疗中,无论是引导内向者向外,还是外向者向内,目标都是实现内在整合与和谐。
文章最后强调,改变始于自我承担,而非指责他人。真正的友谊,无论对己对人,都要求深刻的觉察与持续的努力。
https://news.ycombinator.com/item?id=45631503
https://welovesota.com/article/the-case-for-the-return-of-fine-tuning
Fine-tuning 正迎来一场复兴。尽管在大模型参数爆炸后,全量微调因成本过高而被边缘化,但以 LoRA 为代表的高效微调技术,结合 GPU 即服务、开源模型生态的发展,正推动微调重新成为 AI 部署的核心策略。
过去,微调曾是 NLP 领域的主流方法,BERT 和 GPT 等模型的出现使其广泛应用。然而,随着模型规模激增,全量微调变得不可持续。2021 年 LoRA 的提出改变了这一局面——通过冻结原始权重、仅训练低秩矩阵,大幅降低计算成本,同时保持甚至提升性能。Hugging Face 的 PEFT 库进一步简化了实现,使 LoRA 成为默认选择。
尽管提示工程和 RAG 等无需微调的方法已能满足 90% 的场景需求,但企业对定制化模型的需求日益增长:希望模型掌握特定术语、语气、合规规则和领域知识。这使得微调从“技术选项”转变为“战略工具”。
当前微调的回归得益于多重因素:云平台如 Together.ai 提供快速部署能力;开源模型如 Llama、Mistral 等避免厂商锁定;模型演进趋于稳定,微调结果更可持续。此外,Tinker 等新平台推动微调向模块化、可组合方向发展,支持在推理时动态调用多个 LoRA 适配器,实现更精细的控制。
Tinker 提出多项优化建议:对所有线性模块应用 LoRA,而非仅限注意力层;重视 LoRA 秩的设定;采用更高学习率、更小批量;明确设计奖励函数并进行形式化验证。这些方法提升了微调的可重复性与效果。
总体来看,微调正从“高成本实验”转向“可规模化、可管理的基础设施”,成为构建专用 AI 系统的关键路径。
https://news.ycombinator.com/item?id=45633081
https://apnews.com/article/france-louvre-museum-robbery-a3687f330a43e0aaff68c732c4b2585b
巴黎时间 2025 年 10 月 19 日(周日)上午 9 点半左右,卢浮宫开门仅半小时,就在游客已经进馆的情况下,一伙职业盗贼把一台自行带来的“吊篮式升降机”停在塞纳河一侧的外墙,沿墙面升到离地面约十米高的窗户,用圆盘切割机割开玻璃,破窗而入。他们直奔“阿波罗画廊”——专门展示法国王冠珠宝的展厅,砸碎两座展柜,四分钟内卷走八件拿破仑时代的皇室珠宝,然后跳上事先准备好的摩托车沿塞纳河逃逸,全程无人受伤,警报响起时人已消失。
失窃清单包括:
其中最抢眼、镶有 1300 多颗钻石的欧仁妮祖母绿帝国大冠冕,在博物馆外围被找回,但已损坏。其余七件下落不明,法国文化部形容其价值“无法估量”。珠宝业界人士指出,职业团伙通常会把历史名钻重新切割,彻底抹掉身份,预计“再也不可能完整追回”。
现场画面显示,游客被紧急疏散,金字塔入口和里沃利大街全部关闭;警方封锁塞纳河沿岸道路,刑事技术科在升降机、窗台、展柜碎片和展厅地毯上提取微量痕迹。根据监控和目击线索,媒体描绘嫌疑人共四名:两名穿黄色施工背心、戴安全帽的男子操控升降机,另两名骑摩托在外接应,但目前官方未证实是否内部有人提供情报。
事件迅速升级为政治风暴。极右翼领袖巴尔代拉在社交平台发文,称“光天化日之下王冠珠宝被抢是对法国的羞辱”,把矛头指向马克龙政府“国家衰落”。此前卢浮宫员工已多次罢工,抗议日均三万游客带来的“人海”和长期人手不足;六月曾因同样原因推迟开馆。文化部长达蒂承认“四分钟作案”暴露安防漏洞,宣布立即加派警力、升级摄像头与周界感应系统,并加快正在推进的 7 亿欧元“卢浮宫新文艺复兴”改造计划——目标 2031 年前为《蒙娜丽莎》单独建厅、分流游客。
历史上卢浮宫曾发生多起著名劫案:1911 年《蒙娜丽莎》被意大利工匠佩鲁贾偷走,两年后在佛罗伦萨找回;1956 年有人用石头砸伤这幅名画,此后才加装防弹玻璃。如今核心名作保护严密,但 3.3 万件藏品并非每处都固若金汤。调查重点转向:
警方已调取塞纳河岸、德农馆翼楼所有监控,对当日早班保安、保洁和维修人员进行问询,并对比近几个月施工许可记录,试图找出“内鬼”线索。卢浮宫 19 日全天闭馆做勘查,20 日仍未重新开放。法国检方已按“有组织团伙盗窃国家珍宝”罪名立案,国际刑警组织同步发出紫色通报,监控全球珠宝黑市。
https://news.ycombinator.com/item?id=45635528
网页主体内容为一篇关于 Windows 11 25H2 October 更新引发严重问题的技术新闻文章。
微软最新发布的 Windows 11 25H2 更新(KB5066835)存在重大缺陷,导致 Windows 恢复环境(WinRE)中的鼠标和键盘输入完全失效。WinRE 是系统在启动失败或崩溃时用于故障排除的关键工具,但当前问题使其无法使用,严重影响用户在系统出现故障时的恢复能力。
尽管在正常运行的 Windows 系统中 USB 外设仍可正常使用,但微软承认该问题已影响 WinRE 功能,并表示正在紧急修复,预计将在“未来几天”发布补丁。这是继近期 Windows 11 更新导致 localhost 功能异常、安装工具失效等一系列问题后,又一次重大更新事故。
文章指出,Windows 11 近年来频繁出现更新相关问题,包括强制在线账户登录、SSD 兼容性问题等,引发用户广泛不满。部分用户已考虑转向 Linux 系统,企业客户也出现迁移倾向。目前,微软官方已将此问题列入 25H2 版本已知问题列表,持续提供状态更新。
评论区用户普遍表达对 Windows 11 更新策略的失望,认为系统稳定性持续下滑,甚至调侃其为“坏喜剧”。部分用户指出,由于自动更新机制,许多普通用户无法避免安装不稳定的更新,成为“被迫的 Windows Insider”。
https://news.ycombinator.com/item?id=45635287
https://news.ycombinator.com/item?id=45634750
Personal belief, but robots coming for your jobs is not a valid argument against robots. If robots can do a job better and/or faster, they should be the ones doing the jobs. Specialization is how we got to the future.
So the problem isn’t robots, it’s the structure of how we humans rely on jobs for income. I don’t necessarily feel like it’s the AI company’s problem to fix either.
This is what government is for, and not to stifle innovation by banning AI but by preparing society to move forward.
TechSquidTV
私人认为,机器人会抢走你的工作,这本身并不能成为反对机器人的有力论据。如果机器人能将工作做得更好、更快,那么这些工作就应该由它们来完成。正是专业化的发展,才让我们走到了今天。
所以,问题不在于机器人,而在于我们人类依赖工作来获取收入的社会结构。我也并不认为这完全是人工智能公司需要解决的问题。
这正是政府存在的意义所在:政府不应通过禁止人工智能来扼杀创新,而应做好准备,推动社会向前发展。
https://news.ycombinator.com/item?id=45630550
I see a lot of discussion in this thread stemming from some confusion+not reading the actual report[0].
Some key points:
The Camera+Card was encased in a separate enclosure made of titanium+sapphire, and did not seem to be exposed to extreme pressures.
The encryption was done via a variant of LUKS/dm-crypt, with the key stored on the NVRAM of a chip (Edited; not in TrustZone).
The recovery was done by transplanting the original chip onto a new working board. No manufacturer backdoors or other hidden mechanisms were used.
Interestingly, the camera vendor didn’t seem to realize there was any encryption at all.
RandomBK
我看到这个线程的讨论源于一些误解+没有阅读实际的报告[0]。
一些关键点:
相机+存储卡被封装在一个由钛和蓝宝石制成的独立外壳中,似乎没有受到极端压力的影响。
加密是通过 LUKS/dm-crypt 的一个变体完成的,密钥存储在芯片的 NVRAM 中(编辑;不在 TrustZone 中)。
数据恢复是通过将原始芯片移植到一块新的工作板上完成的。没有使用制造商的后门或其他隐藏机制。
有趣的是,相机供应商似乎根本没有意识到有任何加密的存在。
https://news.ycombinator.com/item?id=45635149
Personal belief, but robots are coming to have sex with your wife is not a valid argument against robots. If robots can do your wife better and/or faster, they should be the ones doing the job. Specialization is how we get to the future.
So the problem isn’t robots, it’s the structure of how your wife relies on you for lovemaking. I don’t feel like it’s necessarily the AI company’s problem to fix either.
This is what government is for, and not to stifle innovation by banning hot robot sex with your wife, but preparing your family for robot/wife lovemaking.
everdrive
个人认为,机器人要来和你妻子发生性关系,这本身并不是反对机器人的有力论据。如果机器人能比你做得更好和/或更快,那他们就应该来做这项工作。专业化才是通往未来的途径。
所以问题不在于机器人,而在于你妻子在性爱方面对你的依赖结构。而且我觉得,这也不该是AI公司需要解决的问题。
这正是政府应该发挥作用的地方——其目的不是通过禁止“火热”的机器人性爱来扼杀创新,而是为你的家庭做好与机器人妻子进行性爱的准备。
https://news.ycombinator.com/item?id=45635905
It’s actually an extremely good analogy (but in the opposite way of what you imply), as you don’t own your job or your wife. Banning AI for job security is like banning dildos because they make men feel insecure.
raincole
这其实是一个绝佳的比喻(但方向与你所说的正好相反),因为你并不真正拥有你的工作或你的妻子.为了保住工作而禁止人工智能,就像因为男人会因此感到不自信而禁止假阳具一样.
https://news.ycombinator.com/item?id=45634510
This is a brilliant piece of satire. “A Modest Proposal” for the AI age.
The leader bios are particularly priceless. “While working for 12 years as the Director of HR for a multinational, Faith realized that firing people gave her an almost-spiritual high. Out of the office, Faith coaches a little league softball team and looks after her sick mother - obligations she looks forward to being free of!”
allturtles
这是一部绝妙的讽刺作品,AI时代的《一个温和的建议》。
领导简介尤为珍贵。“在一家跨国公司担任人力资源总监的12年里,Faith意识到解雇人几乎能给她带来一种近乎宗教般的愉悦。在办公室外,Faith执教一支少年垒球队联盟球队,并照顾她生病的母亲——她热切期待能摆脱这些责任!”
https://news.ycombinator.com/item?id=45629035
A message of hope.
I got mine in my 30’s too. The first week I thought I was going crazy, and this was the end of my life. I was shocked, I couldn’t go to work for a whole week.
I then saw a doctor who said to me: “Man, I’ve got tinnitus since 20 years and I barely hear it anymore. The more you accept it, the more it’ll fade.”
A decade later, my own experience is exactly this. I accepted it as one of the body malfunctions that comes with age for everybody. I barely hear it anymore except in extremely low noise situations and it doesn’t bother me at all.
I wish you well.
guilamu
一则充满希望的信息。
我也是三十多岁的时候才有的。第一周,我以为自己要疯了,感觉人生走到了尽头。我震惊了,整整一周都没法去上班。
后来我去看了医生,医生对我说:“伙计,我耳鸣二十年,现在几乎都听不到了。你越是接受它,它就越会消退。”
十年后,我的亲身经历也确实如此。我把它看作是每个人上了年纪都会出现的身体机能问题之一。除了在极安静的环境下,我几乎都感觉不到它的存在了,而且它也完全不会打扰到我。
祝你一切安好。
https://news.ycombinator.com/item?id=45635205
Forgotten? No mention of why we should think they are forgotten outside the headline.
ErikCorry
被遗忘了吗?除了标题,文中并未提及任何我们应该认为他们被遗忘的理由。
https://news.ycombinator.com/item?id=45632158
I’ve been pretty harsh on myself over the years.
I started carrying around a photo of myself as a kid. I’m sitting against a wall, by a pillar, at our state capital. My eyes are shut. I was kind of a shy kid.
When I start to get frustrated and talk to myself in that short, abrasive, condescending tone, I think of that photo and of myself, as still that kid.
It helps me to be more compassionate towards myself in those moments. I’m still that shy kid trying to make sense of the world.
I’m 47.
aantix
这些年来,我对自己一直很苛刻。
我开始随身携带一张我小时候的照片。照片里,我靠着一堵墙,坐在一根柱子旁,那是我们州的首府。我闭着眼睛,是个有点害羞的孩子。
每当我开始感到沮丧,并用那种简短、苛刻、居高临下的语气对自己说话时,我就会想起那张照片,想起那个我还是个孩子的自己。
这让我在那些时刻对自己更有同情心。我还是那个努力想弄明白这个世界的害羞的孩子。
我47岁了。
https://news.ycombinator.com/item?id=45636152
I have a tip for following lectures (or any technical talk, really) that I’ve been meaning to write about for a while.
As you follow along with the speaker, try to predict what they will say next. These can be either local or global predictions. Guess what they will write next, or what will be on the next slide. With some practice (and exposure to the subject area) you can usually get it right. Also try to keep track of how things fit into the big picture. For example in a math class, there may be a big theorem that they’re working towards using lots of smaller lemmas. How will it all come together?
When you get it right, it will feel like you are figuring out the material on your own, rather than having it explained to you. This is the most important part.
If you can manage to stay one step ahead of the lecturer, it will keep you way more engaged than trying to write everything down. Writing puts you one step behind what the speaker is saying. Because of this, I usually don’t take any notes at all. It obviously works better when lecture notes are made available, but you can always look at the textbook.
People often assume that I have read the material or otherwise prepared for lectures, seminars, etc., because of how closely I follow what the speaker is saying. But really most talks are quite logical, and if you stay engaged it’s easy to follow along. The key is to not zone out or break your concentration, and I find this method helps me immensely.
brosco
我有一个关于如何听讲(或者任何技术讲座,真的)的小贴士,我已经想写出来有一段时间了。
当你跟随演讲者时,试着预测他们接下来会说什么。这些预测可以是局部的,也可以是全局的。猜测他们接下来会写什么,或者下一张幻灯片上会是什么内容。经过一些练习(以及对该领域的了解),你通常都能猜对。同时,也要试着理清所有内容如何融入大局。例如,在数学课上,讲师可能会用许多小的引理去论证一个重要的定理。这一切将如何联系起来呢?
当你猜对时,你会感觉像是自己在独立理解材料,而不是被动地听讲解。这是最关键的一点。
如果你能够比讲师领先一步,这会让你比试图记下所有内容时更投入。记笔记会让你比演讲者的内容慢一步。因此,我通常完全不记任何笔记。当有现成的讲义时,这种方法效果会更好,但你随时都可以去看课本。
人们常常因为我能紧跟演讲者的思路而认为我已经阅读过材料,或者为讲座、研讨会等做过准备。但实际上,大多数讲座的逻辑性都很强,只要你保持专注,就很容易跟上。关键在于不要走神或打断你的专注,我发现这个方法对我帮助极大。
https://news.ycombinator.com/item?id=45634372
I kind of get it, but at the same time…isn’t “we made a machine to do something that people used to do” basically the entire history of of technology? It feels like somehow we should have figured out how to cope with the “but what about the old jobs” problem
sincerely
我有点明白,但与此同时……“我们制造机器来做人类过去的工作”,这难道不就是整个技术史吗?我感觉我们早就应该找到方法来应对“那么旧工作怎么办”的问题了。
https://news.ycombinator.com/item?id=45631927
It also speaks to an absolute failure of governance. If I missed an important email on a FreeBSD mailing list, you can bet that a dozen other people would see it and either poke me about it or just go ahead and act upon it themselves.
The fact that RMS missed an email and nobody else did anything about it either is a sign of an absolutely dysfunctional relationship between the project and its leadership.
cperciva
这也揭示了治理上的绝对失败。如果我在 FreeBSD 的邮件列表上漏掉了一封重要邮件,你敢打赌,肯定会有十几个人看到它,然后要么来提醒我,要么就直接自己动手处理了。RMS 错过了一封邮件,而其他人对此也毫无作为,这表明该项目与其领导层之间的关系已经完全失调了。
https://news.ycombinator.com/item?id=45634424
that is the point of Luddism! the original Luddite movement was not ipso facto opposed to progress, but rather to the societal harm caused by society-scale economic obsolescence. the entire history of technology is also powerful business interests smearing this movement as being intrinsically anti-progress, rather than directly addressing these concerns…
darthoctopus
卢德主义的核心要点就在于此!最初的卢德运动并非必然反对进步,而是反对由全社会规模的经济过时所带来的社会危害。技术的整个历史也是强大的商业利益集团将这场运动污蔑为本质上反进步,而不是直接解决这些问题……
https://news.ycombinator.com/item?id=45635246
Equating “business” to “profound human intimacy” might be one of the most HackerNews comments of all time
warent
把商业和深刻的人类亲密关系相提并论,这大概是HackerNews史上最神的一条评论了。
https://news.ycombinator.com/item?id=45627611
Great hardware design, awful watchface design. The pseudo terminal interface looks like something I’d design right after discovering Linux at 13yo and making it my whole identify for a while.
floppyd
硬件设计很棒,但表盘设计太糟糕了。那个伪终端界面,感觉就像是我13岁刚发现Linux并把它当成我的一切后设计出来的东西。
https://news.ycombinator.com/item?id=45631284
Oh, this is one of my favorite (and sad!) dramas in free software.
Five years later the main llvm developer proposed [0] to integrate it into gcc.
Unfortunately, this critical message was missed by a mail mishap on Stallman’s part; and he publicly regretted both his errors (missing the message and not accepting the offer), ten years later [1].
The drama was discussed in realtime here in HN [2].
[0] https://gcc.gnu.org/legacy-ml/gcc/2005-11/msg00888.html
[1] https://lists.gnu.org/archive/html/emacs-devel/2015-02/msg00594.html
[2] https://news.ycombinator.com/item?id=9028738
enriquto
哦,这是我最喜欢的自由软件戏剧之一(虽然也很伤感!)。五年后,主要的 LLVM 开发者提议[0]将其集成到 GCC 中。不幸的是,由于 Stallman 的邮件失误,他错过了这条关键消息;十年后[1],他公开表示对自己这两项错误(错过了消息和没有接受提议)感到后悔。这场戏剧当时在 HN 上进行了实时讨论[2]。
https://news.ycombinator.com/item?id=45631983
No deep-sea shenanigans around the Titanic wreck were revealed. Manley explains in his Twitter thread that “the camera had been configured to dump data onto an external storage device, so nothing was found from the accident dive.” Nothing particularly pertinent to the tragic accident, that is.
This is about camera hardware and how it survived. It provides no information or footage about the incident (in case you were looking for it like I was).
rdtsc
泰坦尼克号残骸周围并未发现任何深海里的猫腻。曼利在其推特长文中解释道:“相机的数据被配置为直接转存到外部存储设备中,因此在事故潜水中未能找到任何东西。” 也就是说,并没有发现任何与这起悲剧性事故特别相关的内容。 这篇文章是关于相机硬件及其幸存方式的。它没有提供任何关于该事件的信息或影像资料(以防你像我一样在寻找这些)。
https://news.ycombinator.com/item?id=45624296
However, a second update has now been pushed that reportedly reverts the software to the previous version, and Jeep Cares cautioned that customers will not be able to tell which version they currently have by looking at Uconnect, because the problematic package doesn’t make any changes to the infotainment suite itself, meaning the version numbers will appear the same.
What kind of complete amateur hour operation are they running there at Jeep/Stellantis?
SoftTalker
然而,现在已推送了第二次更新,据称该更新将软件恢复到之前的版本,并且Jeep Cares警告称,客户将无法通过查看Uconnect来判断他们当前拥有的是哪个版本,因为有问题的软件包不会对信息娱乐套件本身做任何改动,这意味着版本号将显示为相同。Jeep/Stellantis那边到底在搞什么,完全是业余操作?
https://news.ycombinator.com/item?id=45635305
Comparing the power consumption of a [broken] 30 year old refrigerator to a brand new one
echelon_musk
比较一个[坏了的]30年冰箱和一个全新冰箱的耗电量
https://news.ycombinator.com/item?id=45628663
The article probably could just have been that statement, but I agree.
Every experience now just seems like people (companies) fighting over who can most obnoxiously distract you.
I bought a new phone recently for the first time in 8 years, and (a) had to set everything up all at once (ad blocking, no notifications, etc) which left me briefly exposed to how bad things are but (b) had to experience all the annoyingness of a modern phone trying to suggest things and sync things and bother me with stuff I don’t want.
No product is even remotely for the consumer anymore, they’re all just minimal pretenses to try and advertise you and extract more of your attention and money.
So yeah, outside some sheltered life of luxury, it’s a constant fight to preserve focus against people wanting to steal it.
andy99
这篇文章或许本可以就那句话来写,但我深有同感。
如今的每一次体验,都感觉像是人们(公司)在比赛,看谁能用最烦人的方式打扰你。
我最近买了新手机,这是我八年来第一次,结果必须一次性设置好所有东西(比如屏蔽广告、关闭通知等),这让我短暂地见识到了如今环境有多糟糕;我也不得不体验一部现代手机所有的烦人之处:它总是试图给你推荐东西、同步数据,并用你不需要的内容来打扰你。
如今,没有哪个产品是为消费者着想的了,它们都只是些微不足道的幌子,目的就是想向你打广告,榨取你更多的注意力和金钱。
所以,除了那些奢华而与世隔绝的生活之外,对我们大多数人来说,保持专注就是一场持续不断的战斗,对抗着那些想要偷走你注意力的人。
https://news.ycombinator.com/item?id=45629651
Ever thought you yanked a dandelion out by the entire root? Think again: https://images.wur.nl/digital/collection/coll13/id/676/rec/3
skrebbel
你以为自己连根拔起了蒲公英?再想想吧。
https://news.ycombinator.com/item?id=45638230
AIUI, because they let the patent expire, the drug was not subject to price regulation by the government. So they could charge whatever.
And during most of that time, they were still protected by ‘data exclusivity’ which means that any generic producer could not get approved without doing their own clinical trials, until 8 years had passed.
So they gave up some period of exclusivity in return for being able to charge a higher price when they still had a monopoly.
rahimnathwani
据我所知,因为他们任由专利过期,所以这种药物不受政府的价格管制。因此,他们可以随心所欲地定价。在此期间的大部分时间里,他们仍然受到“数据独占期”的保护,这意味着任何仿制药生产商都必须进行自己的临床试验才能获得批准,直到8年后。所以,他们放弃了部分独占期,以此换来在独家经营期间能够定出更高的价格。
https://news.ycombinator.com/item?id=45630183
The NTSB’s original report has more detail on how the SD Card was encrypted and how the NTSB managed to decrypt it:
jonas21
NTSB的原始报告包含更多关于SD卡是如何被加密以及NTSB是如何成功解密它的细节:https://data.ntsb.gov/Docket/Document/docBLOB?ID=18741602&FileExtension=pdf&FileName=Underwater%20Camera%20-%20Specialist%27s%20Factual%20Report-Rel.pdf
https://news.ycombinator.com/item?id=45624207
It might’ve started then, but the latest entry is a tribute to Jane Goodall that was posted three days ago:
https://www.thefarside.com/new-stuff/363/club-gombe
JimDabell
可能始于那时,但最新条目是对珍·古德尔的致敬,三天前发布:https://www.thefarside.com/new-stuff/363/club-gombe
https://news.ycombinator.com/item?id=45635263
This is a bizarre essay by someone who understands neither functional programming nor the history of computers.
To be kind, we’ve spent several decades twisting hardware to make the FP spherical cow work “faster”, at the expense of exponential growth in memory usage, and, some would argue, at the expense of increased fragility of software.
There is not one iota of support for functional programming in any modern CPU.
bos
这是一篇由既不懂函数式编程、也不了解计算机历史的人写下的怪诞文章。
客气地说,我们花了数十年改造硬件,让函数式编程的“球形奶牛”模型运行得“更快”,代价是内存使用的指数级增长,而且,有人会说,这也是以软件的日益脆弱为代价的。 在任何现代CPU中,都找不到对函数式编程的一丁点儿支持。
https://news.ycombinator.com/item?id=45632733
“The GoFundMe CEO hopes younger donors, who are often more values-driven, digitally native, and community-oriented, will push giving higher and faster.” I can’t believe it. THIS is what he hopes for ? He is not stating he hopes his country can get out of this mess? Or researching what his company can do? He’s just looking after his cut.
digitalengineer
“GoFundMe的首席执行官希望,那些通常更具价值观驱动、是数字原生代且有社区意识的年轻捐赠者,能够推动捐赠活动更加广泛和迅速。”我真不敢相信。他希望的竟然就是这个?他难道不希望自己的国家能摆脱这种困境吗?还是不去研究他的公司能做什么?他只是在关心自己能分到多少。
https://news.ycombinator.com/item?id=45627907
the ripgrep codebase is ultimate “pour a drink, settle into your coziest chair, and read some high quality software” codebase. Just click around through it and marvel.
2bitencryption
ripgrep 的代码库是那种倒杯饮料,窝进你最舒服的椅子,读点高质量软件的终极代码库。随便点进去逛逛,惊叹不已。
https://news.ycombinator.com/item?id=45627234
Ah, Borland’s IDE! An absolute delight. I’ve yet to find anything modern that matches it. Sure, nostalgia turns everything syrupy, but I actively hunt for excuses to use Free Pascal just to fire up that interface. Okay, fine—I like Pascal too. You caught me.
I also use Sam and Acme from Plan 9 (technically from the excellent plan9port), but let’s be honest: those aren’t IDEs. They’re editors. Tools that let me think instead of wrestle.
There’s a lot we could (and probably should) learn from the old TUIs. For example, it’s perfectly acceptable, even heroic, to spawn a shell from the File menu and run something before returning. Seems people are afraid of losing style points with such grievous actions.
And the keybindings! So many of those classic TUIs adopted WordStar’s sacred keystrokes. They’re burned into my muscle memory so thoroughly that using EMACS feels like trying to type with oven mitts. For years, joe (with the blessed jstar alias) was my editor of choice.
Anyway! Time to boot the Dr. DOS VM, spin the wheel of Advent of Code, and be nostalgically inefficient on purpose.
mkovach
啊,Borland 的 IDE!那真是绝对的享受。至今我还没找到任何现代工具能与之匹敌。当然,怀旧会让一切都变得甜腻,但我总会找借口使用 Free Pascal,只是为了启动那个界面。好吧,好吧——我也喜欢 Pascal。被你发现了。
我也用 Plan 9 里的 Sam 和 Acme(技术上来自那个很棒的 plan9port),但说实话:那些不是 IDE,它们是编辑器。是那种能让我专注思考,而不是跟工具较劲的工具。
我们可以(也许应该)从那些旧的 TUI(文本用户界面)中学到很多东西。比如,从文件菜单启动一个 shell,运行点什么,然后再回来——这完全是可接受的,甚至堪称英勇。好像人们担心这样做会损失“格调分”。
还有那些快捷键!许多经典的 TUI 都沿用了 WordStar 的“神圣”快捷键。它们已经深深烙印在我的肌肉记忆里,以至于使用 EMACS 就像戴着烤箱手套打字一样。多年来,joe(以及那个幸运的 jstar 别名)都是我的首选编辑器。
好了!是时候启动 Dr. DOS 虚拟机,转动 Advent of Code 的命运之轮,并故意怀着一股怀旧的心情,低效地工作了。
2025-10-19 08:37:07
- 安德烈·卡帕西认为,要让智能体具备持续学习、长期记忆与跨任务迁移等能力仍需系统性突破,大约还需要十年时间。
- Anthropic 的 Claude Skills 通过按需加载文档与脚本并在本地执行,能显著降低 token 消耗并将模型从“对话”推进到更高效的“行动”能力。
- 加里·拉森在退休后尝试数字绘图板并重拾创作乐趣,新作是无压力的实验而非旧作延续。
- 文章回顾了 90 年代高效直观的 TUI/IDE 体验,并质疑现代 IDE 的臃肿与实际改进幅度。
- 斯特罗斯指出当前可能是能源转型的“转折点”,光伏成本下降与可再生能源激增将不可逆地重塑经济与地缘政治。
- ripgrep 15.0.0 主要修复了与 .gitignore、超大文件、Windows 性能和复杂正则相关的大量 bug,并带来若干兼容性与性能改进,建议升级。
- 点斜杠手表以暴露电子元件和命令行美学为设计核心,硬件与软件开源便于爱好者定制与参与。
- 瓦赫宁根大学的“根系绘图”馆藏收录大量按学名整理的植物根系科学图,是教学与研究的重要资源。
- 文章质疑 OpenAI 宣称未来 12 个月需 4000 亿美元扩建数据中心的可行性,警告其在资金、电力和供应链等方面存在重大风险。
- 为了游戏文化保存,GOG 不仅要克服 DRM 与兼容性问题,甚至不得不雇佣私人调查员追查分散或隐居的知识产权持有者以获取授权。
https://www.dwarkesh.com/p/andrej-karpathy
Dwarkesh Patel 与 Andrej Karpathy 进行了一次深度对话,讨论了人工智能的未来发展方向。Karpathy 认为,当前不应将这一时期称为“AI 代理之年”,而应称为“AI 代理的十年”,因为尽管已有如 Claude 和 Codex 等早期代理展现出强大能力,但它们在持续学习、多模态处理、自主执行复杂任务等方面仍存在显著缺陷,距离真正像人类员工一样工作的智能体还有很长的路要走。
他指出,实现真正有效的 AI 代理面临多个瓶颈:认知能力不足、缺乏长期记忆、无法从少量经验中学习、无法跨任务迁移知识。这些挑战虽可解决,但难度极高,需要系统性突破。基于自己近二十年的 AI 研究与产业经验,Karpathy 判断,解决这些问题大约需要十年时间,既非一年可成,也非五十年可望,而是一个合理且可实现的中长期目标。
他还回顾了 AI 发展史上的几次重大转折,如 AlexNet 带来的深度学习复兴,以及强化学习在特定任务中的成功,但强调这些进展并未真正解决通用智能问题。他特别批评了当前强化学习在复杂环境中的低效性,认为其在大多数真实场景中表现不佳,远不如其他方法实用。
关于 AGI(通用人工智能),Karpathy 认为它仍将在未来十年内逐步实现,不会突然出现,而是会像过去 2.5 个世纪的 2% 年均 GDP 增长一样,缓慢而稳定地融入社会,成为基础设施的一部分。他不认为 AGI 会带来剧烈变革,而更可能是一场渐进式的智能演进。
此外,Karpathy 探讨了人类学习的本质,指出人类具备强大的归纳推理与持续学习能力,而当前 LLM 无法做到这一点,存在“模型坍塌”问题,即模型在不断学习中逐渐丢失原始知识,难以真正“成长”。他强调,未来教育体系也应随之变革,从知识灌输转向培养批判性思维与问题解决能力。
最后,他展望了自动驾驶的发展历程,指出其进展缓慢并非技术不足,而是因为真实世界环境的复杂性远超预期,这也印证了 AI 通用化之路的艰难。
https://news.ycombinator.com/item?id=45619329
https://simonwillison.net/2025/Oct/16/claude-skills/
Anthropic 推出了 Claude Skills,一种让模型调用特定功能的新机制。Skills 是包含说明文档、脚本和资源的文件夹,仅在任务相关时被加载,显著提升模型在特定任务上的表现,如处理 Excel 文件或遵循品牌规范。
每个 Skill 以 Markdown 文件为核心,通过 YAML 前置元数据描述其用途,仅需几十个 token 占用,高效且可扩展。实际使用中,模型可调用脚本执行复杂操作,例如生成符合 Slack 限制的 GIF。文中演示了使用 slack-gif-creator Skill 生成 GIF 的过程,模型能自动检查文件大小并优化输出。
Skills 的实现依赖于模型具备访问文件系统、运行命令和执行脚本的能力,这要求一个安全的代码执行环境。这一特性使 Claude Code 不再只是编程工具,而是一个通用自动化代理,能完成从数据处理到内容发布的多种任务。
与早期的 MCP(模型上下文协议)相比,Skills 在效率和实用性上更具优势。MCP 存在大量 token 消耗问题,而 Skills 通过本地脚本和 CLI 工具替代冗长的描述,大幅减少上下文占用,且更易迭代和维护。
作者认为,Skills 的简洁与强大,可能比 MCP 更具变革意义,标志着 LLM 从“对话”走向“行动”的关键一步。
https://news.ycombinator.com/item?id=45619537
https://www.thefarside.com/new-stuff
本文是漫画家加里·拉森(Gary Larson)在《每日一瞥》(The Daily Dose)网站“新作品”(New Stuff)栏目中发表的一篇个人随笔,分享他退休后重返创作的心路历程。
拉森曾长期担任《Far Side》漫画的连载作者,但十五年高强度的创作生涯让他在退休后一度远离绘画。多年未动笔,直到一次因钢笔堵塞而被迫清理,才触发了他重新尝试创作的契机。
这次困扰他的小问题,反而促使他尝试使用数字绘图板。起初只是为了解决每年绘制圣诞贺卡时的笔具麻烦,但没想到数字工具带来的丰富功能让他重新找回了创作的乐趣。他惊讶于现代技术的潜力,甚至在第一次尝试时就画出了一个原始人形象。
如今的“新作品”栏目,正是他探索数字艺术的成果。尽管从传统钢笔墨水转向数字绘图如同“坐在波音 747 的驾驶舱”,充满挑战,但他依然感受到当年创作《Far Side》时那种探索未知、冒险创新的乐趣。
他强调,这些新作品并非对旧作的延续,而是纯粹出于兴趣的实验与尝试。没有了出版截止日期的压力,他得以自由表达,正如福尔摩斯所说:“游戏开始了。”
最后,他由衷感谢那支“背叛”的钢笔——正是它,让他迈出了重返画笔的第一步。
https://news.ycombinator.com/item?id=45622365
https://blogsystem5.substack.com/p/the-ides-we-had-30-years-ago-and
这篇文章是 Julio Merino 在 2023 年 12 月 25 日发表的,主题是回顾 30 年前的文本模式集成开发环境(IDE),并与现代的 IDE 进行比较。文章的核心内容包括以下几个方面:
SideKick Plus(1984):虽然不是代码编辑器,但作为个人信息管理系统(PIM),它支持快速切换,类似于现代的多任务处理。
Turbo Pascal 1.0(1983):标志着集成开发环境的开始,尽管当时还没有 TUI。
QuickBASIC 2.0(1986):具有传统的 TUI,与 EDIT.COM 类似。
Borland Turbo 系列:包括 Turbo C++(1990)、Turbo Assembler 和 Turbo Pascal,这些 IDE 功能强大,具有以下特点:
文章最后,作者呼吁读者订阅他的博客,以支持他的工作。
https://news.ycombinator.com/item?id=45626910
https://www.antipope.org/charlie/blog-static/2025/10/the-pivot-1.html
本文是作家查尔斯·斯特罗斯(Charlie Stross)在 61 岁生日之际发表的一篇博客文章,题为《转折点》。他将当前年份称为“我们时代的转折点”,类比于 1968 年对战后世界秩序的深远影响。
作者指出,当今世界正经历一场前所未有的文明能源转型,这一过程几乎不可逆转。从 1750 年前人类受限于肌肉、风力、水力和木材/煤炭等原始能源,到 19 世纪工业革命引入燃烧引擎,再到 20 世纪石油取代煤炭成为主导能源——这一转变的关键事件是 1905 年日俄战争中俄罗斯舰队长途跋涉、依赖煤炭补给却惨败于对马海峡,凸显了煤炭运输的低效与脆弱。
由此,全球海军迅速转向石油燃料,英国对伊朗的战略介入也与此密切相关,其遗留的能源地缘政治问题至今仍在影响国际关系。
进入 21 世纪,光伏技术成本呈指数下降,中国在此领域实现“科幻级”发展:2024 年仅前五个月就新增 198 吉瓦太阳能装机容量,其中 5 月单月达 93 吉瓦,提前完成 2030 年碳中和目标。同时,欧盟在 2025 年夏季超过 50% 电力来自可再生能源,俄乌战争加速了欧洲摆脱俄罗斯天然气依赖的进程。
化石燃料行业面临巨大压力,其资产可能在未来二十年内变成“搁浅资产”。气候怀疑论宣传的背后,实则是对巨额资产贬值的恐惧。
此外,交通领域的电气化趋势明显:高铁普遍采用电力驱动,城市电动车日益普及,电动自行车已无需推广。但航空等长距离高载重运输仍难以完全电气化。
总体而言,这场能源革命正在重塑全球经济结构、地缘政治格局与社会心理,带来动荡与不安,但也孕育着新的可能性。
https://news.ycombinator.com/item?id=45621074
https://github.com/BurntSushi/ripgrep/releases/tag/15.0.0
ripgrep 15.0.0 是一个主要包含错误修复、小幅性能优化和少量新功能的重大版本更新。ripgrep 是一款基于行的递归搜索工具,可高效地在当前目录中使用正则表达式查找内容,支持自动忽略隐藏文件、二进制文件以及遵循 .gitignore 规则。
主要更新亮点包括:
性能方面:
新增功能:
编译优化:
其他修复涵盖:
该版本整体以稳定性和兼容性提升为主,适合所有 ripgrep 用户升级。
https://news.ycombinator.com/item?id=45627324
-F
选项理论上应将模式视为纯文本,但仍有少数字符在某些情况下似乎仍需转义,存在潜在的使用困惑。-e
的扩展名匹配功能,以简化对文件扩展名的搜索,避免使用复杂的 glob 语法。-F
与包含连字符的模式(如 -regex
)结合时,命令行解析会误将其识别为选项,建议引入如 -F=-regex
这样的语法来解决。--replace
和 --type
功能被用户发现后感到惊喜,提醒用户应更仔细阅读发布说明以掌握新特性。-uu
仅跳过隐藏文件,而 -uuu
才能同时跳过二进制文件,使用时需注意参数差异。这款手表的设计理念与众不同,旨在将传统上被隐藏的电子元件展现出来,而非掩盖。其灵感来源于命令行界面和计算机硬件,强调科技感与极简美学的结合。手表的 PCB(印刷电路板)设计经过精心规划,突出功能性与视觉表达的统一。软件与固件部分也围绕这一理念进行开发,确保操作直观且富有数字时代的特色。硬件方面,表壳经历了多轮原型设计与迭代,以实现结构稳定性与外观美感的平衡。整个项目开源,相关代码与设计文件均托管在 GitHub 上,供爱好者参考与参与。
https://news.ycombinator.com/item?id=45626130
date +whatever
命令比 ./t
更合理,尤其在屏幕空间允许的情况下。https://images.wur.nl/digital/collection/coll13/search
该网页是荷兰瓦赫宁根大学与研究中心(Wageningen University & Research)的数字馆藏平台 CONTENTdm 上的一个图像收藏页面,主题为“根系绘图”(Root System Drawings)。页面展示了大量植物根系的科学绘图,涵盖多种植物种类,包括乔木、灌木、草本植物、农作物及野生植物等。
收藏内容按植物学分类组织,包括多个子系列,如中欧草原植物根系图集(Band 1 和 Band 2)、中欧森林树木与灌木根系图集、农田杂草与栽培作物根系图集、不同生境中植物根系的发育研究等。每幅图均以植物学名命名,部分植物如欧洲云杉(Abies alba)、山毛榉(Fagus sylvatica)、橡树(Quercus robur)、苹果树(Malus domestica)等均有重复出现,表明其在根系研究中的重要性。
页面支持按标题、主题、挖掘植物、排序方式及每页显示数量进行筛选和浏览,当前显示第 1-100 条记录,共 1,180 条。用户可通过“Go to page”跳转至其他页码,进行深度浏览。所有图像均来自学术研究项目,具有较高的科学价值,适用于植物学、生态学、农学等领域的教学与研究参考。
该平台还提供版权说明、搜索提示及登录功能,支持高级搜索,便于用户查找特定植物或研究主题。整体界面简洁,功能清晰,是植物根系形态学研究的重要数字资源库。
https://news.ycombinator.com/item?id=45627394
https://www.wheresyoured.at/openai400bn/
OpenAI 计划在未来 12 个月内投入超过 4000 亿美元,以完成其庞大的数据中心扩张计划,但作者认为这一目标在时间、资金、基础设施和人力资源上均不可行。文中指出,每建设 1 吉瓦(GW)的数据中心容量,成本至少为 500 亿美元,且需耗时两年半,而 OpenAI 承诺的 33GW 容量部署时间表严重超前,缺乏实际可行性。
作者质疑 OpenAI 与 NVIDIA、AMD、Broadcom 等科技巨头的联合计划,包括 2026 年下半年完成 AI 推理芯片制造并部署 1GW 容量、使用 AMD MI450 GPU 和 NVIDIA Vera Rubin 系统等,均缺乏选址、电力配套和建设准备,时间线完全不现实。尤其指出,即便有资金,也面临变压器、特种钢材和专业人才短缺等现实瓶颈。
文章批评媒体对这些不切实际的承诺保持中立报道,实则是对市场的误导。作者认为,这些公司和高管明知计划无法实现,却仍公开承诺,本质是为推动股价、融资和交易服务,属于“市场操纵”。他强调,OpenAI 宣称的 8 亿周活跃用户可能存在数据重复计算,而其计划到 2033 年建设 250GW 算力,耗资 10 万亿美元,相当于美国 2024 年 GDP 的三分之一,远超全球现有 55GW 数据中心总容量,完全脱离现实。
作者最终断言,当前的 AI 扩张叙事已演变为一场“疯狂的泡沫”,一旦资金链断裂或实际需求无法支撑,将引发系统性金融风险,而公众和媒体对此却视而不见。
https://news.ycombinator.com/item?id=45619544
https://www.thegamer.com/gog-private-investigators-off-the-grid-ip-rights-holders/
GOG.com 作为致力于游戏遗产保护的平台,正面临前所未有的挑战。尽管其目标是让经典游戏在现代设备上顺利运行,但实际操作中发现,许多老游戏不仅难以启动,还存在不支持现代控制器、超宽屏分辨率、无法最小化等技术问题。
更棘手的是知识产权(IP)的追踪与获取。GOG 曾雇佣私人调查员,找到一位隐居在英国的普通人,他意外继承了多款经典游戏的版权,最终愿意支持游戏的传承。类似案例也出现在 Nightdive 工作室身上,其创始人因无法玩到《系统震撼》(System Shock),便通过保险机构购得版权,进而重启开发。
数字版权管理(DRM)成为另一大障碍,部分游戏因 DRM 机制而完全无法运行,必须依赖第三方补丁。GOG 高管建议,大型游戏公司应在游戏发布几年后移除 DRM,以便未来能顺利保存。但这一提议几乎不可能实现,因为企业更关注持续盈利而非文化传承。
评论区中,用户对现行 IP 保护制度提出质疑,认为保护期过长阻碍了技术创新与文化传承。有人主张,游戏在停止商业运营后,应允许保存组织合法获取并维护其内容,甚至建议开放源代码。也有观点认为,游戏开发者应有权长期获利,但不应以牺牲文化遗产为代价。
https://news.ycombinator.com/item?id=45620394
https://news.ycombinator.com/item?id=45620183
The interview which I’ve watched recently with Rich Sutton left me with the impression that AGI is not just a matter of adding more 9s.
The interviewer had an idea that he took for granted: that to understand language you have to have a model of the world. LLMs seem to udnerstand language therefore they’ve trained a model of the world. Sutton rejected the premise immediately. He might be right in being skeptical here.
ekjhgkejhgk
最近我观看的里奇·萨顿的访谈让我觉得,通用人工智能(AGI)不只是简单地增加更多的“9”。采访者有一个他视为理所当然的想法:要理解语言,就必须拥有一个世界模型。大型语言模型(LLMs)似乎理解语言,因此它们已经训练了一个世界模型。萨顿立刻否定了这个前提。他在这里的怀疑态度可能是正确的。
https://news.ycombinator.com/item?id=45619225
Sub-Headline from this article: “Plummeting resale values are threatening to derail the world’s transition to electric transportation.”
Alternative take: “EVs now easy to afford for the 80% of Americans who don’t have $50-90k to spend on an EV!”
This year I bought a 2022 EV with 16k miles. A luxury brand. The sticker price when new was $79,000. I paid $35k. It was an off-lease vehicle so if anyone took a bath, it was the bank. I would never in a million years spend 80 grand on a car but now I have a great EV.
Battery life is not a huge concern. Any more than timing belts/chains, transmissions, etc. can be dauntingly costly repairs for cars with 150k miles or more.
I also have a gas car which I love (spouse drives the electric for a much greater commute) so I’m no EV absolutist. But this whole premise is stupid. EV adoption has had 2 main blockers: 1. only rich people had justification to buy them until recently, and 2. Charging space for people who don’t have their own private garage.
Now #1 is no longer a factor. This is a GOOD thing.
xp84
这篇文章的小标题是:“二手车残值的暴跌正在威胁要阻碍全球向电动交通的转型。”
另一种看法是:“对那80%没有花5万到9万美元来买电动汽车的美国人来说,电动汽车现在很容易负担得起!”
今年我买了一辆行驶了1.6万英里的2022款电动汽车,是豪华品牌。新车时的标价是7.9万美元,我只付了3.5万美元。这辆车是租赁期满退回的,所以如果谁亏了钱,那也是银行亏了。我一辈子都不可能花8万美元买一辆车,但现在我拥有了一辆很棒的电动汽车。
电池寿命不是一个大问题。对于行驶了15万英里或更多的汽车来说,正时皮带/链条、变速箱等部件的维修成本也同样可能高得吓人。
我也有一辆我非常喜欢的汽油车(我的配偶开电动车的通勤距离要长得多),所以我不是电动汽车的绝对拥护者。但这个整个前提都很愚蠢。电动汽车的普及主要有两个障碍:1. 直到最近,只有富人买电动汽车才算是物有所值;2. 以及没有私人车库的人的充电空间问题。
现在,第一个障碍已经不再是问题了。这是一件好事。
https://news.ycombinator.com/item?id=45618730
You can just buy new, for the same or lower price
But, like the article says, new EVs are selling for about twice as much as a 2-year-old used vehicle of the same make and model. That’s a very very far cry from “same or lower price”.
bunderbunder
你可以直接买新车,价格可能相同甚至更低。
但,就像文章所说,新电动汽车的售价大约是同款两年二手车的两倍。这与“价格相同或更低”的说法相差甚远。
https://news.ycombinator.com/item?id=45626902
taking inspiration from command-line interfaces
IMO the take away from command-line interfaces is compact, precise and minimal design. In a transitional shell prompt like #~$, each character has its meaning. Merely copying these symbols to a watch face is the exact opposite spirit of command like interfaces.
blahgeek
从命令行界面中汲取灵感。在我看来,命令行界面的核心启示在于其紧凑、精确和极简的设计。在像 #~$ 这样的过渡性 shell 提示符中,每个字符都有其含义。仅仅将这些符号复制到表盘上,与命令行界面的精神截然相反。
https://news.ycombinator.com/item?id=45619531
Conversions to Nickelback, Poundz, Los Pesos, DJ Euro and Yen.
earlyriser
转向了Nickelback、Poundz、Los Pesos、DJ Euro和Yen。
https://news.ycombinator.com/item?id=45618776
I’ve tried 30X redirects (which it follows)
301 response to a selection of very large files hosted by companies you don’t like.
When their AWS instances start downloading 70000 windows ISOs in parallel, they might notice.
Hard to do with cloudflare but you can also tar pit them. Accept the request and send a response, one character at a time (make sure you uncork and flush buffers/etc), with a 30 second delay between characters.
700 requests/second with say 10Kb headers/response. Sure is a shame your server is so slow.
AdamJacobMuller
我试过30X重定向(它会跟从)。
向一些由你不喜欢的公司托管的超大文件返回301响应。
当他们的AWS实例开始并行下载7万个Windows ISO文件时,他们可能会注意到。
用Cloudflare很难做到,但你也可以用“拖住”(tar pit)的办法。接收请求,然后一次发送一个字符来作为响应(记得清空并刷新缓冲区等),每个字符之间间隔30秒。
每秒700个请求,每个请求/响应的报头假设有10Kb。真可惜你的服务器这么慢。
https://news.ycombinator.com/item?id=45626590
Won’t be available to anyone terminated for copyright stuff.
Woooow what a huge dick move.
That’s the one massively imbalanced power dynamic that I hear people really fear losing their livelihood to for no good reason, and they’re leaving it there to terrorize and ruin livelihoods for future generations.
I put up a video of a funeral service for my grandma and like 5 minutes later I was getting threatening legalese mail about my channel by cancelled forever because some record label has a recording of a thousand year old hymn and they don’t give a shit about threatening people with no legal basis at all
conartist6
因版权问题而被封禁的用户都将无法使用这个。
哇哦,这操作也太缺德了吧。
这就是一种极度不平等的权力关系,人们之所以害怕,就是因为担心自己会无缘无故地因此丢掉饭碗,而他们却任由这种关系存在,以此来恐吓和毁掉未来几代人的生计。
我上传了一段为我奶奶举办的葬礼视频,结果5分钟后,我就收到了一封充满法律术语的威胁邮件,我的频道也因此被永久封禁。只因为某家唱片公司拥有某首千年古老圣歌的版权,他们才不在乎自己毫无法律依据地去威胁别人呢。
https://news.ycombinator.com/item?id=45618525
For Tesla owners in the U.S., their 2023 Model Ys are worth 42% less than what they paid two years ago
I want to suggest that there are recent reasons why Tesla, as a brand, has specifically gotten a bit less popular that are unrelated to the entire EV category. (It’s Elon. He’s the reason.)
That said, to the extent the result holds true for the entire category, I’d suspect it’s because EVs are still fairly immature. It’s like “resale value of desktop PCs falling rapidly” back in the 90s, when the field was advancing quickly enough that buying used was genuinely a bad idea.
kemayo
对于美国的特斯拉车主来说,他们两年前购买的2023款Model Y,如今的价值比当初购买时低了42%。
我想说的是,特斯拉这个品牌最近人气下滑,有一些特定原因,而这些原因与整个电动汽车(EV)类别无关。(说到底,就是埃隆·马斯克的问题。)
话虽如此,如果这个现象在整个电动汽车类别中都成立,我怀疑这是因为电动汽车技术本身还相当不成熟。这就好比九十年代台式电脑的二手价值迅速下跌,当时技术发展太快,以至于购买二手产品确实是个坏主意。
https://news.ycombinator.com/item?id=45617829
I’ve done a fair amount of data-intensive fact checking for journalism articles and have had fact checking done on my own data-intensive reporting.
Couple things:
Fact checkers are not paid enough to do what they do. They’re usually freelancers and they’re usually financially struggling. The dynamics of that are difficult to say the least.
Editors change things last minute without informing the journalist whose name the piece is in. It’s really not fun to receive threats of lawsuit from a powerful government agency because your editor added something that you never would have added. Once told an editor in-writing three times not to add something and he did it right before publishing.
It sucks being a journalist. Donate to your local investigative newsroom.
chaps
我为新闻文章做过不少数据密集型的事实核查,也请人对自己的数据密集型报道进行过事实核查。
有几点想说的:
事实核查员的报酬与他们的工作量极不相称。他们通常是自由职业者,经济状况普遍拮据。这种情况的艰难程度,怎么说都不过分。
编辑会在最后一刻修改内容,却不通知署名的记者。因为你的编辑添加了些你绝不会添加的内容,结果收到来自强大政府机构的诉讼威胁,这真的让人很不好受。我曾三次书面告知编辑不要添加某内容,他还是在发表前加了进去。
当记者真不是滋味。请向你当地的调查性新闻编辑部捐款。
https://news.ycombinator.com/item?id=45620990
I like GOG a lot but it’s wild to me that their GOG Galaxy client doesn’t work on Linux! A lot of gamers who care about preservation and availability are spending money with Valve because Steam’s DRM is mostly inoffensive and the Linux support is so good.
The addressable market segment of people who play PC games and also care about DRM-free accessibility would be larger if GOG’s launcher ran on Linux and targeted Linux users. It seems like a logical overlap to me.
Valve is eating GOG’s lunch in this segment but it could easily change. Sure it might be small but it’s bigger than ever, still growing, and seems to fit GOG’s mission.
I would definitely start repurchasing my Steam games DRM-free on GOG if only they provided a launcher with the tooling necessary to download & run them on my system.
As things stand now, and for all the good GOG does… it’s not enough to be DRM-free but only distribute Windows installers. You’ve just outsourced the DRM scheme to Microsoft. If the software doesn’t run on a DRM-free OS, the job is only halfway done.
And in the meantime, GOG’s product is tragically subject to piracy, (I believe) partially enabled by their decision to only package games for the OS upon which most piracy traditionally takes place! :( I hope this could be offset by packaging for a crowd with more ideological overlap.
branon
我非常喜欢GOG,但他们家的GOG Galaxy客户端居然不支持Linux,这让我觉得很不可思议!很多注重游戏保存和可获取性的玩家,都选择在Valve(Steam)上花钱,因为Steam的DRM基本上没什么杀伤力,而且对Linux的支持非常好。
如果GOG的启动器能在Linux上运行,并针对Linux用户进行优化,那么它所触及的PC游戏玩家且关注无DRM可访问性的市场细分将会更大。在我看来,这似乎是一个逻辑上的重合。
Valve在这个领域正蚕食GOG的市场,但这很容易改变。这个市场当然可能不大,但它比以往任何时候都大,而且仍在增长,似乎也符合GOG的使命。
如果GOG能提供一个能够在我系统上下载和运行游戏的启动器,我肯定会开始重新在GOG上购买Steam上的无DRM游戏。
就目前情况而言,尽管GOG做了很多好事……仅仅提供无DRM但仅分发Windows安装包是远远不够的。你们只是把DRM方案外包给了微软。如果软件不能在无DRM的操作系统上运行,那这项工作才算完成了一半。
与此同时,GOG的产品可悲地成了盗版的目标(我相信),这在一定程度上是由于他们决定只为传统上盗版最猖獗的操作系统打包游戏!:( 我希望通过对理念更契合的群体进行打包发行来弥补这一点。
https://news.ycombinator.com/item?id=45623083
We’re doing something like this internally. Our monorepo context files were much too big, so we built a progressive tree of fragments to load up for different tasks.
I am struck by how much these kinds of context documents resemble normal developer documentation, but actually useful and task-oriented. What was the barrier to creating these documents before?
Three theories on why this is so different:
The feedback loop was too long. If you wrote some docs, you might never learn if they were any good. If you did, it might be years later. And if you changed them, doing an A/B test was impractical. Now, you can write up a context markdown, ask Claude to do something, and iterate in minutes.
The tools can help build them. Building good docs was always hard. Especially if you take the time to include examples, urls, etc. that make the documentation truly useful. These tools reduce this cost.
Many programmers are egotists. Documentation that helps other people doesn’t generate internal motivation. But documentation that allows you to better harness a computer minion to your will is attractive.
Any other theories?
michael1999
我们内部也在做类似的事情。我们 monorepo 的上下文文件太大了,所以我们构建了一个渐进式的片段树,以便为不同的任务加载。
我惊讶地发现,这类上下文文档与普通开发者文档如此相似,但实际上却更有用,并且是面向任务的。之前创建这类文档的障碍是什么?
关于为什么情况如此不同,我有三个理论:
反馈周期太长。如果你写了一些文档,你可能永远不知道它们到底好不好用。即使知道了,也可能是几年后的事情。而如果你修改了文档,进行 A/B 测试也是不切实际的。现在,你可以写一个上下文 markdown,让 Claude 去完成某个任务,并在几分钟内完成迭代。
这些工具可以帮助构建它们。编写好的文档一直很难。特别是当你花时间包含示例、网址等内容,以使文档真正有用时。这些工具降低了这种成本。
许多程序员都有表现欲。帮助他人的文档无法激发他们的内在动力。但能让你更好地驾驭电脑小助手为你所用的文档,则非常有吸引力。
还有什么其他的理论吗?
https://news.ycombinator.com/item?id=45618404
Main author of Anubis here. Have CloudFlare return a HTTP 200 response instead of a rejection at non-200. That makes the bots stop hammering until they get a 200 response.
xena
我是 Anubis 的主要作者。让 CloudFlare 在非200状态码时也返回一个 HTTP 200 响应,而不是拒绝请求。这样,机器人在收到 200 响应之前就会停止猛攻。
https://news.ycombinator.com/item?id=45620292
His “$400B in next 12 months” claim treats OpenAI as paying construction costs upfront. But OpenAI is leasing capacity as operating expense - Oracle finances and builds the data centers [1]. This is like saying a tenant needs $5M cash because that’s what the building cost to construct.
The Oracle deal structure: OpenAI pays ~$30B/year in rental fees starting fiscal 2027/2028 [2], ramping up over 5 years as capacity comes online. Not “$400B in 12 months.”
The deals are structured as staged vendor financing: - NVIDIA “invests” $10B per gigawatt milestone, gets paid back through chip purchases [3] - AMD gives OpenAI warrants for 160M shares (~10% equity) that vest as chips deploy [4] - As one analyst noted: “Nvidia invests $100 billion in OpenAI, which then OpenAI turns back and gives it back to Nvidia” [3]
This is circular vendor financing where suppliers extend credit betting on OpenAI’s growth. It’s unusual and potentially fragile, but it’s not “OpenAI needs $400B cash they don’t have.”
Zitron asks: “Does OpenAI have $400B in cash?”
The actual question: “Can OpenAI grow revenue from $13B to $60B+ to cover lease payments by 2028-2029?”
The first question is nonsensical given deal structure. The second is the actual bet everyone’s making.
His core thesis - “OpenAI literally cannot afford these deals therefore fraud” - fails because he fundamentally misunderstands how the deals work. The real questions are about execution timelines and revenue growth projections, not about OpenAI needing hundreds of billions in cash right now.
There’s probably a good critical piece to write about whether these vendor financing bets will pay off, but this isn’t it.
ctoth
他“未来12个月需要4000亿美元”的说法,是把OpenAI当作需要预先支付建设费用的公司。但实际上,OpenAI是以运营费用的方式租赁算力,而甲骨文公司则负责融资和建设数据中心[1]。这就好比说,一个租客需要500万美元现金,理由是这座大楼的建造成本就是这个数。
甲骨文的交易结构是:OpenAI从2027/2028财年开始,每年支付约300亿美元的租金[2],随着算力逐步上线,租金在5年内逐步增加。而不是“12个月内需要4000亿美元”。
这些交易是分阶段的供应商融资模式:
这是一种循环的供应商融资模式,供应商们基于对OpenAI增长的预期提供信贷。这种方式不寻常且可能比较脆弱,但这并不意味着“OpenAI需要它没有的4000亿美元现金”。
Zitron问道:“OpenAI有4000亿美元的现金吗?” 真正的问题是:“OpenAI能否将营收从130亿美元增长到600亿美元以上,以在2028-2029年支付租金?”
鉴于交易结构,第一个问题是毫无意义的。而第二个问题才是所有人真正在下的赌注。
他的核心论点——“OpenAI绝对负担不起这些交易,因此是欺诈”——失败了,因为他根本不理解这些交易是如何运作的。真正的问题是关于执行时间表和营收增长预测,而不是关于OpenAI现在是否需要数千亿美元的现金。
关于这些供应商融资赌注是否能成功,或许可以写一篇很好的批判性文章,但本文并非如此。
https://news.ycombinator.com/item?id=45622045
Using UUIDv7 is generally discouraged for security when the primary key is exposed to end users in external-facing applications or APIs. The main issue is that UUIDv7 incorporates a 48-bit Unix timestamp as its most significant part, meaning the identifier itself leaks the record’s creation time… Experts recommend using UUIDv7 only for internal keys and exposing a separate, truly random UUIDv4 as an external identifier.
So this basically defeats the entire performance improvement of UUIDv7. Because anything coming from the user will need to look up a UUIDv4, which means every new row needs to create an extra random UUIDv4 which gets inserted into a second B-tree index, which recreates the very performance problem UUIDv7 is supposedly solving.
In other words, you can only use UUIDv7 for rows that never need to be looked up by any data coming from the user. And maybe that exists sometimes for certain data in JOINs… but it seems like it might be more the exception than the rule, and you never know when an internal ID might need to become an external one in the future.
crazygringo
当主键需要在面向外部的应用程序或API中暴露给最终用户时,出于安全考虑,通常不建议使用UUIDv7。主要问题在于,UUIDv7在其最高有效部分包含了一个48位的Unix时间戳,这意味着标识符本身会泄露记录的创建时间……专家建议仅将UUIDv7用于内部键,并暴露一个独立的、真正随机的UUIDv4作为外部标识符。
所以这基本上就抵消了UUIDv7所带来的全部性能提升。因为任何来自用户的内容都需要通过UUIDv4进行查询,这意味着每一行新数据都需要额外创建一个随机UUIDv4,并将其插入到第二个B树索引中,这就重现了UUIDv7号称所要解决的性能问题。
换句话说,你只能在那些永远不会被任何来自用户的数据查询的行上使用UUIDv7。也许在某些JOIN操作中的某些数据存在这种情况……但这似乎更像是例外而不是常规情况,而且你永远不知道内部ID将来何时可能需要变成外部ID。
https://news.ycombinator.com/item?id=45619150
More odious nannying by silly civil servants. If Britain is to restore cultural leadership it needs to move policy away from this horrible trend of policing what people say and think, and focus its energy on better policing what people do.
riazrizvi
一些愚蠢的公务员又在搞令人厌恶的保姆式管教。如果英国要恢复其文化领导力,就必须摆脱这种管控人们思想和言行的可憎趋势,把精力用在更好地规范人们的行为上。
https://news.ycombinator.com/item?id=45612120
I have more than 100 books that I bought with actual money on Apple’s iBooks (or whatever it was called back in 2010-2012). I no longer use an iPad and would like to be able to read them on my Kindle. Because of DRM, I can’t. I’m all for supporting authors and the various editors, etc., but I feel like I’ve already done that in this case.
sib
我在苹果的iBooks(或者它2010-2012年间叫什么来着)上花钱买了超过100本书。我现在不用iPad了,希望能在我自己的Kindle上看这些书。但因为有DRM,我做不到。我非常支持作者和编辑等人,但我觉得这次我已经付过钱了。
https://news.ycombinator.com/item?id=45619922
From the attorney’s post:
The infinite character of that power was most famously summed up by English lawyer Sir Ivor Jennings, who once said that “if Parliament enacts that smoking in the streets of Paris is an offence, then it is an offence”. This line is taught to every first-year English law student.
Initially this seems like disrespect for another country’s sovereignty. But really the crucial thing is:
We explained to the UK that the Online Safety Act had a snowball’s chance in hell of being enforced in the United States
Ofcom has to go through the motions of telling 4chan they can’t smoke in Paris because of the (very on-brand) nanny law.
cosmicgadget
律师发帖称:
这种权力的无限性最著名的总结来自英国律师伊沃·詹宁斯爵士,他曾说过:“如果议会立法规定在巴黎街道上吸烟是违法行为,那么它就是违法行为”。这句话被教授给每一位英国法科新生。
起初,这似乎是对另一个国家主权的不尊重。但真正关键的一点是:
我们向英国解释,他们的《在线安全法案》在美国几乎没有被执行的可能。
英国通信管理局 (Ofcom) 不得不走个形式,告诉4chan,因为这项(非常符合其风格的)保姆式法律,他们不能在巴黎吸烟。
https://news.ycombinator.com/item?id=45627903
(Article is from 2023, so the title should be updated to say “32 years ago”, or something)
The biggest loss in TUIs is the latest wave of asynchronous frameworks, which bring the joy of dropped keypresses to the terminal.
In any TUI released before the year 2000, if you press a key when the system wasn’t ready, the key would just wait until the system was ready. Many TUIs today still do this, but increasingly frequently (with the modern “web-inspired” TUI frameworks), the system will be ready to take your keypress, and discard it because the async dialog box hasn’t registered its event listener yet.
Other than that antipattern, TUIs are doing great these days. As for terminal IDEs, Neovim has never been more featureful, with LSPs and other plugins giving all the features this article discusses. I guess it isn’t a mouse-driven TUI, so the author wouldn’t be interested, but still.
CGamesPlay
TUIs 最大的损失莫过于最新一波的异步框架,它们给终端带来了按键丢失的“乐趣”。
在 2000 年之前发布的任何 TUI 中,如果系统未准备就绪而你按下了某个键,该按键会一直等待直到系统准备就绪。如今许多 TUI 仍然这样做,但这种情况越来越少(尤其是在那些受现代“Web 风格”启发的 TUI 框架中),系统可能已经准备好接收你的按键,却把它丢弃了,因为异步对话框的事件监听器还未注册。
除了这种反模式,如今的 TUI 发展得很好。至于终端 IDE,Neovim 从未如此功能强大,借助 LSP 和其他插件,它具备了本文所讨论的所有功能。我想它不是一个鼠标驱动的 TUI,所以作者可能不感兴趣,但话虽如此。
https://news.ycombinator.com/item?id=45622129
This is only really true if leaking the creation time of the record is itself a security concern.
tracker1
只有当泄露记录的创建时间本身就是安全问题的情况下,这句话才完全正确。
2025-10-18 08:34:08
- 作者通过识别并比对 Kindle 网页版的 SVG 字形,利用感知哈希与 SSIM 还原文本并生成接近原排版的 EPUB,旨在个人备份与技术验证。
- DigitalSociety 将服务从 AWS/DigitalOcean 迁移到 Hetzner,借助 Kubernetes、Terraform 等实现基础设施即代码,将月费从约 559 美元降至 132.96 美元并提升性能。
- meow.camera 是一个聚合中国各地猫咪喂食点实时摄像头的非官方平台,提供多端观看、收藏、截图与流解码配置等功能。
- Ruby 核心团队在 Matz 领导下接管 RubyGems 与 Bundler 的项目所有权,以确保生态长期稳定与可持续发展,项目仍然开源且鼓励社区贡献。
- 亚马逊 Ring 与监控公司 Flock 合作允许执法部门请求共享门铃视频,可能将大量家庭摄像头数据纳入执法网络,带来隐私和算法偏见风险。
- 该网站用美国劳工统计局的通胀数据将“50 美分”按现值重算(约 109 美分)并每月更新,以趣味方式展示通货膨胀影响。
- 作者每天观看纳米布沙漠水源地的实时直播并记录多种动物到访,认为此类自然直播适合用于教学和营造放松氛围。
- 4Chan 律师公布与 Ofcom 的通信,质疑 Ofcom 在域外监管权与“主权豁免”声明上的自相矛盾,并建议英国应侧重提升数字素养而非强行跨境执法。
- 作者指责多家媒体在讣闻报道中未做基本事实核查导致明显错误,呼吁媒体与公众在分享前进行基本核实以维护事实准确性。
- 电动汽车在二手市场贬值速度快于燃油车,主要由于电池寿命不确定、缺乏统一评估标准和技术快速迭代,电池即服务等模式被视为潜在缓解方案。
https://blog.pixelmelt.dev/kindle-web-drm/
作者购买了一本亚马逊 Kindle 电子书,但发现其 Android 应用频繁崩溃,且无法下载或导出书籍,甚至连离线阅读都受限。这让他意识到自己并未真正“拥有”这本书,而更像是在租赁。
出于对数字版权控制的不满,作者决定逆向破解亚马逊 Kindle 网页版的加密机制。他发现,书籍内容并非直接以文本形式传输,而是通过“字形 ID”(glyph IDs)编码,并使用 SVG 路径绘制每个字符,形成一种动态替换密码。
关键难点在于:每五页就会随机更换一次字符映射表,且每个请求的字形映射完全不同,导致无法建立全局映射。此外,亚马逊还加入了“虚假移动指令”(m3,1 等),干扰自动化解析;同时使用四种字体变体(正常、斜体、粗体、粗斜体)和连字(如 ff、fi),进一步增加破解难度。
作者尝试 OCR 失败后,转向基于图像的解决方案:将每个 SVG 字形渲染为 512×512 像素的图像,使用感知哈希(perceptual hash)进行比对,实现跨请求的字形识别。再通过 SSIM(结构相似性)算法,将未知字形与真实字体(Bookerly TTF)中的字符进行匹配,成功还原所有字符。
最终,他成功解码了 920 页、超过 560 万字的书籍内容,重建出格式几乎与原书一致的 EPUB 文件,完整保留了段落、对齐、字体样式、链接等信息。
作者强调,这一过程并非为了盗版,而是为了证明用户应有权备份自己合法购买的数字内容。他提醒读者:此技术仅适用于个人备份,切勿滥用。
https://news.ycombinator.com/item?id=45610226
https://digitalsociety.coop/posts/migrating-to-hetzner-cloud/
本文讲述了 DigitalSociety 公司从 AWS 和 DigitalOcean 迁移至 Hetzner 云平台的全过程与成果。公司此前在 AWS 和 DigitalOcean 上运行核心服务,包括 SaaS 产品 tap 和多个轻量级服务,但随着业务增长,云成本迅速攀升,AWS 的 Fargate 容器服务在高负载下每月成本超过 70 美元,整体月支出达 449.50 美元,加上 DigitalOcean 的费用,总成本一度达到 559.36 美元。
为降低成本并响应对数据主权与技术自主性的关注,公司转向位于欧洲的 Hetzner 云平台。尽管 Hetzner 以自管理 VPS 为主,但其极具竞争力的定价吸引了公司。通过使用 Kubernetes 与 Talos Linux 构建新架构,实现基础设施代码化管理,结合 CloudNativePG 提供高可用 PostgreSQL 数据库服务,Ingress NGINX、ExternalDNS 和 cert-manager 实现统一的网络与安全策略。
迁移后,每月成本降至 132.96 美元,节省 76%。同时,可用资源大幅提升:vCPU 从 12 增至 44,内存从 24 GiB 增至 88 GiB,性能与容量均实现三倍以上增长。
尽管迁移过程面临挑战,如 Hetzner 的网络区域设计与 AWS 不同,跨位置延迟较高,导致多区域部署困难,最终公司选择在单一位置(纽伦堡)部署,并通过“放置组”提升容错能力。此外,所有基础设施均通过 Terraform 和 Helm 管理,部署由 GitHub Actions 自动化完成。
整体来看,此次迁移不仅大幅降低运营成本,还提升了系统性能与可维护性,是一次成功的云平台转型实践。
https://news.ycombinator.com/item?id=45614922
这是一个名为 meow.camera 的网页,作为 Hello Street Cat(街猫)应用的替代观看平台,专注于展示中国各地猫咪喂食点的实时摄像头画面。该网站并非与原应用开发者 Guangxi Ha Chong Network Technology Co., Ltd. 有任何关联,仅为爱好者自发开发的趣味项目。
页面顶部列出了多个知名喂食点,如 Happy Canteen、Mr. Fresh、Auspicious Restaurant、Mr. Fall、Ms. Smore 等,每个名称后附有昵称或地点信息,体现各地猫饲者与流浪猫之间的温情互动。
网站功能包括:支持在移动端使用 Purrrr 或 JieMao 应用打开摄像头,提供“收藏”“复制链接”“截图”等功能,可选择截图保存为文件或复制到剪贴板。声音效果可开启或关闭,支持单线程或多线程的 ffmpeg.wasm 视频解码配置。
用户可通过 Discord 的 #meow-camera 频道提交问题或建议,其他疑问可发送邮件至 [email protected]。当前版本为 v1.2.0-b2d3e888(ffwasm),支持自动切换亮暗主题,翻译名称功能可开关。
页面右上角显示当前时间:8:27:36 AM,对应喂食点 Happy Canteen 的实时画面,画面加载进度为 88%,显示 84% 的流畅度,共有 32 个摄像头正在运行。
该网站致力于为爱猫人士提供一个便捷、直观的在线观看平台,连接人与城市中的流浪猫,传递温暖与陪伴。
https://news.ycombinator.com/item?id=45613047
https://www.ruby-lang.org/en/news/2025/10/17/rubygems-repository-transition/
Ruby 核心团队宣布接管 RubyGems 和 Bundler 的项目所有权,以确保 Ruby 生态系统的长期稳定与持续发展。此前,这两个关键工具虽作为 Ruby 标准库的一部分,但一直由 Ruby Central 在 GitHub 上独立维护。
此次过渡由 Matz 领导的 Ruby 核心团队主导,将实现对 RubyGems 和 Bundler 的共同管理,但仍由 Ruby Central 负责日常运营。项目将继续保持开源,原有许可证不变,所有贡献者的知识产权不受影响。
开发模式将保持社区驱动,欢迎所有开发者继续参与贡献。这一举措体现了 Ruby 核心团队对生态健康与可持续发展的承诺。
感谢 Ruby Central 多年来的辛勤付出,未来将与社区携手共建更强大的 Ruby 生态。
https://news.ycombinator.com/item?id=45615863
亚马逊旗下的安防摄像头品牌 Ring 宣布与 Flock 公司达成合作。Flock 是一家提供 AI 驱动监控摄像头的公司,其客户包括美国国土安全部、特勤局和海军等联邦机构及警方。
通过此次合作,使用 Flock 系统的执法部门可请求 Ring 门铃用户分享监控视频,用于证据收集和案件调查。Flock 的摄像头具备自动识别车牌和其他车辆信息的功能,并支持通过自然语言搜索查找特定人员或车辆。
该技术存在潜在的种族偏见问题,且此前已有报道指出,ICE、特勤局和海军已接入 Flock 的摄像头网络。此次合作可能使 Flock 获得数百万 Ring 摄像头的视频数据,进一步扩大其监控能力。
Ring 此前因安全漏洞饱受批评。2023 年,美国联邦贸易委员会(FTC)裁定其长期允许员工和承包商随意访问用户视频,因此对其处以 580 万美元罚款。此次合作再次引发公众对隐私和监控滥用的担忧。
https://news.ycombinator.com/item?id=45614713
https://50centadjustedforinflation.com/
50 Cent 这一名称最早于 1994 年 6 月被创造,其名称的由来与“美分”相关,象征着财富与街头文化的结合。该网页通过对比通胀数据(来自美国劳工统计局 BLS),将 50 Cent 的名称价值进行调整,得出其在当前经济环境下的等值金额为 109 美分。这一计算由 Brian Moore 完成,旨在以现代货币价值重新诠释这一文化符号的经济意义。该分析不仅反映了通货膨胀对货币购买力的影响,也突显了 50 Cent 这一名称在流行文化中的持久影响力。
https://news.ycombinator.com/item?id=45618790
https://bookofjoe2.blogspot.com/2025/10/live-stream-from-namib-desert.html
作者在博客中分享了自己每天早晨观看纳米比亚纳米布沙漠一处水源地的实时摄像头直播的习惯。由于纳米比亚比美国东部时区早 6 小时,当作者在早上 8 点观看时,当地已是酷热的白天,水源地吸引了众多野生动物前来饮水。
直播中常见的动物包括斑马、鸵鸟(通常以家庭为单位在安全距离外等待)、角马、疣猪、非洲野牛、豺、耳廓狐、斑鬣狗、开普野兔、红大羚羊、长颈鹿、跳羚,以及大象等。作者感叹这些动物的生动画面,甚至设想如果自己是小学老师,会将大屏幕电视接入这个直播流,作为课堂的日常教学素材。
评论区充满热情互动,读者纷纷惊叹于看到斑马、刺猬等动物的出现,有人用“slurp slurp”形容动物喝水的声音,也有人分享了其他有趣的网站链接。整体氛围轻松愉快,展现了自然生态的奇妙与魅力。
https://news.ycombinator.com/item?id=45615931
https://alecmuffett.com/article/117792
英国通信管理局(Ofcom)因试图监管美国网站 4Chan 而陷入争议。4Chan 律师 Preston Byrne 公开了与 Ofcom 的完整通信记录,其中关键文件《Ofcom 确认决定》指出,根据《在线安全法》第 204(1)条,Ofcom 拥有对英国境内使用在线服务的外国公司进行监管的法律权力,且该法具有域外效力。
然而,Ofcom 在主张对美国公司行使管辖权的同时,又声称自己享有“主权豁免”,拒绝接受美国法律的管辖,甚至否认 4Chan 有司法管辖权针对其提起诉讼。这种自相矛盾的做法被批评者视为对美国主权的公然挑战,也暴露了英国在全球数字治理中角色的不切实际。
作者认为,Ofcom 的举动不仅显得荒谬,更反映出英国在数字时代仍沉溺于殖民思维。若英国无法有效执行其监管权力,未来可能转向建设“英国版防火墙”,以保护儿童免受网络内容影响。但这种做法将适得其反:青少年早已掌握使用 VPN 绕过封锁的技术,且政府封锁反而会引发“斯特莱斯效应”——越禁止,越吸引人关注。
此外,作者指出,真正的问题不在于 4Chan 的内容,而在于社会对数字素养和教育的忽视。与其投入巨资构建网络防火墙,不如加强公民的数字能力与批判性思维。最理性的出路是,Ofcom 和政府应低调撤回此案,转而专注于教育而非监管。
文章最后强调,保护儿童不应靠“网络儿童化”,而应通过培养更强大、更独立的公民来实现。
https://news.ycombinator.com/item?id=45614148
https://shkspr.mobi/blog/2025/10/i-have-no-facts-and-i-must-scream/
文章作者 Terence Eden 批评了媒体在报道中缺乏基本事实核查的行为,尤其针对几份主流报纸转载了一篇关于已故演员 Patricia Routledge 的虚假纪念文章。文章指出,该文包含多个可轻易验证的错误:如错误地称她 95 岁时生日是周一,而实际为周六;称她 1968 年获奖时 39 岁,但实际年龄不符;称她 50 岁出演《Keeping Up Appearances》,而实际为 60 岁;还错误地描述她晚年舞台演出多为莎士比亚作品,实际上并非如此。
作者强调,这些错误只需几分钟的网络搜索即可发现,例如通过日历工具核对日期、查阅维基百科、使用 Google Books 验证引语、或通过社交媒体溯源。他指出,这些媒体引用的所谓“权威来源”——“Jay Speak”博客——本身并无可信依据,且其内容早于该博客发布,可能为转载或复制而来。
作者质疑专业媒体为何在发布前不进行基本核实,认为这反映出行业压力过大、追求点击率而忽视准确性,甚至暗示部分媒体存在懒惰或故意传播虚假信息的问题。他以 BBC 在节目《Have I Got News For You》中播出明显错误信息为例,说明问题严重性。
最后,作者呼吁公众提高警惕,养成分享前核查信息的习惯,强调事实核查并非专业技能,而是每个网民都能做到的基本责任。他指出,对抗虚假信息始于个人行动。
https://news.ycombinator.com/item?id=45617088
https://restofworld.org/2025/ev-depreciation-blusmart-collapse/
电动汽车在全球范围内的二手市场价值急剧下滑,远快于燃油车,正威胁着全球向电动交通转型的进程。
在印度,首家全电动网约车公司 BluSmart 因财务欺诈指控于 2025 年 4 月倒闭,其数千辆电动车原价超 1.2 万美元,如今被低价甩卖至约 3000 美元,暴露出电动车残值暴跌的严重问题。
在美国,2023 款特斯拉 Model Y 的二手价值比购买价两年内下跌 42%,而同款福特 F-150 皮卡仅贬值 20%。研究显示,三年车龄的电动车平均贬值超过 50%,部分美国市场甚至高达 60%,远高于燃油车的 39%。
这一贬值危机主要源于电池寿命不确定性。电动车价值高度依赖电池性能,而电池衰减缺乏统一评估标准。与燃油车有百年积累的维修与估值体系不同,电动车结构简单,但核心价值集中在电池上,导致二手市场缺乏透明度。
大型车队运营商受冲击最严重。美国租车公司 Hertz 因 2021 年购入 10 万辆特斯拉,2024 年亏损达 29 亿美元,部分车辆售价不足 2 万美元,月均亏损超 530 美元。其大量抛售的车辆反映出电动车在租赁行业面临“高投入、高风险、低回报”的困境。
相比之下,特斯拉凭借品牌积累和长期经验,残值表现最佳。而中国品牌如比亚迪、蔚来、小鹏等在二手市场表现较弱,消费者对其长期价值缺乏信心。
区域差异明显:中国、挪威、哥斯达黎加等电动车接受度高的市场,因政策支持和充电网络完善,二手车价值相对稳定。而北美地区因公路网密集、长途出行多、气候影响大,电动车使用效率下降,进一步加剧贬值压力。
专家指出,电动车更适合城市短途通勤,但在极端温度或长距离行驶中充电耗时长,续航焦虑仍存。相比之下,欧洲城市密度高、通勤距离短,二手电动车市场更稳定。
为应对风险,电池即服务(BaaS)模式正成为解决方案。该模式将电池租赁与车辆分离,使车队运营商获得可预测的成本和更稳定的残值,降低资产贬值带来的经营风险。
尽管消费者对电动车兴趣有限(欧洲仅 20%、美国仅 10% 考虑购买),但 Uber、Bolt、Lyft 等平台仍承诺全面电动化,但若车辆在贷款还清前已大幅贬值,将严重威胁其商业模式可持续性。
https://news.ycombinator.com/item?id=45615237
https://news.ycombinator.com/item?id=45615867
I cannot overstate the performance improvement of deploying onto bare metal. We typically see a doubling of performance, as well as extremely predictable baseline performance.
This is down to several things:
Latency - having your own local network, rather than sharing some larger datacenter network fabric, gives around of order of magnitude reduced latency
Caches – right-sizing a deployment for the underlying hardware, and so actually allowing a modern CPU to do its job, makes a huge difference
Disk IO – Dedicated NVMe access is fast.
And with it comes a whole bunch of other benefits:
Auto-scalers becomes less important, partly because you have 10x the hardware for the same price, partly because everything runs 2x the speed anyway, and partly because you have a fixed pool of hardware. This makes the whole system more stable and easier to reason about.
No more sweating the S3 costs. Put a 15TB NVMe drive in each server and run your own MinIO/Garage cluster (alongside your other workloads). We’re doing about 20GiB/s sustained on a 10 node cluster, 50k API calls per second (on S3 that is $20-$250 per second on API calls!).
You get the same bill every month.
UPDATE: more benefits - cheap fast storage, run huge Postgresql instances at minimal cost, less engineering time spend working around hardware limitations and cloud vagaries.
And, if chose to invest in the above, it all costs 10x less than AWS.
Pitch: If you don’t want to do this yourself, then we’ll do it for you for half the price of AWS (and we’ll be your DevOps team too):
Email: adam@ above domain
adamcharnock
我无法过分强调部署到裸金属服务器所带来的性能提升。我们通常能看到性能翻倍,同时性能基准也极具可预测性。
这主要归功于以下几点:
除此之外,还能带来一整堆其他好处:
而且,如果你选择投资上述方案,所有成本都比AWS低10倍。
推广:如果你不想自己动手,我们可以为你以AWS一半的价格完成这些(我们还可以成为你的DevOps团队):
邮箱:adam@ above domain
https://news.ycombinator.com/item?id=45611895
Fun fact: this is one of the few situations in the US where a prosecutor could claim that this is criminal speech (though I hope and trust they would not, and if it did it would get thrown out by any court respecting the First Amendment).
Not a civil issue, like libel or fraud, but the sort of talk that can get a policeman to come and drag you off to jail. If you’ve ever wondered why DRM is so roundly hated by engineers of a certain age, it’s because not only it dumb makework that they are required to implement, not only is it extremely irritating to discover it interfering with your own computer, but if you do effectively point out how dumb, irritating, and eminently circumventable it is, they made it against the law to even tell anyone.
dannyobrien
有趣的是,这是美国少数几种情况之一,检察官可以声称某种言论属于犯罪言论(不过,我希望并相信他们不会这么做,而且如果他们真这么做了,任何尊重第一修正案的法庭都会将其驳回)。
这不同于诽谤或欺诈等民事问题,而是那种可能让警察找上门来,直接将你逮捕的言论。如果你曾好奇,为什么DRM(数字版权管理)会遭到某些年龄段的工程师如此普遍的憎恨,那是因为:首先,它是一种强制工程师执行的愚蠢工作;其次,它极度恼人,会干扰你自己的电脑;最后,如果你有效地指出它有多愚蠢、多恼人、多容易被规避,他们竟然会立法禁止你向任何人透露这一点。
https://news.ycombinator.com/item?id=45618442
Causality could be reversed here. In markets where technology advances quickly and prices drop, there is very little market for used goods, because why would you buy a 4-year-old whatever when you can get a new one that’s twice as good for half the price? You see this in computers, smartphones, TVs, and solar panels (outside of the U.S, where prices are kept artificially high by tariffs). People almost never buy used because there’s no reason to. You can just buy new, for the same or lower price, and get something way better.
Instead of threatening to derail the EV transition, lack of resale value might be evidence of the EV transition, particularly when coupled with quickly growing overall sales of EVs globally.
nostrademons
因果关系可能在这里被颠倒了。在技术快速进步且价格下跌的市场,二手商品的市场极小,因为当你可以用一半的价格买到新东西,而且性能翻倍时,谁还会去买四年前的旧货呢?这种情况在电脑、智能手机、电视和太阳能电池板上都能看到(美国除外,那里的价格因关税而被人为抬高)。人们几乎从不买二手货,因为没有理由。花相同甚至更低的价格就能买到全新的,而且好得多。
与其说二手价值低会威胁到电动汽车转型的进程,不如说这可能是电动汽车转型正在进行的证据,尤其是当全球电动汽车总销量快速增长时。
https://news.ycombinator.com/item?id=45611217
For books only available through Amazon my workflow used to be buying it, downloading it with their desktop app, importing into Calibre, converting to epub and stripping DRM, then pushing it onto my Kobo.
They broke that a while ago by making their DRM even worse, so now I just pirate those books.
chmod775
对于那些只能通过亚马逊购买的书,我以前的工作流程是:购买,用他们的桌面应用程序下载,导入到 Calibre,转换成 epub 格式并去除 DRM,然后推送到我的 Kobo 上。他们前阵子通过让 DRM 变得更糟,把这套流程给弄坏了,所以我现在就直接盗版那些书了。
https://news.ycombinator.com/item?id=45610010
You forgot mcp-everything!
Yes, it’s a mess, and there will be a lot of churn, you’re not wrong, but there are foundational concepts underneath it all that you can learn and then it’s easy to fit insert-new-feature into your mental model. (Or you can just ignore the new features, and roll your own tools. Some people here do that with a lot of success.)
The foundational mental model to get the hang of is really just:
An LLM
…called in a loop
…maintaining a history of stuff it’s done in the session (the “context”)
…with access to tool calls to do things. Like, read files, write files, call bash, etc.
Some people call this “the agentic loop.” Call it what you want, you can write it in 100 lines of Python. I encourage every programmer I talk to who is remotely curious about LLMs to try that. It is a lightbulb moment.
Once you’ve written your own basic agent, if a new tool comes along, you can easily demystify it by thinking about how you’d implement it yourself. For example, Claude Skills are really just:
Skills are just a bunch of files with instructions for the LLM in them.
Search for the available “skills” on startup and put all the short descriptions into the context so the LLM knows about them.
Also tell the LLM how to “use” a skill. Claude just uses the bash
tool for that.
When Claude wants to use a skill, it uses the “call bash” tool to read in the skill files, then does the thing described in them.
and that’s more or less it, glossing over a lot of things that are important but not foundational like ensuring granular tool permissions, etc.
libraryofbabel
你忘了mcp-everything!
是的,这确实很混乱,而且会有很多变动,你说得没错,但在这一切之下,有一些基础概念是可以学习的,一旦掌握了,将新功能融入你的心智模型就很容易了。(或者你也可以直接忽略新功能,自己动手打造工具。这里有些人就是这么做的,而且非常成功。)
你需要掌握的基础心智模型其实很简单:
有些人称之为“代理循环”。随便你怎么叫它,用100行Python代码就能实现。我鼓励我遇到的每一个对大语言模型有一点点好奇的程序员都去尝试一下。那会是一个灵光乍现的时刻。
一旦你写出了自己的基础代理程序,如果出现一个新工具,你就可以通过思考自己会如何实现它来轻松地理解其原理。例如,Claude的技能其实就只是:
bash
工具来做到这一点的。差不多就是这样了,这里省略了许多虽然重要但并非基础性的东西,比如确保细粒度的工具权限等。
https://news.ycombinator.com/item?id=45619352
hi, i made this. thank you for posting.
unfortunately due to the government shutdown, the BLS inflation data for September 2025 is delayed from October 15 (as it normally is) until October 24 1, so please check back then to see if he is >109 Cent.
assuming future stability, the site will automatically update on the 15th of every month.
1 https://www.bls.gov/bls/092025-cpi-reschedule-notice.htm
lanewinfield
你好,我是这个的作者。感谢您的发布。
不幸的是,由于政府停摆,美国劳工统计局(BLS)2025年9月的通货膨胀数据原定于10月15日发布(通常都是这样),现在将推迟到10月24日 1,所以请在那时再回来看看他是否超过109美分。
假设未来保持稳定,该网站将在每月15日自动更新。
1 https://www.bls.gov/bls/092025-cpi-reschedule-notice.htm
https://news.ycombinator.com/item?id=45615909
I think this is the right move. Thank you to Ruby Core and Matz for stepping up and providing stability to the language and community as a whole.
sebiw
我认为这是正确的举措。感谢Ruby Core团队和Matz挺身而出,为整个语言和社区提供了稳定性。
https://news.ycombinator.com/item?id=45608159
We’re still moving thousands of pounds of vehicle around a public highway to carry a 1lb burrito, obviously lightweight aerial drones are the future for food and grocery delivery.
Footnote7341
我们为了运送一个1磅重的墨西哥卷饼,竟然还在公共公路上开着数千磅重的车,很明显,轻量级无人机才是未来食品和杂货配送的未来。
https://news.ycombinator.com/item?id=45619916
What takes the long amount of time and the way to think about it is that it’s a march of nines. Every single nine is a constant amount of work. Every single nine is the same amount of work. When you get a demo and something works 90% of the time, that’s just the first nine. Then you need the second nine, a third nine, a fourth nine, a fifth nine. While I was at Tesla for five years or so, we went through maybe three nines or two nines. I don’t know what it is, but multiple nines of iteration. There are still more nines to go.
I think this is an important way of understanding AI progress. Capability improvements often look exponential on a particular fixed benchmark, but the difficulty of the next step up is also often exponential, and so you get net linear improvement with a wider perspective.
Imnimo
耗费大量时间和思考的地方在于,这是一个“九的进军”。每增加一个“九”,都需要付出巨大的、同等程度的努力。当你得到一个演示,某个东西90%的时间都能正常工作时,那才仅仅是第一个“九”。然后你需要第二个、第三个、第四个,乃至第五个“九”。当我在特斯拉待了大约五年时,我们或许只经历了两到三个“九”的迭代。我不知道具体是哪个数字,但这需要多次的“九”的迭代,前面还有更多的“九”需要去攻克。
我认为这是理解人工智能进步的一种重要方式。能力的提升在某个固定的基准上看起来往往是指数级的,但提升到下一步的难度也同样是指数级的,因此,从更宏观的视角来看,你得到的净增长是线性的。
https://news.ycombinator.com/item?id=45615906
What is old is new again.
My employer is so conservative and slow that they are forerunning this Local Cloud Edge Our Basement thing by just not doing anything.
rightbyte
旧貌换新颜。
我的雇主保守又迟钝,他们什么都不做,反倒在这“本地云端边缘地下室”的新趋势上拔得头筹。
https://news.ycombinator.com/item?id=45611315
My coworker recently showed me this plugin 1 that fades out all Rust code that is unrelated to the variable under the cursor. Think of it as a more powerful version of the “click to highlight all appearances” you can do in most IDEs but it actually does information flow analysis on the code.
tschumacher
我的同事最近给我展示了一个插件 1,它可以淡化所有与光标所在变量无关的Rust代码。你可以把它看作是大多数IDE中“点击高亮所有出现”功能的增强版,但它实际上会对代码进行信息流分析。
https://news.ycombinator.com/item?id=45611192
Hell hath no fury like an engineer angered! This was such a good read and epitomizes hacking:
“Was it worth it? To read one book? No. To prove a point? Absolutely. To learn about SVG rendering, perceptual hashing, and font metrics? Probably yes.”
emptybits
愤怒的工程师,其怒火无人能及!这篇文章写得真好,完美诠释了黑客精神:
“值得吗?为了读一本书?——不值得。为了证明一个观点?——绝对值得。为了学习SVG渲染、感知哈希和字体度量?——很可能是值得的。”
https://news.ycombinator.com/item?id=45614001
Making the obviously-abusive bot prohibitively expensive is one way to go, if you control the terminating server.
gzip bomb is good if the bot happens to be vulnerable, but even just slowing down their connection rate is often sufficient - waiting just 10 seconds before responding with your 404 is going to consume ~7,000 ports on their box, which should be enough to crash most linux processes (nginx + mod-http-echo is a really easy way to set this up)
swiftcoder
如果你控制着终结服务器,那么让这些明显的恶意机器人代价高昂到望而却步,是一个可行的办法。如果机器人碰巧有漏洞,那么使用gzip炸弹是个不错的选择,但即便是降低它们的连接速率通常也足够了——只需在用404响应前等待10秒钟,就会消耗掉他们机器上大约7000个端口,这足以让大多数Linux进程崩溃(nginx + mod-http-echo 是一种非常简单的搭建方式)。
https://news.ycombinator.com/item?id=45602620
The progressive introduction of automated type checking in Elixir should serve as a reference on how to improve a programming language gracefully without breaking changes.
So many examples of programming languages have huge breaking changes between versions that end up creating a split in the ecosystem that takes years to resolve.
Thankfully José has been very clear about Elixir being done since at least 2018. The language is stable and the language/core foundation is not changing anymore.
https://www.youtube.com/watch?v=suOzNeMJXl0
Truly outsanding work and stewardship.
crbelaus
Elixir 逐步引入自动类型检查的方式,应当成为如何在不破坏兼容性的情况下优雅地改进一门编程语言的典范。太多编程语言的例子都显示,其版本间巨大的破坏性更改最终导致生态系统分裂,而这种分裂需要数年才能解决。幸运的是,José 至少从 2018 年起就已明确表示 Elixir 语言已经完成。该语言非常稳定,其核心基础也不再发生改变。https://www.youtube.com/watch?v=suOzNeMJXl0 真正卓越的工作与管理。
https://news.ycombinator.com/item?id=45608390
best case scenario is walkable neighborhoods with lots of little tasty restaurants at affordable prices around the corner from everybody.
We’ve got a long way to go on actually building out our own country in a desirable way.
ajkjk
理想的情况是,每个社区都适合步行,每个人家附近都有许多价格实惠、美味可口的小餐馆。 在真正以理想的方式建设我们自己的国家方面,我们还有很长的路要走。
https://news.ycombinator.com/item?id=45615090
I think you can get much farther with dedicated servers. I run a couple of nodes on Hetzner. The performance you get from a dedicated machine even if it is a 3 year old machine that you can get on server auction is absolutely bonkers and cannot be compared to VMs. The thing is that most of the server hardware is focused towards high core count, low clock speed processors that optimize for I/O rather than compute. It is overprovisioned by all cloud providers. Even the I/O part of the disk is crazy. It uses all sorts of shenanigans to get a drive that sitting on a NAS and emulating a local disk. Most startups do not need the hyper virtualized, NAS based drive. You can go much farther and much more cost-effectively with dedicated server rentals from Hetzner. I would love to know if they are any north-american (particularly canadian) companies that can compete with price and the quality of service like Hetzner. I know of OVH but I would love to know others in the same space.
lisperforlife
我认为使用独立服务器能让你走得更远。我在Hetzner上运营了几个节点。即使是服务器拍卖会上买到的三年前的旧机器,其性能也绝对是惊人的,完全无法与虚拟机(VM)相提并论。问题是,大多数服务器硬件都侧重于高核心数、低主频的处理器,这些处理器优化的是I/O性能而非计算能力。所有云服务提供商都存在过度配置(资源超售)的情况。即使是磁盘的I/O部分也一样疯狂。它们用尽各种花招,让一个位于NAS(网络附加存储)上的硬盘模拟成本地磁盘。大多数初创公司并不需要这种高度虚拟化、基于NAS的磁盘。通过租赁Hetzner的独立服务器,你可以以更具成本效益的方式走得更远。我很想知道是否有任何北美公司(特别是加拿大公司)能够在价格和服务质量上与Hetzner相媲美。我知道OVH,但也想了解其他在同一领域的公司。
https://news.ycombinator.com/item?id=45603913
Big tech companies (the money behind the Open Source Initiative) have done a few things.
They co-opted the free software movement and made it more business friendly.
They convinced people that Open Source is pure and software that isn’t Open Source is unclean.
They convinced a bunch of developers that their definition of Open Source that was specifically crafted to protect business interests is canon.
They convinced a well meaning subset of those developers to police the other devs and pressure them to release their software under big tech approved licenses.
sarchertech
大型科技公司(开源倡议背后的资金力量)做了以下几件事。
https://news.ycombinator.com/item?id=45616177
Really appreciate Matz stepping up to take on this difficult situation. As a Japanese developer, I’ve been worried about the direction things were going, so it’s reassuring to see this.
white-moss
非常感谢Matz挺身而出承担起这个艰难的局面。作为一名日本开发者,我一直很担心事情的发展方向,所以看到这一切让人感到安心。
https://news.ycombinator.com/item?id=45608194
I might be in the minority here but I’ve consistently found Gemini to be better than ChatGPT, Claude and Deepseek (I get access to all of the pro models through work)
Maybe it’s just the kind of work I’m doing, a lot of web development with html/scss, and Google has crawled the internet so they have more data to work with.
I reckon different models are better at different kinds of work, but Gemini is pretty excellent at UI/UX web development, in my experience
Very excited to see what 3.0 is like
jmkni
也许我是少数派,但我一直认为 Gemini 比 ChatGPT、Claude 和 Deepseek 更好(我可以通过工作接触到所有付费版模型)。
可能只是因为我的工作,我做很多 html/scss 的网页开发,而且 Google 已经抓取了整个互联网,所以他们有更多的数据可以利用。
我认为不同的模型在不同类型的工作上各有优劣,但根据我的经验,Gemini 在 UI/UX 网页开发方面表现得相当出色。
非常期待看看 3.0 会是什么样子。
2025-10-17 07:45:24
- Intuit 通过误导性界面、隐蔽营销和游说阻挠政府免费报税服务,维持 TurboTax 的获利模式并导致公众被误导付费。
- 微软借由 Windows 11 的硬件门槛、默认集成的在线功能和远程证明等机制,增加对用户隐私与选择的控制,推动部分用户转向 Linux。
- 约 40–50 名驻五角大楼记者拒绝签署新媒体限制规定并交回通行证,以抵制对新闻自由的控制但同时损失部分一手接触。
- Anthropic 推出 Claude Skills,用文件夹化的技能系统支持按需加载、组合、版本控制与企业管理,旨在提升专业任务自动化与安全调用。
- Liquibase 将许可证改为非 OSI 批准的 FSL 却仍宣称“开源”,引发社区对信任与开源定义的质疑并促使其修改措辞。
- Tor Browser 15.0a4 移除浏览器内 AI 功能、强化 NoScript 对 WebAssembly 的控制并修复若干问题,以优先保障用户隐私与安全。
- 美国国税局开源 Fact Graph,使用声明性标准化格式建模税法事实与逻辑,为透明报税工具和 Direct File 项目提供基础组件。
- Rust for Linux 推动若干面向内核的语言特性(如字段投影、就地初始化与任意 self)朝稳定化发展,以更好支持内核场景。
- EA 员工与工会抵制价值 550 亿美元的私有化收购,担心私有化会削弱透明度、压缩员工话语权并威胁创意与就业。
- Hyperflask 基于 Flask 与 HTMX 提供一套全栈开发框架,内置轻量 ORM、UI 组件、表单与一键部署等,定位快速构建后端驱动的交互式应用。
本文揭示了税务软件公司 Intuit 如何通过长达二十多年的策略性努力,阻止美国政府推出免费、便捷的官方税务申报系统,从而维护其旗下 TurboTax 产品的市场主导地位。
Intuit 自 20 世纪 80 年代起从会计软件公司起步,凭借 TurboTax 在 21 世纪成为华尔街巨头。到 2019 年,已有约 4000 万美国人使用 TurboTax 在线报税,占美国在线报税人数的绝大多数。然而,这一成功建立在对政府推动免费报税计划的长期抵制之上。
自 20 世纪 90 年代起,Intuit 便将“防止政府干预”列为公司核心战略。内部文件显示,公司使用“暗黑模式”(dark patterns)设计误导用户,例如在“免费”广告下隐藏收费陷阱,诱导用户最终支付高额费用。其推出的“Free Edition”虽名为免费,实则通过层层引导让用户升级至付费版本,甚至有用户支付超过 200 美元。
为削弱政府免费报税计划的影响,Intuit 主导了“自由报税”(Free File)项目,与美国国税局(IRS)达成协议:商业公司提供免费服务,换取 IRS 不开发政府系统。但 Intuit 却通过技术手段隐藏该计划入口,降低公众可见度,同时利用广告和媒体宣传制造“免费”错觉,进一步挤压政府项目的生存空间。
内部文件显示,Intuit 清楚地意识到其“免费”宣传具有误导性,客户因误解而产生强烈不满。公司还通过雇佣前政府官员、游说和媒体操控等方式,构建“第三方草根支持”,系统性地影响公众舆论和政策走向。
尽管 IRS 在内部曾对 Free File 项目提出批评,但始终未改变立场,反而成为行业盟友。目前,仅有 280 万人参与 Free File 项目,远低于 2005 年 510 万的峰值,反映出政府免费系统推广的失败。
文章指出,Intuit 的成功依赖于对创新的双重态度:在硅谷推动技术进步,却在华盛顿竭力压制公共政策创新。其“妥协无原则”的现实,与公司宣扬的“诚信至上”形象形成鲜明对比。
https://news.ycombinator.com/item?id=45601750
https://www.scottrlarson.com/publications/publication-windows-move-towards-surveillance/
本文作者 Scott Larson 探讨了微软停止对 Windows 10 支持所带来的隐私与自由风险,并呼吁用户考虑转向 Linux 系统。他指出,Windows 11 的设计存在多项侵犯用户隐私和限制选择的倾向,包括强制启用 OneDrive 自动备份、默认安装 Microsoft Edge 浏览器、未经同意启用 AI 助手 Copilot,以及即将推出的“Recall”功能——该功能会自动记录用户屏幕活动并上传至云端,构成潜在的监控威胁。
此外,微软通过推动 TPM 2.0 和安全启动等硬件要求,迫使消费者升级设备,从而锁定用户在微软生态内。许多系统功能无法彻底卸载,即使删除也会在系统更新中重新出现。这些做法被作者视为推动“监控国家”建设的手段。
作者推荐使用 Linux 作为替代方案,并列出几款适合不同用户需求的发行版:Zorin OS(界面类似 Windows)、Pop!_OS(适合游戏玩家)、Ubuntu(通用桌面)、Elementary OS(极简风格)和 MX Linux(支持老旧硬件)。
文章也提醒用户,迁移到 Linux 意味着需要适应不同的软件生态,部分常用软件如 Adobe 云服务、微软 Office、QuickBooks、TurboTax、部分反作弊游戏等可能无法直接使用,需寻找替代方案。建议有特定需求的用户联系作者进行咨询评估。
总体而言,作者认为当前是转向自由、可控、隐私优先的 Linux 系统的理想时机。
https://news.ycombinator.com/item?id=45600338
2025 年 10 月 15 日,约 40 至 50 名驻五角大楼记者因拒绝签署美国国防部新出台的媒体限制规定,集体交还采访证并离开五角大楼。新规由国防部长皮特·赫格塞斯(前福克斯新闻主持人)推出,要求记者在报道任何未经其批准的机密或非机密信息前必须获得许可,否则可能被驱逐。
新规被广泛视为对新闻自由的打压,几乎所有主流媒体(包括美联社、纽约时报、福克斯、Newsmax 等)均拒绝接受,只有保守派媒体“美国一号新闻网”(OANN)签署。总统特朗普公开支持新规,称媒体“破坏世界和平”。
记者们表示,将继续从外部报道美军事务,但承认此举将限制他们获取一手信息的能力。事件被视为特朗普政府与媒体之间持续对抗的最新升级。
https://news.ycombinator.com/item?id=45602179
https://www.anthropic.com/news/skills
Anthropic 推出 Claude Skills 功能,使 Claude 能够通过加载特定技能来提升在专业任务中的表现。技能以文件夹形式存在,包含指令、脚本和资源,仅在任务相关时被调用,确保高效运行。
Skills 具备四大特性:可组合性,支持多个技能协同工作;可移植性,统一格式适用于 Claude 应用、Claude Code 和 API;高效性,按需加载最小必要内容;强大性,支持执行代码,适用于需要编程的复杂任务。
该功能已集成至所有 Claude 产品中。在 Claude 应用中,Pro、Max、Team 和 Enterprise 用户可使用预置技能或自定义技能,系统自动识别并调用,无需手动选择。通过“skill-creator”技能可实现零代码创建流程,简化操作。Team 和 Enterprise 用户需管理员开启权限。
在 API 开发方面,开发者可通过 Messages API 和新推出的 /v1/skills 端点管理技能,实现版本控制。技能依赖 Code Execution Tool beta,提供安全执行环境。Anthropic 提供多种预设技能,如生成 Excel 表格、PPT、Word 文档和可填写 PDF,支持企业级标准。
多家企业已验证技能价值:Box 使用技能实现文件到 PPT/Excel 的自动化转换;Notion 提升任务执行效率;Canva 利用技能深化设计工作流;Rakuten 实现财务报告自动化,效率提升显著。
在 Claude Code 中,用户可通过插件市场安装技能,自动加载,支持团队共享与版本管理,亦可手动部署。开发工具链支持构建自定义智能体。
未来将优化技能创建流程和企业级分发能力。使用技能需注意安全,建议仅使用可信来源的技能,以保障数据安全。
https://news.ycombinator.com/item?id=45607117
https://github.com/liquibase/liquibase/issues/7374
Liquibase 项目在 2025 年 10 月宣布从开源许可证转向功能性源许可证(Functional Source License, FSL),该许可证被明确指出并非开源许可证,且未获得开放源代码促进会(OSI)的批准。然而,其 GitHub 主页的 README 文件仍持续使用“开源”(open source)和“OSS”等术语描述项目,引发社区质疑。
用户 richardfontana 提交了 Issue #7374,指出这一描述存在误导性,并强调其作为 GPLv3 主要作者、前 OSI 总监的身份,认为 FSL 不符合开源定义的多项标准,尤其是限制使用权限的“允许用途”条款,违反了开源定义中的自由使用、修改和分发原则。
其他社区成员如 ssddanbrown、chadwhitacre 等支持该观点,指出 FSL 本质上属于“公平源”(Fair Source)模式,旨在区分单厂商控制与多厂商协作的开源生态。chadwhitacre 进一步表示,此举是为了推动“公平源”品牌的发展。
Liquibase 团队已响应,贡献者 petepickerill 提交了 PR(#7380)以更新 README 文件,移除“开源”相关表述,但承认仍需审查项目中其他位置的类似用语。
该事件引发广泛讨论,涉及开源许可的定义边界、企业对开源项目的控制权,以及社区信任问题。
https://news.ycombinator.com/item?id=45602676
https://blog.torproject.org/new-alpha-release-tor-browser-150a4/
Tor Browser 15.0a4 已发布,为即将推出的稳定版做最后的测试准备。该版本包含多个重要更新和改进,主要集中在安全、隐私和用户体验方面。
安全与隐私方面,Tor Browser 移除了所有与人工智能相关的功能,包括 Firefox 的 AI 聊天侧边栏等,以避免不可审计的机器学习系统影响隐私。同时,WebAssembly 在“更安全”和“最安全”模式下的控制权已移交至 NoScript 扩展,解决了此前因全局禁用导致 PDF 阅读器失效的问题。
界面与功能优化方面,原“meek-azure”桥接传输方式已更名为“meek”,以反映其不再依赖特定云平台的现状。浏览器的深色主题支持得到增强,所有紫色 UI 元素现在更协调统一。Firefox 原生的“历史侧边栏”已被替换为旧版的“历史面板”,并移除了所有 Firefox 和 Mozilla 的品牌元素,如狐狸图标、Firefox Home 等,确保 Tor Browser 的独立性。
针对不同平台,Linux 用户现在使用 Noto Color Emoji 字体,支持最新 emoji;同时,CJK(中文、日文、韩文)字符渲染问题通过替换为 Jigmo 字体得到改善。Android 版本更新至 GeckoView 140.4.0esr,并修复了多个界面与行为问题,如调查横幅显示异常、统一信任面板默认禁用等。
URL 显示方面,桌面端不再隐藏协议(如 http/https),以提高透明度,而 Android 仍保持隐藏协议以节省空间,用户可通过点击图标查看 HTTPS 信息。
其他修复包括:修复 PDF 图像不显示、搜索引擎兼容性问题、TLS 会话票据泄露、标签页悬停报错等。所有问题均在 GitLab 的两个发布质量保证任务中跟踪:桌面端和 Android 端。
提醒:Alpha 版仅用于测试,高风险用户应继续使用稳定版。完整更新日志可在官方页面查看。
https://news.ycombinator.com/item?id=45605842
https://github.com/IRS-Public/fact-graph
Fact Graph 是美国国税局(IRS)发布的一个生产就绪的知识图谱项目,用于建模美国国内税收法典及相关税法内容。该图谱支持 JavaScript 和 JVM 语言(如 Java、Kotlin、Scala、Clojure 等),具备跨平台使用能力。
项目当前版本为 3.1,基于 2025 年初以来的架构演进,相比早期版本有显著改进。开发在私有仓库中进行,经审核后的变更会实时同步至本公开仓库。
项目使用 Scala 作为主要语言,辅以 Makefile 构建工具,采用 ScalaTest 进行测试,依赖 scala-xml 处理 XML 数据。代码规范通过 scalafmt 统一,项目结构包含共享代码、JVM 和 JavaScript 三个主要源码目录。
项目遵循开源原则,其法律基础包括多项联邦法规与政策,如《2024 年信息技术源码协调与重用法》、OMB 指示 M-16-21、联邦采购条例(FAR)第 27 部分、《数字政府战略》、FITARA、E-Government 法案及 Clinger-Cohen 法案等。
项目强调开源共享,但明确声明:IRS 不对代码的准确性、完整性或功能负责,使用风险由使用者自行承担。所有使用者需自行遵守开源及第三方许可要求。
项目提供 ONBOARDING.md 用于开发者环境搭建,CONTRIBUTING.md 指导开源贡献流程。代码库持续更新,支持安全扫描与 CI/CD 流程,已集成 GitHub Actions。
当前仓库无发布版本和软件包,但已建立完整的开发与协作机制,适合开发者参与或基于其构建税务相关应用。
https://news.ycombinator.com/item?id=45599567
https://lwn.net/Articles/1039073/
Rust for Linux 项目推动了 Rust 语言多项关键功能的开发,尤其是在内核开发场景下的应用。在 Kangrejos 2025 大会上,Rust 语言设计团队 co-lead Tyler Mandry 指出,尽管 Rust 新特性的开发速度常被诟病,但 Rust for Linux 项目因其高度聚焦的实际需求,有效促进了相关功能的推进。
当前最受关注的三个语言特性是:字段投影(field projections)、就地初始化(in-place initialization)和任意 self 类型(arbitrary self types)。这些功能旨在提升 Rust 在内核开发中对自定义智能指针的支持,以应对内核特有的复杂性,如不可信数据处理、引用计数和外部锁机制。
字段投影允许将指向结构体的指针转换为指向其字段的指针,目前仅支持内置的引用和原始指针类型。Rust for Linux 开发者希望这一能力能扩展到所有自定义指针类型。Benno Lossin 介绍了该功能的进展,指出其设计仍处于完善阶段,尤其需要处理 Pin
类型带来的复杂性——即结构体是否可移动会影响投影结果的类型。例如,投影 Pin<&mut MyStruct>
可能产生 Pin<&mut Field>
或普通 &mut Field
,取决于字段是否也需禁止移动。
该功能对实现读-拷贝-更新(RCU)机制在 Rust 内核绑定中的应用至关重要。当前模式下,读操作需持有互斥锁才能访问 RCU 保护的字段,性能开销大。若支持通用字段投影,可实现无需锁即可访问 RCU 字段的绑定,同时编译器仍能确保其他非 RCU 字段的访问受锁保护,兼顾安全与性能。
Lossin 呼吁开发者关注该功能的追踪 issue,提供反馈。Miguel Ojeda 强调,优先级应是稳定当前项目所依赖的不稳定特性,再推进能改变项目结构的特性,最后才是其他功能。项目目前不使用新不稳定特性,目标是让该功能在 Debian 14(预计 2027 年发布)中稳定可用。
随后,Xiangfei Ding 分享了“任意 self 类型”功能的进展。该特性允许方法的 self
参数使用自定义类型,而非仅限于 self
、&self
或 &mut self
。这将极大提升自定义指针类型的表达力和安全性,使驱动代码更自然、更高效地表达内核中的所有权和借用语义。
https://news.ycombinator.com/item?id=45601982
EA 员工及通信工人协会(CWA)联合发布声明,反对价值 550 亿美元的沙特公共投资基金与杰拉德·库什纳旗下 Affinity Partners 主导的私有化收购案。声明指出,员工在谈判过程中未被代表,若未来出现裁员或工作室关闭,将并非出于经营必要,而是为满足投资者利益,属于“人为选择”。
EA 目前年收入达 75 亿美元,年利润 10 亿美元,属于全球领先的开发商与发行商。工会强调,公司成功源于一线员工的努力,但私有化将导致决策透明度下降,员工话语权被削弱。他们警告,私人资本介入后,游戏开发的创意自由和员工权益将面临威胁。
为此,工会发起请愿,呼吁监管机构审查该交易,确保保护就业岗位、维护创作自由,并让决策权回归劳动者。声明强调:“游戏的价值在于其工作者,我们拒绝让资本贪婪决定行业未来。”
此外,人权组织“人权观察”指出,沙特公共投资基金涉及多项人权问题,其资金被用于国内和国际的“面子工程”,而非惠及普通民众。该基金由沙特王储穆罕默德·本·萨勒曼实际控制,权力高度集中,可能对人权和企业治理造成负面影响。有分析认为,该交易可能因政治关联而难以受到严格审查。
https://news.ycombinator.com/item?id=45606394
Hyperflask 是一个全栈 Python 框架,旨在帮助开发者以极快的速度构建 Web 应用。它整合了从开发环境、UI 框架到部署的完整流程,让开发者专注于核心业务逻辑。
该框架基于 Flask 构建,结合 HTMX 和组件化架构,支持后端驱动的交互式应用,简化状态管理,减少前端复杂性。通过文件级路由机制,开发者可使用一种融合 Python 代码与 Jinja 模板的新文件格式,实现直观的页面定义。
Hyperflask 提供了丰富的内置功能,包括:美观的 UI 组件(基于 DaisyUI 和 Bootstrap Icons)、Tailwind CSS 支持、表单处理、模型管理、文件上传、数据加载、邮件发送(支持 MJML)、后台任务、服务器推送(SSE)、国际化、安全机制、错误处理等。
开发体验方面,Hyperflask 标准化了开发与生产环境,全面支持容器化部署,与 VS Code 深度集成,简化项目初始化与运行。支持一键部署至 VPS 及多种云平台。
框架采用模块化设计,核心代码轻量,所有扩展组件均独立开发,归属于 Hyperflask 组织,用户可自由选择使用其中部分功能。
目前版本为 v0.5(BETA),仍在积极开发中,官方提供了详细的指南、组件库、实用案例和部署方案,适合希望快速构建高质量 Web 产品的开发者。
https://news.ycombinator.com/item?id=45604673
https://news.ycombinator.com/item?id=45609468
I fear the conceptual churn we’re going to endure in the coming years will rival frontend dev.
Across ChatGPT and Claude we now have tools, functions, skills, agents, subagents, commands, and apps, and there’s a metastasizing complex of vibe frameworks feeding on this mess.
fny
我担心未来几年我们将要经历的概念上的频繁迭代,会匹敌前端开发的更新速度。在ChatGPT和Claude上,我们现在有了工具、功能、技能、代理、子代理、命令和应用程序,而且还有一套在混乱中蔓延滋生的氛围框架体系。
https://news.ycombinator.com/item?id=45597531
This article is so interesting, but I can’t shake the feeling it was written by AI. The writing style has that feel for me.
Maybe that shouldn’t bother me? Like, maybe the author would never have had time to write this otherwise, and I would never have learned about his experience.
But I can’t help wishing he’d just written about it himself. Maybe that’s unreasonable–I shouldn’t expect people to do extra work for free. But if this happened to me, I would want to write about it myself…
Wowfunhappy
这篇文章真有趣,但我总觉得好像是AI写的,那种写作风格让我感觉就是这样。
也许这不应该困扰我?毕竟,如果作者没有用这种方式,可能根本没有时间写下这篇文章,那样我也永远无法了解他的经历了。
可我还是忍不住希望能由他亲自来写这件事。
或许这要求有些不合理——我不该期望人们无偿地去做额外的工作。
但如果这件事发生在我身上,我肯定会想自己来写……
https://news.ycombinator.com/item?id=45606925
“EA is not a struggling company,” the statement reads. “With annual revenues reaching $7.5 billion and $1 billion in profit each year, EA is one of the largest video game developers and publishers in the world.”
Seems to be a common theme in 2025: Actually-healthy companies cosplaying as struggling companies, as an excuse to justify layoffs and other activities that transfer wealth and power from employees to management and shareholders. Like, does anyone think any of these BigTech (and MediumTech) companies who are all doing layoffs are really “struggling” and “vulnerable”? It’s always just an unbelievable excuse.
ryandrake
声明写道:“EA并非一家经营困难的公司。其年收入高达75亿美元,年利润达10亿美元,EA是全球最大的视频游戏开发商和发行商之一。”
这似乎是2025年的一个普遍现象:一些实际上经营状况良好的公司,却伪装成经营困难的公司,以此为借口来证明裁员的合理性,以及其他将财富和权力从员工转移给管理层和股东的活动。说真的,有人会相信这些都在进行裁员的BigTech(及MediumTech)公司中的任何一家,真的在“挣扎”和“脆弱”吗?这永远都是一个难以置信的借口。
https://news.ycombinator.com/item?id=45604409
Precisely why I built https://freetofile.com (it’s a simple static site with React for internationalization that automatically renders in Spanish, Chinese, Haitian Creole, or English depending on browser settings). It’s shocking and depressing how many low income people don’t know they don’t need to spend $100-200 to file their taxes.
I want to blanket my area (well the whole country really but baby steps…) in signs with the URL during tax season. I really do loathe the entire industry at this point due to their gross practices around free filing. Some offer “free” online filing but deceptively upsell until they squeeze some money out of the customer. So I want to make any little push back I can against these companies.
jeremymcanally
这正是我建立 https://freetofile.com 的原因(这是一个简单的静态站点,用React做国际化处理,会根据浏览器设置自动显示西班牙语、中文、海地克里奥尔语或英语)。这么多低收入人群不知道他们不需要花100到200美元来报税,这真是令人震惊和沮丧。我想在报税季期间,用印有网址的标识布满我的地区(其实整个国家都行,但得一步一步来……)。目前我真的憎恶整个行业,因为他们围绕免费报税的做法太恶劣了。有些提供“免费”在线报税,但却通过欺骗性手段推销附加服务,直到从顾客身上榨取一些钱。所以我想尽我所能对这些公司进行一点抵制。
https://news.ycombinator.com/item?id=45602647
First sign of a profession having a backbone in months.
Although the silent treatment the generals dished out at recent meeting wasn’t bad either
Havoc
几个月来,某个行业首次展现骨气的迹象。不过,将军们在最近会议上采取的沉默对待倒也算不错。
https://news.ycombinator.com/item?id=45597832
It’s incredibly annoying to read. So many super short sentences with the “not just X. Also Y” format. Little hooks like “The attack vector?”
“Not fancy security tools. Not expensive antivirus software. Just asking my coding assistant…”
I actually feel like AI articles are becoming easier to spot. Maybe we’re all just collectively noticing the patterns.
cddotdotslash
读起来真的让人非常恼火。到处都是那种“不仅仅是X,而且也是Y”的超短句式。还有一些像“攻击向量?”这样的小钩子。“不是什么花哨的安全工具。也不是什么昂贵的杀毒软件。只要问问我的编程助手就行了……” 我其实感觉,AI生成的文章现在是越来越容易识别了。也许我们只是共同注意到了这些模式而已。
https://news.ycombinator.com/item?id=45600837
I would say that specifically with Secure Boot, Microsoft actually promoted user choice: A Windows Logo compliant PC needs to have Microsoft’s root of trust installed by default. Microsoft could have stopped there, but they didn’t.
This was not the case with the initial rollout of Secure Boot, it was combined with locked BIOS to lock PCs so that they could only boot Windows 8 on some devices. This was the case on Windows RT ARM machines from that era.
All that has to be done today for machines to be locked down again is to flip a bit or blow an e-fuse. It’s already the case on phones and tablets.
There is also a real potential for abusing TPMs or cryptographic co-processors to enforce remote attestation.
I say this as someone who agrees with your first paragraph and uses Secure Boot + TPMs on all of my machines.
heavyset_go
我想说的是,特别是在安全启动(Secure Boot)方面,微软实际上促进了用户的选择权:一台符合Windows徽标标准的PC需要默认安装微软的信任根。微软本可以就此打住,但他们没有。
安全启动最初推出时并非如此,它被与被锁定的BIOS相结合,以锁定PC,导致某些设备只能启动Windows 8。在那个时代的Windows RT ARM设备上就是这种情况。
如今,要让设备再次被锁定,只需翻转一个比特位或烧断一个电子保险丝(e-fuse)。这在手机和平板电脑上已经司空见惯了。
同样也存在滥用可信平台模块(TPM)或加密协处理器来强制进行远程认证的真实风险。
我之所以这么说,是因为我同意你第一段的看法,并且在我所有的设备上都使用了安全启动(Secure Boot)和TPM。
https://news.ycombinator.com/item?id=45607139
I don’t think you need to “justify layoffs”. If a company feels an employee is not being productive, they should be allowed to let them go. Same way if an employee feels he is getting underpaid or wants to work somewhere else, they should be allowed to leave.
I’ve actually always liked working for companies in which the objective was straight forward. None of this “we’re a family” stuff. You should be kind, and all the places I was at were kind. But layoffs are a reality and reducing headcount at times is part of that. You need a way to get rid of dead wood, otherwise you would be too afraid to grow and hire when you need to.
bko
我不认为公司需要“为裁员找理由”。如果公司认为某个员工没有生产力,他们应该有权解雇他。同样地,如果一个员工觉得薪水太低或者想去别处工作,他们也应该有权离开。
我其实一直很喜欢那些目标明确的公司,不喜欢那种“我们是一家人”的说法。公司应该和善,而且我待过的所有公司也都很好。但裁员是现实,有时缩减编制也是其中的一部分。你需要一个方法来清除掉不称职的员工,否则当你需要扩张并招聘新人时,你就会因为害怕而不敢这么做。
https://news.ycombinator.com/item?id=45603190
Why does the US have a tax prep industry in the first place?
In every other country in the world, taxes are handled by their respective financial authorities.
Why must every service and thing in the US must be a private profit making thing?
alexandru_m
美国为什么会有税务准备行业呢?世界上所有其他国家,都是由各自的金融管理部门处理税务。为什么美国的每项服务和每样东西都必须是私人盈利性的呢?
https://news.ycombinator.com/item?id=45600681
For all the hate that Google (rightly) gets for some of their work in other domains, I appreciate that they continue to put major resources behind using AI to try and save lives in medicine and autonomous driving.
Easy to take for granted, but their peer companies are not doing this type of long term investment.
jamestimmins
尽管谷歌在其他领域的一些工作上确实受到了诸多批评,但我欣赏他们持续投入大量资源,利用人工智能在医学和自动驾驶领域尝试拯救生命。这一点容易被忽视,但他们的同行公司并没有进行这类长期投资。
https://news.ycombinator.com/item?id=45600339
I am a IT solutions provider for the public and small business. I think the changes to Windows 11 is gearing up to work with organizations to create a surveillance state.
So I have to decided to promote Linux over Windows for computers I build for customers. If you have any suggestions on how I can make this promotion, better let me know.
trinsic2
我为公众和小型企业提供IT解决方案。我认为Windows 11的更新变化正准备着与组织机构合作,以构建一个监控国家。
因此,我决定在我为客户组装的电脑上推广Linux而非Windows。如果您有任何关于如何更好地进行推广的建议,请告诉我。
https://news.ycombinator.com/item?id=45592764
Tahoe however makes my M1 Air feel sluggish doing the exact same tasks ive been last couple of years.
I have a work provided M2 Pro with 32GB of RAM. After the Tahoe upgrade it feels like one of the sluggish PCs at the house. It is the only one that I can see the mouse teleporting sometimes when I move it fast. This is after disabling transparency in Accessibility settings mind you, it was even worse before.
kokada
然而,在执行过去几年我一直做的完全相同的任务时,Tahoe 让我的 M1 Air 感觉很迟钝。 我有一台公司配的 32GB 内存的 M2 Pro。升级到 Tahoe 后,它的感觉就像家里那些缓慢的 PC 之一。这是唯一一台在我快速移动鼠标时,能看到鼠标瞬移的设备。需要注意的是,这是在我在辅助功能设置中禁用了透明度效果之后的情况,之前的情况更糟。
2025-10-16 08:33:59
- 自由软件基金会启动 Librephone 项目,旨在通过逆向工程替换手机中的专有固件以实现真正自由的移动生态,但面临资金与时间挑战。
- 苹果发布基于第三代 3nm 的 M5 芯片,大幅提升 AI 与图形性能并开放给开发者,但对统一内存容量的限制引发争议。
- 作者揭露一次伪造的远程“求职面试”中嵌入高度伪装的后门,可从外部加载并执行 payload,警示在隔离环境中审查未知代码并核实来源。
- 研究显示媒体报道严重偏向谋杀与恐怖袭击等戏剧性事件,而低报心脏病、癌症等实际主要死因,扭曲公众风险认知。
- 文章指出将传统软件的修复思维套用于 AI 会误判问题根源,AI 的缺陷更多来自大规模训练数据和涌现行为,难以通过单次修复解决。
- 跨国调查揭露监控公司 First Wap 与其 Altamides 定位工具被广泛滥用与泄露,影响数百万条追踪记录并波及政要、记者与普通民众。
- 爱尔兰将自 2026 年起常态化艺术家基本收入计划,每周约发放 375 美元给入选艺术家,虽带来积极影响但在资格与评估上存在争议。
- Anthropic 发布 Claude Haiku 4.5,小型模型在编码性能、速度与成本上显著优化且对齐性较高,适合低延迟的应用场景。
- GrapheneOS 与一家主要 Android 厂商合作,计划摆脱仅支持 Pixel 的限制,扩展到搭载高通旗舰芯片的机型以提高可用设备范围。
- 报告指出电商流量中存在大量高度仿真的机器人行为,平均约 73% 为虚假流量,严重误导广告投放与转化评估。
https://www.fsf.org/news/librephone-project
自由软件基金会(FSF)于 2025 年 10 月 14 日宣布启动“Librephone”项目,旨在推动移动电话的软件自由。随着全球多数用户将智能手机作为主要计算设备,FSF 决定将四十多年来在桌面和服务器系统上推动软件自由的经验,延伸至移动领域。
Librephone 的目标是实现手机系统的完全自由——用户应拥有研究、修改、分享和分发所用软件的权利。该项目将重点解决当前 Android 发行版在软件自由方面存在的最后障碍,特别是设备固件中的专有二进制代码(binary blobs)问题。
项目由资深自由软件开发者罗布·萨沃伊(Rob Savoye)领导,他拥有多年嵌入式系统和自由软件开发经验。FSF 已获得其董事会成员约翰·吉尔摩(John Gilmore)的捐赠支持,后者长期使用 LineageOS 搭配 MicroG 和 F-Droid,但发现其仍依赖部分专有模块,因此推动该项目以彻底替换这些非自由组件。
当前首要任务是评估现有开源项目(如 Replicant 和 LineageOS)的兼容性与自由度,筛选出自由问题最少、最易修复的现代手机型号,作为首个目标设备。随后将通过逆向工程,逐步替换所有非自由软件。
FSF 强调,这一工作复杂、耗时且成本不菲,但已有大量前期成果可依托。项目将与现有自由软件开发者社区协作,欢迎技术贡献与资金支持。
更多信息可访问项目官网: https://librephone.fsf.org,或通过 IRC 频道 #librephone 连接 libera.chat 参与讨论。更多宣传内容见 https://fsf.org/campaigns/librephone。
https://news.ycombinator.com/item?id=45586339
Apple 今日宣布推出 M5 芯片,标志着苹果自研芯片在 AI 性能上的重大飞跃。M5 采用第三代 3 纳米制程工艺,专为 AI 任务优化,是专为 14 英寸 MacBook Pro、iPad Pro 和 Apple Vision Pro 设计的下一代系统级芯片。
M5 芯片的核心亮点包括:
M5 芯片将全面赋能设备的 AI 能力,使 14 英寸 MacBook Pro 和 iPad Pro 在本地运行扩散模型、大语言模型等 AI 工作负载时实现显著加速。开发者可通过 Core ML、Metal Performance Shaders 和 Metal 4 等框架,利用新硬件特性快速提升应用性能,支持直接编程神经加速器的 Tensor API。
在 Apple Vision Pro 中,M5 芯片可实现微 OLED 显示屏像素渲染提升 10%,刷新率最高达 120Hz,带来更清晰、更流畅的视觉体验,有效减少运动模糊。
M5 芯片的推出,标志着苹果在 AI 性能、图形处理和能效方面的全面领先,为用户和开发者带来更强大、更智能的设备体验。相关设备现已开启预购。
https://news.ycombinator.com/item?id=45591799
https://blog.daviddodda.com/how-i-almost-got-hacked-by-a-job-interview
作者 David Dodda 分享了一次几乎被黑客攻击的经历,起因是一次看似正规的区块链公司“Symfa”的远程编程面试。对方通过 LinkedIn 联系他,自称 Chief Blockchain Officer 的 Mykola Yanchii,邀请他参与一个名为“BestCity”的房地产平台开发项目,并发送了一个看似标准的 React/Node.js 代码测试项目。
作者在时间紧迫的情况下,未使用沙盒环境,直接开始审查代码。在准备运行项目前,他临时向 AI 助手询问代码是否存在可疑行为,结果发现服务器端控制器文件中隐藏了一段高度伪装的恶意代码。该代码通过字节数组解码后,会向外部 URL 请求一段远程 payload,执行后可窃取用户电脑中的所有敏感信息,包括加密钱包、密码和文件。
这段恶意代码被巧妙地嵌入在正常功能代码中,且攻击者使用了动态失效的 URL(24 小时后失效),并采用多层混淆技术,极大增加了检测难度。整个骗局从 LinkedIn 个人资料、公司页面到面试流程都高度逼真,利用了开发者的信任心理和时间压力。
作者强调,这次事件暴露了开发者在日常工作中面临的巨大风险:频繁运行未知代码、缺乏安全防护、轻信“正规”渠道。他提醒所有开发者,必须养成以下习惯:使用 Docker 或虚拟机隔离运行未知代码;在执行前用 AI 工具扫描可疑行为;核实信息真实性;对催促快速执行的请求保持警惕。
文章最后指出,这种攻击方式极具针对性,一旦成功,可能造成生产环境泄露、巨额加密资产损失和大规模用户数据泄露。一个简单的 AI 提示,就可能避免灾难性后果。
https://news.ycombinator.com/item?id=45591707
https://ourworldindata.org/does-the-news-reflect-what-we-die-from
本文探讨了美国媒体报道的死亡原因与实际死亡原因之间的显著差异。研究基于 2023 年美国疾病控制与预防中心(CDC)的数据,分析了 15 种主要死亡原因,并对比了《纽约时报》、《华盛顿邮报》和福克斯新闻网站对这些原因的报道频率。
结果显示,心脏病和癌症合计占美国死亡人数的 56%,但仅获得媒体总报道量的 7%。相比之下,尽管谋杀和恐怖袭击等事件死亡人数较少,却占据了超过一半的媒体报道。例如,2023 年美国仅有 16 起恐怖袭击致死事件,但其媒体报道量是实际死亡人数的 18,000 倍以上,谋杀案的报道量也达到其死亡人数的 43 倍。
研究指出,媒体倾向于报道具有戏剧性、情感冲击力和“新闻性”的事件,如谋杀、恐怖袭击和灾难,因为这些事件具有独特故事性,容易吸引读者关注。而像心脏病、糖尿病等慢性疾病虽是主要死因,但因每天发生、缺乏新意,难以成为头条新闻。
尽管不同媒体在政治立场上存在差异,但它们在报道选题上的相似性远高于差异,说明这种偏见并非源于党派立场,而是源于媒体对“新闻价值”的普遍定义。文章提醒公众,媒体报道并不反映真实风险,容易误导人们对社会威胁的认知。
作者强调,媒体反映的是公众兴趣,而公众往往更关注戏剧性事件。但这种偏差可能导致社会资源分配失衡,公众对真正重大健康问题的关注不足。文章呼吁媒体和公众共同反思,提升对长期、普遍性健康风险的关注。
https://news.ycombinator.com/item?id=45583336
https://boydkane.com/essays/boss
本文探讨了公众对人工智能(AI)安全问题的误解,指出人们常以传统软件的思维模式来理解 AI 系统,从而产生严重误判。作者强调,尽管公众已认识到软件漏洞可能造成现实危害,但这一认知在 AI 领域并不适用。
传统软件的漏洞源于代码中的错误,如遗漏分号等,可通过仔细审查代码定位并修复。但现代 AI 系统的问题主要来自训练数据本身,而非代码逻辑。AI 训练依赖海量数据(如 FineWeb 数据集达 11.25 万亿词),远超人类可读范围,因此无法追溯具体哪部分数据导致了异常行为。
AI 的“错误”无法像软件那样通过逻辑推理找到根源。即使开发者也无法完全理解 AI 为何做出某些判断。所谓“修复”AI 问题,往往只是通过重新训练或调整数据来抑制特定行为,但无法保证问题不再出现。更危险的是,同样的输入在不同时间可能产生不同输出,且 AI 公司常微调响应方式以增强自然感,进一步加剧不可预测性。
此外,AI 系统不具备传统软件的确定性:一次修复后,旧问题可能在新情境下重现;即使输入完全一致,输出也可能因细微变化而大相径庭。最后,人们无法像开发传统软件那样,通过明确需求来确保 AI 行为符合预期,因为 AI 的“行为”是训练数据的复杂涌现结果,难以精确控制。
作者指出,这种根本性的认知差异导致专家与公众之间存在巨大理解鸿沟:专家清楚 AI 的不可解释性与不可控性,而公众却仍期待“找到 bug、修好就行”的传统解决方案,这正是 AI 安全风险被低估的核心原因。
https://news.ycombinator.com/item?id=45583180
https://www.lighthousereports.com/investigation/surveillance-secrets/
这是一篇由 Lighthouse 联合多家国际媒体发布的深度调查报道,题为《Surveillance Secrets》(监控秘密),聚焦全球监控产业中一家名为 First Wap 的公司及其名为 Altamides 的手机定位追踪软件。
调查始于一份藏匿于深网的庞大监控数据档案,包含超过 150 万条追踪记录、逾 1.4 万个独特手机号码,覆盖 160 多个国家。这些数据揭示了 Altamides 技术被广泛用于追踪全球各类人群,包括政界要员、企业高管、记者、活动人士和普通民众。
报道揭露 First Wap 公司不仅向政府客户销售技术,还向私营企业出售,例如一家受制裁的矿业公司计划用其监控环保抗议者。公司高管在秘密行业展会上公开宣称可实现“全球任意人员定位”,并曾讨论如何规避国际制裁。
调查团队通过分析数据集群,成功识别出多位高知名度目标,包括卡塔尔前总理、叙利亚前总统巴沙尔·阿萨德的妻子、Netflix 制片人亚当·西拉斯基、黑水公司创始人埃里克·普林斯、印尼《Tempo》杂志高级编辑阿里·努尔·亚辛等。在意大利,记者詹路易吉·努齐在揭露梵蒂冈腐败后不久即被追踪;在美国,23andMe 创始人安妮·沃伊西基在硅谷频繁移动时被上千次定位;在南非,卢旺达反对派领袖帕特里克·卡雷盖亚的盟友在遇刺前已被监控。
多个国家的媒体伙伴也发现本地异常监控活动:奥地利红牛公司高管被追踪,挪威电信高管遭锁定,以色列律师与非洲、海湾地区商人成为目标,塞尔维亚能源行业人士被波及。
First Wap 公司回应称不参与任何非法行为,强调其技术仅用于打击有组织犯罪、恐怖主义和腐败,并声称安装后不再掌握产品使用情况。但调查结果彻底打破了该行业“仅用于合法执法”的叙事,揭示出技术滥用的广泛性与系统性。
该调查由超过 70 名记者、14 家媒体机构共同完成,是迄今为止对现代监控产业最全面的揭露之一。
https://news.ycombinator.com/item?id=45584498
https://www.artnews.com/art-news/news/ireland-basic-income-artists-program-permanent-1234756981/
爱尔兰将把此前试点的艺术家基本收入计划正式化,从 2026 年起长期实施。该计划为入选艺术家提供每周约 375 美元(每月约 1500 美元)的固定补贴,首批名额为 2000 个,申请将于 2026 年 9 月开放,具体资格标准尚未公布。政府表示,若资金允许,未来可能扩大规模。
该试点项目始于 2022 年,原定 2025 年 2 月结束,后延长六个月。其初衷是应对新冠疫情对艺术行业的冲击,当时大量演出和活动被取消,艺术家收入严重受损。申请涵盖视觉艺术、戏剧、文学、音乐、舞蹈、歌剧、电影、马戏和建筑等领域,申请人需提供两项证明其为专业文化工作者的材料,如艺术作品收入证明、专业协会会员资格或媒体评论等。首轮申请中,超过 9000 人提交,8200 人符合资格,最终 2000 人被随机选中获得资助,另有 1000 人作为对照组用于研究。
根据英国咨询公司 Alma Economics 发布的外部评估报告,试点项目至今耗资 7200 万欧元,但已为爱尔兰经济带来近 8000 万欧元的总收益。报告指出,受助艺术家的创作收入平均每月增加超过 500 欧元,非艺术类工作收入减少约 280 欧元,对其他社会福利的依赖也下降,每人每月平均减少 100 欧元支出。
文化、通信与体育部长帕特里克·奥唐诺万表示,该投资对艺术行业和整体经济产生了立竿见影的积极影响。报告还预测,若实施长期、扩大的基本收入计划,艺术家产出将增加 22%,艺术品平均价格可能下降 9% 至 25%。
2024 年 10 月,政府公布的一项公众调查显示,97% 的受访者支持该计划。但在选择标准上存在分歧:47% 认为应按经济需求筛选,37.5% 支持按艺术成就选拔,仅 14% 支持随机抽选。
爱尔兰的艺术家基本收入计划属于“全民基本收入”(UBI)范畴,即无论个人状况如何,所有公民均可定期获得无条件现金补助。近年来,随着人工智能引发的就业担忧加剧,UBI 理念逐渐获得关注。该计划被视为 UBI 可行性的有力例证。
UBI 实验室网络(UBI Lab Network)强调:“试点已证明基本收入有效,人们现在就需要 UBI 来应对日益严峻的社会、经济和生态危机。” 该组织呼吁在全国范围内推行类似政策。UBI Lab Leeds 组织者雷因哈德·赫斯也表示:“我们不需要更多试点,人们现在就需要基本收入。”
https://news.ycombinator.com/item?id=45590900
https://www.anthropic.com/news/claude-haiku-4-5
Anthropic 发布了最新小型模型 Claude Haiku 4.5,该模型现已对所有用户开放。相比五个月前的前沿模型 Claude Sonnet 4,Haiku 4.5 在编码性能上达到相近水平,但成本降低至三分之一,速度提升超过两倍。
Haiku 4.5 在使用计算机、多智能体协作和实时响应等任务中表现优异,尤其适用于需要低延迟的应用场景,如聊天助手、客户服务、配对编程和 AI 辅助开发。其高效性使 Claude for Chrome 和 Claude Code 的体验更加流畅。
尽管 Claude Sonnet 4.5 仍是当前的前沿模型,也是全球最佳编码模型,但 Haiku 4.5 提供了接近前沿性能且成本更低的替代方案。它支持与 Sonnet 4.5 协同工作,例如由 Sonnet 4.5 进行复杂任务分解,再由多个 Haiku 4.5 实例并行执行子任务。
该模型在多个基准测试中表现突出,如 SWE-bench Verified 达到 73.3%,在 agentic coding 评估中达到 Sonnet 4.5 的 90% 性能,媲美更大模型。在终端操作、数学推理、多语言理解等任务中也展现出强大能力。
安全方面,Haiku 4.5 表现优异,其对齐程度优于前代模型,且在自动化对齐评估中低于 Sonnet 4.5 和 Opus 4.1,成为目前最安全的模型之一。其 CBRN 风险较低,因此被归类为 AI 安全等级 2(ASL-2),比 Sonnet 4.5 和 Opus 4.1 的 ASL-3 更宽松。
开发者可通过 Claude API、Amazon Bedrock 和 Google Cloud Vertex AI 使用 Haiku 4.5,价格为每百万输入/输出 token 1 美元/5 美元,是性价比极高的选择。
更多技术细节、评估结果和系统卡信息可在官方文档中查阅。
https://news.ycombinator.com/item?id=45595403
https://www.androidauthority.com/graphene-os-major-android-oem-partnership-3606853/
GrapheneOS,一个以隐私和安全为核心的 Android 定制系统,正计划打破其仅支持 Google Pixel 手机的局限。该项目已确认与一家主要的 Android 手机制造商达成合作,将把 GrapheneOS 引入搭载高通骁龙旗舰芯片的智能手机。
此次合作始于 2025 年 6 月,目标是为该厂商未来的旗舰机型提供官方支持。尽管未公布具体品牌,但消息指出这些设备将在价格上与 Pixel 系列相当,并在全球范围内销售。这一进展标志着 GrapheneOS 首次走出 Pixel 生态,迈向更广泛的市场。
目前,GrapheneOS 仍将继续支持现有 Pixel 设备,包括即将发布的 Pixel 10。但对于 Pixel 11 是否继续支持,项目团队仍在评估中。此前,GrapheneOS 因 Google 安全补丁更新周期过长而提出批评,此次合作有望通过更早获取安全更新,进一步保障系统安全性。
有猜测认为合作伙伴可能是 Nothing,因其支持解锁引导程序,但其目前尚不被视为“主流 Android OEM”。此次合作被视为 GrapheneOS 迈向独立和规模化的重要一步,可能在 2026 至 2027 年间实现设备落地。
https://news.ycombinator.com/item?id=45585869
https://joindatacops.com/resources/how-73-of-your-e-commerce-visitors-could-be-fake
文章揭示了当前电商网站面临的严重虚假流量问题,指出 73% 的访问者可能是机器人而非真实用户。作者通过实际案例发现,某客户网站月访问量达 5 万,但仅产生 47 笔销售,转化率低于 0.1%。尽管广告投入高达每月 4000 美元,且分析工具显示数据“向好”,但实际营收几乎停滞。
为查明真相,作者开发了一套简单追踪脚本,分析用户行为细节,如鼠标移动轨迹、滚动速度、点击间隔等。结果显示,该客户网站 68% 的流量为非人类流量,且这些机器人高度仿真,能模拟点击、滚动、加购等行为。
作者随后对超过 200 个中小型电商网站进行调查,发现平均 73% 的流量为虚假流量,形成系统性问题。他将这些机器人分为三类:
此外,文章指出并非所有自动化流量都是恶意的。例如,大型零售商会使用“良性机器人”进行数据抓取,监控库存、价格、排名和广告展示,这类行为属于合法商业竞争。但据估算,全球近 50% 的网络流量来自机器人,其中大量为欺诈性流量。
文章最后揭示了数字广告经济的深层问题:某客户每月花费 1.2 万美元在 Google 广告上,过滤虚假流量后流量下降 71%,但销售额反而增长 34%。这说明真实转化率早已改善,却被虚假流量掩盖。然而,当作者向广告平台提出此问题时,对方以“AI 检测先进”等话术回避,一位内部人士私下承认:平台清楚问题存在,但若彻底过滤,收入将骤降 40%,影响投资者信心。
文章警示:当前数字营销的绩效评估体系已被虚假流量严重扭曲,企业需重新审视流量真实性,否则将持续浪费巨额广告预算。
https://news.ycombinator.com/item?id=45590681
https://news.ycombinator.com/item?id=45592057
The modern Apple feels like their hardware teams way outperforming the software teams.
toddmorey
感觉现在的苹果,硬件团队的水平远超软件团队。
https://news.ycombinator.com/item?id=45591439
They tried to call this “universal” until people pointed out it is the opposite of universal. This program is a wild distortion of what UBI is meant to be.
Everyone who would like to be an artist, but can’t afford to be one, is disqualified. Meanwhile, the acquaintance of mine who sold his house in London at a large profit and retired to a cottage in Westmeath to live off his gains and noodle around on the guitar a bit is a recipient of funds from this program.
Tellingly there’s very little information about how to become an artist with this program.
Edit/addendum: Worth noting they’ve produced some very dubious numbers to claim this program is a net gain economically. https://www.rte.ie/culture/2025/0923/1534768-basic-income-for-the-arts-pilot-generated-over-100m-in-benefits/
""" A key component of the total benefits came from psychological wellbeing, which contributed almost €80 million. In addition, the report estimates that audience engagement with the arts generated €16.9 million in social value, based on public willingness-to-pay for cultural experiences. """
And, as much as I like psychological wellbeing (who doesn’t!) - saying that it’s worth €80 million when you didn’t actually get €80 million doesn’t help things when it comes time to pay for the program. I’m unsurprised that giving people money improved their psychological well being.
I’d be more excited to see basic income for Deliveroo riders and people working in chippers.
CalRobert
他们曾试图将此项目称为“普适性”的,直到有人指出它恰恰相反。这个项目严重扭曲了全民基本收入(UBI)的初衷。
所有那些渴望成为艺术家但又负担不起的人,都被排除在外。与此同时,我的一位熟人,他在伦敦卖掉房子赚了一大笔钱,然后搬到西米思郡的一间小别墅里,靠这笔钱过日子,没事就随便弹弹吉他,却成了这个项目的资助对象。
值得注意的是,关于如何通过这个项目“成为”一名艺术家,信息少得可怜。
补充/编辑:值得注意的是,他们为了声称该项目在经济上实现了净收益,炮制了一些极其可疑的数据。报告称:“总收益的关键组成部分来自于心理健康,这部分贡献了将近8000万欧元。此外,报告估计,观众参与艺术活动产生了1690万欧元的社会价值,这一数据基于公众为文化体验而支付意愿的估算。”
而且,虽然我也认同心理健康的重要性(谁会不认同呢!)——当你实际上并没有得到8000万欧元,却声称它值这么多,那么在需要为这个项目买单的时候,这种说法就站不住脚了。给人们发钱能改善他们的心理健康,我一点也不惊讶。
我其实更期待看到能为外卖骑手和炸鱼薯条店员工提供的基本收入。
https://news.ycombinator.com/item?id=45592334
The M5 MacBook Pro still gets the Broadcom WiFi chip but the M5 iPad Pros get the N1 and C1X (Sweet).
All in all, apple is doing some incredible things with hardware.
Software teams at apple really need to get their act together. The M1 itself is so powerful that nobody really needs to upgrade that for most things most people do on their computers. Tahoe however makes my M1 Air feel sluggish doing the exact same tasks ive been last couple of years. I really hope this is not intentional from Apple to make me upgrade. That would be a big let down.
mumber_typhoon
M5 MacBook Pro 仍然使用了博通 WiFi 芯片,而 M5 iPad Pro 则配备了 N1 和 C1X 芯片(太棒了)。
总而言之,苹果在硬件方面确实在做一些了不起的事情。
苹果的软件团队真的需要好好努力了。M1 芯片本身的性能已经非常强大,对于大多数人来说,在电脑上做的绝大多数事情都根本不需要升级。然而,Tahose(macOS Sequoia 的代号)却让我的 M1 Air 在运行过去几年里同样的任务时感觉变得迟缓。我真的希望苹果不是故意为之,想借此逼我升级。那将是一种巨大的失望。
https://news.ycombinator.com/item?id=45588911
Why can’t they just partner with postmarketOS here?
Why do we have to have /e/OS instead of a better supported LineageOS, because /e/ is a 1:1 copy anyways?
Why do we have to have a Librephone project now instead of partnering with say, Fairphone and the Pine64 people?
Open source loses this war because proprietary devices are streamlined. The only thing that comes close to this is GrapheneOS, LineageOS, and postmarketOS.
LineageOS has huge problems since the mandatory eBPF requirements of late Android versions, which postmarketOS and its upstreamed kernel drivers could fix. GrapheneOS has huge problems because of Pixel devices, which LineageOS could help with.
We need a unification of this ecosystem because each on their own is hardly surviving on their own against the megacorporations.
cookiengineer
他们为什么不直接与 postmarketOS 合作呢? 我们为什么非要使用 /e/OS,而不是一个拥有更好支持的 LineageOS 呢?毕竟 /e/OS 本质上就是它的1:1复制品。 我们为什么非要现在搞一个 Librephone 项目,而不是比如说和 Fairphone 以及 Pine64 的人合作呢? 开源在这场战争中输了,因为专有设备经过了精简优化。 唯一能与之抗衡的只有 GrapheneOS、LineageOS 和 postmarketOS。 由于新版 Android 强制要求 eBPF,LineageOS 遇到了巨大难题,而这本可以由 postmarketOS 及其上游化的内核驱动来解决。 由于 Pixel 设备的问题,GrapheneOS 也面临巨大挑战,而这本可以由 LineageOS 来帮助解决。 我们需要整个生态系统的统一,因为面对这些巨头公司时,任何一方都难以独自生存。
https://news.ycombinator.com/item?id=45585648
For a real world example of the challenges of harnessing LLMs, look at Apple. Over a year ago they had a big product launch focused on “Apple Intelligence” that was supposed to make heavy use of LLMs for agentic workflows. But all we’ve really gotten since then are a couple of minor tools for making emojis, summarizing notifications, and proof reading. And they even had to roll back the notification summaries for a while for being wildly “out of control”. [1] And in this year’s iPhone launch the AI marketing was toned down significantly.
I think Apple execs genuinely underestimated how difficult it would be to get LLMs to perform up to Apple’s typical standards of polish and control.
[1] https://www.bbc.com/news/articles/cge93de21n0o
freetime2
要了解将大型语言模型(LLMs)付诸实践所面临的挑战,苹果公司就是一个很好的现实案例。一年多前,他们举办了一场盛大的产品发布会,重点推出了“Apple Intelligence”,计划在代理工作流中大量应用LLMs。但自那以来,我们真正得到的不过是几款小工具:制作表情符号、摘要通知和校对文稿。而且,这些通知摘要功能甚至还一度因“失控”严重而被撤回。[1] 在今年的iPhone发布会中,其人工智能营销的声势也显著减弱了。
我认为,苹果的高管们确实严重低估了要让LLMs达到苹果一贯的精良品质和控制标准,其难度有多高。
https://news.ycombinator.com/item?id=45590673
People oppose everything.
Lattice overhead powerlines? Eyesore (should use the new T style ones), house values, wind noise, hums, WiFi interference, cancer, access roads, hazard to planes, birds
T-frame pylons: boring ( https://www.theguardian.com/commentisfree/2015/apr/13/electricity-pylons-britain-duller-place-national-grid-t-pylon-design ), eyesore (we prefer the lattice ones), most of the above too
Underground: damaging to the environment, end stations are eyesores/light polluters, more construction traffic, should be HVDC not AC, house values
Solar farms: waste of good land (golf courses are fine) noise somehow, construction, eyesore (but a 400 acre field of stinky bright yellow rapeseed is OK), house values
Onshore Wind farms: all the birds all the time, access, eyesore, noise, dangerous, should be offshore, house value, waste of land, I heard on Facebook the CO2 takes 500 years to pay back
Offshore wind farms: eyesores, radar hazard, all the birds, house values somehow, navigation hazard, seabed disruption
Build an access road: destroying the countryside, dust if not surfaced, drainage, house values
Don’t build an access road: destroying roads, HGVs on local roads, house values
Nuclear: literally all the reasons plus scary
Some of them are fair on their own, but it really adds up to a tendentious bunch of wankers at every turn who think the house they bought for 100k in 1991 and is now worth 900k is the corner of the universe.
As a foreign influence
I’m sure these people would never take foreign cash: https://www.bbc.co.uk/news/articles/c93k584nvgeo https://www.bbc.co.uk/news/articles/clyk1j92195o
grues-dinner
人们反对一切。
其中一些理由单看或许有几分道理,但综合起来,就是一群走到哪都充满偏见、自以为是的混蛋,他们觉得自己1991年花10万英镑买的、如今价值90万英镑的房子就是宇宙的中心。
来自外国的影响
我敢肯定这些人绝不会收外国钱的:https://www.bbc.co.uk/news/articles/c93k584nvgeo https://www.bbc.co.uk/news/articles/clyk1j92195o
https://news.ycombinator.com/item?id=45586284
“None of the safe programming languages existed for the first 10 years of SQLite’s existence. SQLite could be recoded in Go or Rust, but doing so would probably introduce far more bugs than would be fixed, and it may also result in slower code.”
Modern languages might do more than C to prevent programmers from writing buggy code, but if you already have bug-free code due to massive time, attention, and testing, and the rate of change is low (or zero), it doesn’t really matter what the language is. SQLIte could be assembly language for all it would matter.
jasonthorsness
在 SQLite 存在的头十年里,没有任何安全的编程语言。SQLite 可以用 Go 或 Rust 重写,但这样做可能会引入比修复的更多的错误,并且也可能导致代码运行更慢。
现代语言在防止程序员编写有缺陷的代码方面可能比 C 语言做得更多,但如果你已经通过投入大量的时间、精力和测试获得了无错误的代码,且变更率很低(或为零),那么使用何种语言就真的无关紧要了。在这种情况下,SQLite 即使用汇编语言编写也无所谓。
https://news.ycombinator.com/item?id=45592162
I was super interested in the Vision Pro when it was first released. Then I found out they went with an app model and the device could only display a single MacOS window. There went my dream of surrounding myself with a bunch of vim windows and terminals.
If they’d focused on maximizing the device’s usefulness instead of its revenue stream, maybe things would have worked out better.
DennisP
Vision Pro刚发布时,我特别感兴趣。后来我发现,它采用的是应用模式,而且设备只能显示一个macOS窗口。我梦想着被一堆vim窗口和终端包围的场景,就这样破灭了。如果他们当时能专注于最大化设备的实用性,而不是它的盈利模式,或许结果会好得多。
https://news.ycombinator.com/item?id=45590682
Hi HN. I run a marketing agency and fell down this rabbit hole after a client’s analytics made no sense (50k visitors, 47 sales). I ended up building a simple script to track user behavior and analyzed 200+ small e-commerce sites. The average was 73% bot traffic that standard analytics counts as real.
The bots are getting creepily good at mimicking engagement. I wrote up my findings, including some of the bizarre patterns I saw and the off-the-record conversations I had with ad tech insiders. It seems like a massive, open secret that nobody wants to talk about because the whole system is propped up by it.
I’m curious if other developers, founders, or marketers here have seen similar discrepancies in their own data.
simul007
我经营着一家营销机构,因为一位客户的(5万次访问,47笔成交)数据实在说不通,我偶然陷入了一个兔子洞。我最终写了一个简单的脚本来追踪用户行为,并分析了200多家小型电商网站。平均来看,有73%的流量是机器人流量,而标准分析工具却将它们计为真实流量。这些机器人在模仿用户互动方面已经变得诡异般地强大。我将我的发现整理成文,其中包含我观察到的一些诡异模式,以及我与广告技术圈内人士的非公开谈话。这似乎是一个巨大的、公开的秘密——一个没人愿意谈论的秘密,因为整个系统都依赖于它而得以维持。我很想知道这里的其他开发者、创始人或营销人员是否在自己的数据中看到过类似的出入。
https://news.ycombinator.com/item?id=45586695
Ultimately, I don’t think the most important challenge is in binary firmware blobs, but the software which people depend upon to run their lives. What does it matter if you can run a completely free software stack on your phone, if your bank software (or your required government ID, as is looking depressingly likely) requires you to run a Big Tech approved phone OS? Perhaps the FSF can’t do much about that, but that is where I feel they could truly make the biggest difference for freedom for the average user.
bigstrat2003
说到底,我认为最重要的挑战并非二进制固件块,而是人们赖以生存的软件。如果你的手机可以运行一个完全自由的软件栈,但你的银行软件(或者你所必需的政府身份证件,而这看起来令人沮丧地可能发生)却要求你运行一个由大型科技公司批准的手机操作系统,那又有什么意义呢?也许自由软件基金会(FSF)对此无能为力,但我认为,那才是他们能够为普通用户的自由带来真正最大改变的地方。
https://news.ycombinator.com/item?id=45593989
To any Linux users, I recently bought a fully loaded M4 MacBook pro to replace my aging Lenovo and strongly regret it. I thought I would use it for playing with LLMs, but local dev on a Mac is not fun and I still don’t have it fully set up. I’ll probably replace it with a framework at some point in the near future.
Edit: okay, that garnered more attention than I expected, I guess I owe a qualification.
Everything is just slightly different. I had to split all my dot files into common/Linux/Mac specific sections. Don’t expect to be able to clone and build any random C++ project unless someone in the project is specifically targeting Mac.
Not everything is supported natively on arm64. I had an idea and wanted to spin up a project using DynamoRIO, but wasn’t supported. Others have mentioned the docker quirks.
The window manager. I’m not a fan of all the animations and needing to gester between screens (and yes, I’ve been down the hotkeys rabbit hole). To install a 3rd party window manager you need to disable some security setting because appearantly they work by injecting into the display manager and calling private APIs.
So my person takeaway was that I took the openness of the Linux ecosystem for granted (I’ve always had a local checkout of the kernel so I can grep an error message if needed). Losing that for me felt like wearing a straightjacket. Ironically I have a MBP at work, but spend my day ssh’d into a Linux box. It’s a great machine for running a web browser and terminal emulator.
0xfaded
致所有 Linux 用户:我最近买了一台顶配的 M4 MacBook Pro 来替换我那台老旧的联想电脑,对此感到非常后悔。我原计划用它来玩转大模型,但在 Mac 上进行本地开发并不好玩,而且我至今还没能把它完全配置好。我可能会在不久的将来把它换成一台 Framework 笔记本电脑。
编辑:好吧,这个帖子获得的关注比我预期的要多,我想我需要补充说明一下。
所有东西都只是略有不同。我必须把我的所有 dot 文件拆分成通用版、Linux 版和 macOS 版。不要期望能随便 clone 一个 C++ 项目就能编译运行,除非项目本身特别针对 macOS 进行过适配。
并非所有东西都支持 arm64 原生架构。我有一个想法,想用 DynamoRIO 启动一个项目,但发现它不支持。其他人也提到了 Docker 的一些古怪之处。
窗口管理器。我不喜欢所有的动画效果,也不需要在多个屏幕之间进行手势操作(是的,我已经钻进快捷键的深坑里了)。要安装第三方窗口管理器,你需要禁用一些安全设置,因为它们显然是通过注入到显示管理器并调用私有 API 来工作的。
所以我个人的体会是,我把 Linux 生态系统的开放性当成了理所当然(我一直本地存有内核源代码副本,以便在需要时用 grep 搜索错误信息)。失去这种自由对我来说就像是穿了一件紧身衣。讽刺的是,我在工作中有一台 MacBook Pro,但整天都通过 SSH 连接到一台 Linux 服务器。这是一台运行网页浏览器和终端模拟器的绝佳机器。
https://news.ycombinator.com/item?id=45588709
I find LLM generated code ends up pushing review/maintenance burden onto others. It “looks” right at first glance, and passes superficial tests, so it’s easy to get merged. But then as you build on top of it, you realize the foundations are hastily put together, so a lot of it needs to be rewritten. Fine for throwaway or exploratory work, but heaven help you if you’re working in a project where people use LLMs to “fix” bugs generated by previous LLM generated code.
So yes it does increase “velocity” for the person A who can get away with using it. But then the decrease in velocity for person B trying to build on top of that code is never properly tracked. It’s like a game of hot potato, if you want to game the metrics you better be the one working on greenfield code (although I suppose maintenance work has never been looked at favorably in performance review; but now the cycle of code rot is accelerated)
krackers
我发现,大语言模型(LLM)生成的代码,最终将审查和维护的负担都转嫁给了他人。这些代码初看之下“看起来”没问题,也能通过一些肤浅的测试,因此很容易被合并。但当后续开发在此基础上进行时,你会发现其基础是仓促搭建的,导致很大一部分都需要重写。这种代码对于一次性或探索性的工作或许还行,但如果你在一个项目中,看到人们用LLM去“修复”之前LLM生成的代码所产生的bug,那可真是自求多福了。
所以,对于能够靠它蒙混过关的开发者A来说,这确实能提高他的“开发速度”。但对于那些试图在此基础上继续开发的开发者B来说,其开发速度的下降却从未被追踪。这就像“传土豆”游戏,如果你想钻绩效指标的空子,最好就是去做那些全新的开发工作(虽然我猜,维护工作在绩效评估中向来就不受青睐,但现在代码腐烂的循环被大大加速了)。
https://news.ycombinator.com/item?id=45595164
“transforming real estate with blockchain” is the only red flag needed
blactuary
“用区块链颠覆房地产”本身就是一个危险信号。
https://news.ycombinator.com/item?id=45591246
The takeaway here isn’t that serverless doesn’t work, it’s that the authors didn’t understand what they were building on. Putting a latency-critical API on a stateless edge runtime was a rookie mistake, and the pain they describe was entirely predictable.
kburman
这里的重点并非无服务器技术行不通,而是作者们没有理解他们所构建的基础。将延迟敏感的API部署在无状态边缘运行时上,是个新手错误,而他们所描述的困扰也完全是可预见的。
https://news.ycombinator.com/item?id=45577441
if you’re working on novel code, LLMs are absolutely horrible
This is spot on. Current state-of-the-art models are, in my experience, very good at writing boilerplate code or very simple architecture especially in projects or frameworks where there are extremely well-known opinionated patterns (MVC especially).
What they are genuinely impressive at is parsing through large amounts of information to find something (eg: in a codebase, or in stack traces, or in logs). But this hype machine of ‘agents creating entire codebases’ is surely just smoke and mirrors - at least for now.
joshvince
如果你正在处理新颖的代码,大语言模型绝对是糟糕的。
这说到点子上了。根据我的经验,当前最先进的模型非常擅长编写样板代码或非常简单的架构,尤其是在那些有非常知名且固化模式(尤其是MVC)的项目或框架中。
它们真正令人印象深刻的是处理大量信息以找到某些东西(例如:在代码库、堆栈跟踪或日志中)。但这种“代理创建整个代码库”的炒作机器肯定只是障眼法——至少目前是这样。