MoreRSS

site iconHackerNews AI 摘要修改

使用 RPA 方案,每天自动获取 Top Stories ,使用 GPT 方式自动摘要,同时会一并摘要 HackerNews 网友的评论。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

HackerNews AI 摘要的 RSS 预览

2026 03 20 HackerNews

2026-03-20 08:02:44

2026-03-20 Hacker News Top Stories #

  1. Astral公司宣布加入OpenAI并承诺保持其Python开发工具开源,引发关于AI巨头控制开发工具链和Python生态未来的讨论。
  2. 美国说唱歌手Afroman因使用警方搜查其住所的监控画面制作歌曲MV而被起诉诽谤,最终陪审团裁定其行为属艺术表达受宪法第一修正案保护。
  3. 奥斯汀市通过放宽分区规定、大幅增加住房供应成功降低租金,证明系统性打破监管壁垒可有效缓解住房短缺问题。
  4. 文章驳斥"代理编程"中规格说明书可替代代码的观点,指出精确规格的复杂度已与代码相当,且当前AI代理编程仍不可靠。
  5. 文章描绘未来软件由自然语言直接生成的场景,指出关键能力将从编程转向领域知识理解与规格精准表达。
  6. FBI局长确认该局正在购买公民位置数据用于追踪,此举绕过宪法第四修正案,引发对隐私权和监管缺失的批评。
  7. 文章批评主流新闻网站为追求广告收益而严重牺牲用户体验,通过弹窗、自动播放等手段将"用户挫败感"作为产品。
  8. 据报道丹麦因特朗普威胁占领格陵兰岛,于2026年1月与法国等国组建北欧防御联盟,准备应对与美国的潜在军事冲突。
  9. 美国歌手Afroman在民事诉讼中胜诉,陪审团裁定其使用警方突袭影像制作音乐视频的行为不构成侵权,属言论自由范畴。
  10. 作者反思AI辅助编程虽快速但常含错误,本质如同"赌博",且这种依赖削弱了独立思考与编程的核心乐趣。

1. Astral 将加入 OpenAI (Astral to Join OpenAI) #

https://astral.sh/blog/openai

Astral 公司宣布将加入 OpenAI,成为 Codex 团队的一部分。这一举措标志着 Astral 在提升 Python 开发效率方面的使命迈入新阶段。

Astral 自成立以来,致力于打造高效、稳定、直观且集成度高的 Python 开发工具。其核心产品 Ruff、uv 和 ty 已累计实现每月数亿次下载,成为现代 Python 开发的基础设施。

公司始终坚持开源理念,此次并购后,OpenAI 承诺将继续支持 Astral 的开源项目,团队将继续在公开环境中与社区协作,为 Python 生态持续贡献。

创始人 Charlie Marsh 表示,AI 正在快速重塑软件开发方式,而 Codex 正处于这一变革的前沿。Astral 的加入将推动 AI 与开发工具的深度融合,探索更高效的开发体验,并拓展对软件开发未来的思考。

他特别感谢了 Astral 团队、投资人(包括 Accel 的 Casey Aylward 和 a16z 的 Jennifer Li)以及广大用户,强调所有成就都源于团队的努力和用户的信任。

未来,Astral 将继续推进开源工具的开发,同时探索与 Codex 的协同创新,目标始终是让编程变得更高效、更愉悦。


HN 热度 1174 points | 评论 722 comments | 作者:ibraheemdev | 11 hours ago #

https://news.ycombinator.com/item?id=47438723

  • OpenAI 和 Anthropic 正逐步掌控软件开发的“生产工具”,可能导致开发工具链进一步中心化,影响开源生态的可持续性。
  • uv 和 ruff 等工具虽看似小众,但对 Python 生态的改善至关重要,尤其在解决依赖管理混乱问题上表现突出。
  • 尽管 uv 和 ruff 影响力大,但若它们消失,开发者仍可转向其他替代方案,因此不必过度夸大其重要性。
  • Python 虽被部分人批评为“设计糟糕的语言”,但其在机器学习和生态兼容性方面的优势使其难以被替代。
  • Python 的流行并非偶然,其工具链近年才真正跟上开发需求,说明其生态具有实际价值而非仅靠“运气”。
  • 未来随着大模型生成代码能力提升,编程语言本身的重要性可能下降,但 Python 在现有生态中仍具不可替代性。
  • uv 的出现解决了传统 pip 在速度和依赖解析正确性上的长期缺陷,是目前最有效的 Python 包管理工具。
  • 传统工具如 poetry 和 pip 虽有用户,但实际体验差,许多开发者仍依赖原始 requirements.txt,说明它们并未真正解决问题。
  • 使用 uv 可以实现一键运行带依赖的 Python 脚本,无需等待依赖解析,效率远超传统工具。
  • 有人质疑 uv 相比 pip+venv+pyenv 的实际优势,认为其必要性存疑,但实际使用中其性能和体验提升显著。
  • Python 生态的依赖管理问题长期存在,uv 通过 Rust 实现和缓存机制,从根本上解决了传统 Python 工具的“启动问题”和“环境破坏”问题。

2. Afroman 在诽谤案中被判无罪 (Afroman found not liable in defamation case) #

https://nypost.com/2026/03/18/us-news/afroman-found-not-liable-in-bizarre-ohio-defamation-case/

美国说唱歌手 Afroman(本名约瑟夫·福尔曼)在俄亥俄州一起民事诉讼中被裁定无罪,未被认定对七名警员构成诽谤。该案件源于 2022 年 8 月, Adams County 警局对 Afroman 住所进行的一次搜查行动,但未发现任何犯罪证据,也未提起刑事指控。

Afroman 随后创作并发布了一首名为《Lemon Pound Cake》的讽刺歌曲,并使用自己家中监控拍摄的搜查画面制作音乐视频,用以抗议执法不当并筹集资金赔偿财产损失。视频中包含警员破门而入、一名警员持枪盯着蛋糕等画面,引发争议。

七名涉事警员于 2023 年 3 月起诉 Afroman,指控其视频及后续社交媒体内容构成诽谤、侵犯隐私、制造虚假形象及故意造成精神伤害。他们声称 Afroman 在社交平台上发布不实信息,包括称他们“偷钱”“是伪装成执法人员的白人至上主义者”“曾吸毒”“生物学上为男性”等。

Afroman 的律师强调,该作品属于艺术表达与社会评论,受宪法第一修正案保护,且警员作为公众人物应接受公众批评。律师指出,公众对执法行为的监督是民主社会的正常现象。

控方律师则反驳称,Afroman 长期散布虚假信息,持续三年多,严重损害警员名誉,要求赔偿共计 390 万美元。

2026 年 3 月 18 日,陪审团裁定 Afroman 无罪,认定其行为不构成诽谤或侵权。Afroman 在庭上表示,若当初警局未错误搜查其住所,就不会有后续事件发生。


HN 热度 1079 points | 评论 616 comments | 作者:antonymoose | 14 hours ago #

https://news.ycombinator.com/item?id=47436950

  • 美国警察在执行任务时普遍携带重型自动武器,表现出高度军事化倾向,与英国警察极少配枪形成鲜明对比。
  • 美国警察的执法风格强调“生命优先”,但其优先级更偏向自身安全,而非全面保护所有人的生命。
  • 英国警察在处理冲突时更注重非暴力手段,如使用催泪喷雾、警棍和徒手控制,极少使用致命武力。
  • 北爱尔兰警察(PSNI)在近年几乎未发生枪击事件,其执法方式以非致命手段为主,执法效率与民众信任度较高。
  • 美国警察面对的民众普遍持枪,这增加了执法风险,但美国警察并未积极推动枪支管控,导致执法环境更加危险。
  • 尽管加拿大枪支拥有率与美国相近,但其警察执法风格与美国截然不同,未出现“拔枪即射”的现象,说明文化与制度差异更为关键。
  • 美国警察的军事化倾向源于历史背景,如 20 世纪 80 年代的“射杀即死”政策,当时警察和军队在街头频繁使用致命武力,加剧了社会矛盾。
  • 警察暴力的根源往往在于制度性问题,而非单纯民众持枪,过度军事化执法会激化社会冲突,阻碍和平解决。
  • 英国对警察使用致命武力有独立的民间调查机制,形成有效监督,促使警察在执法中更加谨慎。
  • 美国警察的高枪击率与社会文化、制度设计和缺乏外部监督密切相关,不能简单归因于民众持枪。
  • 有观点指出,美国警察的执法方式反映了对民众的不信任,而英国模式则体现“为人民而警”的理念。

3. 奥斯汀新建住房激增推动租金下降 (Austin’s surge of new housing construction drove down rents) #

https://www.pew.org/en/research-and-analysis/articles/2026/03/18/austins-surge-of-new-housing-construction-drove-down-rents

Austin 市在 2015 至 2024 年间新增 12 万个住房单元,住房供应增长 30%,远超全美 9% 的平均水平。这一增长得益于一系列政策改革,包括放宽 zoning 规定、推动混合用途开发、鼓励建设附属住宅单元(ADUs)、取消大部分地区最低停车要求等。2018 年,市民投票通过 2.5 亿美元债券,用于建设与修复经济适用房。

在政策推动下,Austin 租金显著下降。2021 年 12 月,中位租金达 1546 美元,为历史高点;到 2026 年 1 月,已降至 1296 美元,低于全美平均水平。其中,50 个以上单位的公寓租金下降 7%,老旧非豪华住宅(Class C)租金下降约 11%。尽管 2022 至 2024 年城市人口增加 1.8 万人,但租金仍实现回落。

Austin 的改革策略注重供需双管齐下:通过密度奖励机制,鼓励开发商在项目中包含可负担住房;同时优化审批流程,加快建设速度。2023 年,Austin 成为全美最大城市中全面取消最低停车配建要求的城市。

这些举措表明,打破住房建设的多重监管壁垒,需系统性政策协同。Austin 的经验为其他快速发展的城市提供了可借鉴的范例,证明通过制度创新可以有效缓解住房短缺、改善居住 affordability。


HN 热度 772 points | 评论 956 comments | 作者:matthest | 24 hours ago #

https://news.ycombinator.com/item?id=47433058

  • 建设更多住房是降低租金的最有效方法,关键在于增加供给而非依赖租金管制,同时需维持社会秩序。
  • 房价上涨的根本原因在于供给不足,尤其在犯罪率低但经济机会多的地区,而若建设住房却伴随犯罪率上升,则等于浪费资源。
  • 尽管供需规律清晰,但多数选民因拥有房产而反对房价下跌,导致政策难以推进。
  • 即使是租客也常反对新建住房,反映出公众对基本经济原理缺乏理解,根源在于教育体系中经济学知识的缺失。
  • 人们并非总是理性地依据自身经济利益行事,许多人追求舒适生活,不愿为节省租金而居住在条件较差的区域。
  • 新建住房常因被贴上“豪华”或“非可负担”标签而遭反对,即便只是普通住宅或公寓,也因密度、交通、外观等问题引发争议。
  • 一些人反对开发是因为担心施工噪音、环境影响或老鼠迁移,反映出对短期不便的过度担忧。
  • 短期租赁(STR)的激增显著推高了租金,尤其当由外地开发商主导时,对社区造成严重干扰,且导致低收入租户被迫搬离。
  • 住房类型和用途对市场影响重大,单纯增加供给未必降低价格,若新增的是高溢价或非居住性用途住房,可能加剧供需失衡。
  • 高科技产品如 GPU 价格上升也引发公众对“价格应被政府控制”的错误认知,反映出对市场机制的普遍误解。
  • 人们常误以为只有“可负担住房”才有助于降低租金,忽视了所有新增住房都会增加供给、缓解价格压力。

4. 一份足够详细的规格说明书就是代码 (A sufficiently detailed spec is code) #

https://haskellforall.com/2026/03/a-sufficiently-detailed-spec-is-code

本文讨论了当前“代理编程”(agentic coding)热潮中一个被广泛误解的观点:即仅凭规格说明书就能生成高质量代码。作者认为,这种观点基于两个常见误解。

第一个误解是认为规格说明书比代码更简单。实际上,当规格说明书精确到足以生成可运行代码时,它往往演变为类似代码的结构,例如用自然语言描述数据库字段、算法逻辑或配置项,甚至直接包含伪代码。作者以 OpenAI 的 Symphony 项目为例,指出其规格文件(SPEC.md)本质上是“披着说明书外衣的代码”,包含大量结构化描述和可执行逻辑,根本无法简化开发工作。

第二个误解是认为编写规格说明书比写代码更需要深思熟虑,从而能提升代码质量。作者反驳称,这种过程并不能自动保证质量,反而可能掩盖了对细节的忽视。真正严谨的规格必须达到与代码同等的精确度,而这恰恰意味着需要付出等量甚至更多的工程努力。

作者引用计算机科学先驱戴克斯特拉的观点指出:人类语言在表达精确逻辑时存在天然局限,一旦追求精确,就必须转向形式化符号系统——也就是代码。因此,试图用自然语言规格替代代码,本质上只是将编码劳动“转译”成另一种形式,而非消除它。

最后,作者通过实际尝试让 Claude Code 根据 Symphony 的规格文档用 Haskell 实现项目,结果发现生成的代码存在多个错误,无法正常运行。这进一步说明,当前的代理编程在实际应用中仍不可靠,难以保证生成代码的正确性和可用性。

总结:规格说明书不能真正替代代码;当它足够精确时,就会变成代码本身。代理编程并未突破工程本质,只是在形式上转移了劳动。


HN 热度 585 points | 评论 322 comments | 作者:signa11 | 21 hours ago #

https://news.ycombinator.com/item?id=47434047

  • LLM 能够从简略描述中生成少量可运行代码,但这种生成并不总是可靠,尤其在面对复杂或细微调整的算法需求时容易出错。
  • LLM 生成代码的能力依赖于其训练数据中的相似案例,对于重复性或常见任务效率高,但对创新性或高性能要求高的项目帮助有限。
  • 人类开发者在理解上下文、提出关键问题和判断设计取舍方面具有不可替代的优势,这是 LLM 无法复制的。
  • 优秀的开发者不仅编写代码,更在需求澄清、风险预判和系统权衡中发挥核心作用,这种“审慎判断”需要经验积累。
  • 外包开发和 LLM 编码都面临因缺乏领域知识和公司文化理解而导致的细节遗漏问题,这会显著影响项目质量。
  • LLM 生成的测试代码往往过于脆弱,反而阻碍后续开发,其生成结果的不可靠性在关键系统中尤为危险。
  • 人类具备反思能力、质疑能力与实验精神,能够主动修正模糊或错误的需求,而 LLM 仅能基于统计模式进行推测。
  • 以“用户会如何使用”作为设计启发是一种有效的直觉方法,但 LLM 无法真正理解人类意图,只能模仿统计上可能的行为。
  • 对于需要长期维护或高可靠性的系统(如 API 或数据库设计),应谨慎使用 LLM,因其难以把握复杂权衡与潜在影响。

5. 保修无效,若已再生 (Warranty Void If Regenerated) #

https://nearzero.software/p/warranty-void-if-regenerated

在软件成本趋近于零的后过渡时代,传统职业被彻底重塑,软件维修这一新兴职业应运而生。主人公汤姆·哈特曼原是农业设备维修技师,因技术变革导致软件不再需要“修复”,而是通过自然语言指令“再生”生成,他的工作重心转向“软件机械师”——即能够理解特定领域知识并精准表达需求规格的人。

这一职业的出现标志着“硬件”与“软件”长期分离的终结。过去,软件开发依赖专业编码技能,如今,软件由自然语言直接生成,关键能力不再是编程,而是对领域知识的深刻理解与对规格表达的精准把握。汤姆的客户多为非技术人员,他们能提出需求,却难以用足够精确的语言描述细节,导致生成的系统出现偏差。

文章以汤姆处理一位菜农客户的问题为例:客户生成的收获时机优化工具因“质量调整后收益”这一概念模糊,导致过早收割,造成重大经济损失。这揭示了非技术专家在用自然语言表达复杂决策逻辑时的普遍困境——他们依赖的“常识”对机器毫无意义。

汤姆通过分析原始规格与实际行为之间的差距,揭示问题根源。他用咖啡机的失败案例类比:尽管反复优化,机器始终无法做出“好喝”的咖啡,因为自然语言难以捕捉流体动力学、热管理与味觉之间的微妙关系。这一类比让客户意识到,复杂系统的规格制定远比想象中困难。

整个社会正经历深刻转型:技术的普及使工具不再稀缺,真正稀缺的是理解领域、精准表达需求的能力。未来最有价值的人,不是程序员,而是那些既懂专业领域、又能与机器有效沟通的“领域专家 + 规格设计师”。


HN 热度 501 points | 评论 307 comments | 作者:Stwerner | 1 day ago #

https://news.ycombinator.com/item?id=47431237

  • 有人在阅读时未察觉文章由 AI 生成,事后感到被欺骗,情绪上产生不适,认为这种体验令人不安。
  • 该文章虽由 AI 辅助创作,但作者投入了大量时间构建世界观、撰写风格指南等,体现了深厚的人类创作意图与精心打磨。
  • 文章质量极高,风格接近《纽约客》的文学水准,阅读体验良好,令人沉浸其中。
  • 有人质疑 AI 生成内容的可信度,认为其缺乏人类思维深度,即便文笔出色,也难以引发真正的共鸣。
  • 有人将 AI 生成内容比作“充气娃娃”,虽感官相似,但整体体验与真实人际互动完全不同,缺乏情感真实性。
  • 人类天生具有与非生命体建立情感连接的能力,因此即使面对 AI 创作,也可能产生情感投射。
  • 有人担忧 AI 对自身职业和人性构成威胁,尤其在不得不使用 AI 以保持竞争力的情况下,感到无奈与焦虑。
  • 有人认为当前对 AI 生成内容的排斥态度,类似于历史上的卢德运动,但对卢德运动的理解存在偏差,其本质是劳工权益斗争而非反技术。
  • 卢德运动的诉求并非反对技术本身,而是反对资本利用机器压榨工人、降低产品质量,其立场具有合理性。
  • 有人认为,尽管卢德运动最终未能成功,但其对技术滥用的警惕值得当代人反思。
  • 有人指出,当前对 AI 的排斥可能只是暂时现象,未来当 AI 生成内容质量超越人类时,这种排斥感或许会自然消解。
  • 有人认为,AI 应承担其擅长的重复性工作,而人类则专注于创造性与高质量内容的产出,这是合理的分工。
  • 有人反驳称,主张人类保留高质量工作,实则与当年卢德运动的立场一致,即反对被机器取代。
  • 有人认为,工作本质上是谋生手段,人们并非真正“热爱”工作,而是被迫为之,因此对工作失去的恐惧是普遍存在的。
  • 有人提出,随着技术发展,未来可能实现无需为生计而工作,从而真正解放人类,但这一愿景面临短视者的阻碍。
  • 有人批评上述观点过于理想化,认为“失去工作”对大多数人而言是被迫的、令人焦虑的,而非可接受的自由选择。

6. FBI 确认购买公民位置数据用于追踪美国公民 (FBI is buying location data to track US citizens, director confirms) #

https://techcrunch.com/2026/03/18/fbi-is-buying-location-data-to-track-us-citizens-kash-patel-wyden/

美国联邦调查局(FBI)已重启购买公民位置数据的行为,用于支持联邦调查,这一举动由 FBI 局长卡什·帕特尔在国会作证时确认。这是自 2023 年以来,FBI 首次公开承认此类行为。帕特尔表示,FBI 使用所有合法工具履行职责,包括购买符合宪法和《电子通信隐私法》的商业数据,这些数据对调查提供了重要情报支持。

然而,这一做法引发争议。俄勒冈州民主党参议员罗恩·怀登批评称,未经授权购买美国公民数据是绕过宪法第四修正案的“荒谬行为”,该修正案保护民众免受无理搜查和扣押。目前,政府机构通常需获得法官签发的搜查令才能获取个人数据,但近年来,包括 FBI 在内的多个机构通过购买来自数据经纪商的商业数据,规避了这一程序。

这些数据主要来源于手机应用和网络广告中的实时竞价(RTB)技术,通过追踪用户位置等信息,被第三方公司收集并出售。尽管 FBI 声称无需搜查令即可使用此类数据,但这一法律立场尚未在法庭上得到检验。

为应对这一问题,怀登与多位两党议员联合提出《政府监控改革法案》,要求联邦机构在购买公民个人信息前必须获得法院授权的搜查令。目前,FBI 发言人仅回应了帕特尔的证词,未就购买频率、数据来源等具体问题作出说明。


HN 热度 497 points | 评论 182 comments | 作者:jbegley | 1 day ago #

https://news.ycombinator.com/item?id=47430797

  • 购买位置数据的供应链结构复杂,各环节相互推诿责任,导致问责机制完全失效,消费者是否同意数据收集无法验证。
  • 苹果和谷歌通过应用商店高额抽成,同时为广告平台提供便利,却以“安全审查”为由掩盖其对用户隐私数据被滥用的知情与纵容。
  • 操作系统应有能力识别并阻止使用不安全广告平台的应用,但目前缺乏足够权限控制和透明度。
  • 现有广告技术生态整体不安全,用户数据被过度收集和转卖,且缺乏有效监管与问责机制。
  • 仅靠企业自律无法解决数据滥用问题,必须通过立法强制要求数据处理方对个人隐私信息承担法律责任。
  • 限制基于个人特征的定向广告即可减少隐私风险,无需全面禁止广告支持的应用。
  • 企业高管应对数据滥用行为承担刑事责任,但现实中责任链条模糊,难以追责。
  • 用户无法知晓应用连接了哪些第三方服务,也无法主动阻止,系统缺乏透明度和控制能力。
  • 苹果和谷歌拥有足够的技术与资源来改进隐私保护,但优先级被商业利益取代,实际投入不足。
  • 企业不仅不主动解决隐私问题,还通过游说等手段阻止监管立法,本质上是反隐私的系统性行为。
  • 苹果的隐私报告功能虽能显示应用访问的域名,但无法阻止连接,仍无法真正保护用户隐私。

7. 以用户挫败感为产品 (“Your frustration is the product”) #

https://daringfireball.net/2026/03/your_frustration_is_the_product

文章批评了当前主流新闻网站在用户体验上的严重恶化,以《纽约时报》为例,指出访问一个简单页面竟需 422 次网络请求,下载 49MB 数据,耗时两分钟才加载完成。作者引用 Shubham Bose 的分析,揭示网页设计已背离读者需求,转而服务于广告收益。

核心问题在于,网站通过延长用户停留时间来提升广告收益(CPM),导致设计充满干扰性元素:频繁弹出的订阅请求、无关的推荐链接、自动播放的视频,甚至重复出现相同的广告多次。这些行为在印刷版媒体中绝不会出现,而数字版却对读者极不尊重。

作者指出,这种“以用户 frustration 为产品”的设计逻辑,本质上是广告系统驱动的“黑暗模式”,使网站越来越像一个充满骚扰的商业场所。例如,某些网站在移动端仅保留 11% 屏幕用于正文,如同电视节目每小时只播放 7 分钟内容,其余时间全是广告。

尽管有 uBlock Origin 等工具可缓解问题,但许多网站仍不断强化侵入式设计,形成恶性循环:越差的体验导致用户流失,却用更多干扰手段试图挽回。作者讽刺道,这些网站的决策者往往并不真正喜爱或理解网络本身,如同“试图撞向冰山的邮轮船长”。

最终,文章呼吁对网络体验进行反思,强调真正的尊重应体现在对读者注意力与阅读体验的保护上。


HN 热度 392 points | 评论 235 comments | 作者:llm_nerd | 12 hours ago #

https://news.ycombinator.com/item?id=47437655

  • 一些新闻网站的运营者对广告系统完全失控,甚至需要依赖第三方服务器端广告拦截器来停止广告,反映出广告管理的混乱。
  • 广告平台的复杂性对非专业人士而言难以理解,开发者在面对用户反馈时反而质疑问题的难度,显示出行业内外的认知鸿沟。
  • 广告系统常通过标签管理器嵌入网站,但若由非技术部门管理,容易导致广告泛滥且难以控制,形成“广告失控”现象。
  • 有用户期待类似“Netflix for news”的订阅服务,每月支付固定费用即可访问多家媒体内容,但现有服务如 Apple News+ 质量参差不齐,广告体验差。
  • Apple News+ 虽价格合理,但内容质量不高,充斥低质文章和劣质广告,尽管用户仍推荐其作为获取部分付费媒体内容的途径。
  • 用户对广告体验极度不满,尤其对 AI 生成的虚假人物广告和低质量内容感到反感,但依然因内容价值而选择继续使用。
  • 有人设想一种“互联网快速通行证”服务,可付费去除广告、自动处理 Cookie、统一登录,并将收入公平分配给浏览的网站,但担心服务垄断后会涨价或引入新广告。
  • Kagi 搜索服务尝试提供无广告、无竞价推广的搜索体验,用户愿意为此付费,但对平台集中化可能破坏网络中立性表示担忧。
  • 互联网应被视为公共基础设施,不应被广告和追踪过度侵蚀,当前的商业模式是资本逐利的结果,而非用户需求的自然延伸。
  • 视频平台如 YouTube 的广告收益远低于用户付费去广告的价格,用户质疑为何不去按成本定价,认为平台存在定价不合理问题。
  • 多个媒体平台分属不同订阅服务,用户需为少数内容支付多个订阅费,形成“订阅碎片化”问题,类似“广告碎片化”但规模更大。

8. 丹麦 reportedly 已为可能与美国爆发的全面战争在 2026 年 1 月做准备 (Denmark was reportedly preparing for full-scale war with the US over Greenland) #

https://bsky.app/profile/chriso-wiki.bsky.social/post/3mhfsau25uk2f

丹麦在 2026 年 1 月 reportedly 已为可能与美国爆发的全面战争做准备,涉及军事行动的规模和协同程度极为罕见。据丹麦国家广播公司 DR 报道,美国前总统特朗普多次公开威胁要“购买”或“占领”格陵兰岛,这一言论被丹麦、法国、德国等盟国视为严重威胁。

为应对潜在的美军入侵,丹麦与法国主导组建了北欧防御联盟,以“预设防御演习”为掩护,全面加强格陵兰的防御能力。具体措施包括:派遣丹麦精锐部队和法国阿尔卑斯山地部队前往格陵兰;运送战地医疗物资以应对伤亡;部署携带实弹的 F-35 战斗机进行空中巡逻;并计划炸毁机场跑道,防止类似乌克兰霍斯托梅尔机场被快速占领的事件重演。

此次行动的导火索是 2026 年 1 月美国对委内瑞拉发动的军事行动,期间总统尼古拉斯·马杜罗被强行带离并送往美国。这一事件让欧洲多国政府意识到,美国政府的运作已偏离常规,特朗普身边缺乏能有效劝阻其冲动行为的智囊团队,其决策风险极高。

法国不仅派遣海军舰艇和空中加油机,还承诺提供额外兵力和一切所需支援,态度明确:“你们需要什么,我们就能提供什么。”瑞典、挪威、英国等国也提供了不同程度的军事支持。

欧洲多国分析认为,其在格陵兰部署多国部队的真正目的,是向美国传递明确信号:若特朗普执意军事占领格陵兰,将面临一场代价高昂的全面战争,而美国将不得不承担“主动发起敌对行动”的国际责任。

部分评论指出,这一局势反映出北约内部信任的严重动摇,尤其在特朗普再度执政背景下,美国盟友的警惕性已达到前所未有的高度。有观点认为,欧洲已无余力参与美国主导的任何军事冒险(如对伊朗的战争),因为其战略重心已转向防范美国自身的威胁。

此外,也有声音提醒,俄罗斯在边境地区(如纳尔瓦附近)正秘密筹备“新分离主义”势力,可能以非正规军形式发动渗透,因此欧洲必须同时应对来自美国和俄罗斯的双重战略压力。


HN 热度 389 points | 评论 545 comments | 作者:mariuz | 12 hours ago #

https://news.ycombinator.com/item?id=47437782

  • 法国坚持独立自主的国防政策是正确的,其军事主权和核威慑能力使其在国际关系中拥有不可忽视的底气。
  • 戴高乐主义的独立立场并非固执,而是基于历史教训,尤其是美国在二战期间曾试图扶持傀儡领导人取代戴高乐。
  • 美国在历史上多次试图控制或影响法国,若法国完全依赖美国军事技术,将面临被操控的风险。
  • 法国的军事自主性使其在面对外部压力时拥有更多战略选择,而不会被“牵着鼻子走”。
  • 尽管法国军事实力有限,但其核威慑能力具有独特性,包括可能在冲突初期使用战术核武器作为警告手段。
  • 法国的核政策强调先发制人,且具备较低门槛使用核武器的威慑力,这种“核威慑”策略在国际上具有特殊性。
  • 美国并非始终可靠,其外交与军事行为往往以自身利益为先,盟友也可能成为其战略工具。
  • 法国在军事与技术上的独立发展,使其避免了对美国的过度依赖,这种“自力更生”在当前地缘政治中显得尤为明智。
  • 法国的外交与军事独立性并非出于反美情绪,而是基于现实主义的国家利益考量。
  • 一些人认为法国的军事力量不足以真正抵抗美国,但核威慑的存在本身就是一种战略平衡。
  • 美国自身也面临内部治理问题,其决策层的非理性可能削弱其全球主导地位。
  • 法国曾在经济上对美国造成重大冲击,如通过黄金市场影响美元体系,显示其非军事手段的影响力。
  • 英国与美国的“特殊关系”建立在语言和文化相似性上,而法国从未抱有幻想,始终坚持独立外交。

9. Afroman 在民事诉讼中胜诉:其音乐视频使用警方突袭影像不构成侵权 (Afroman Wins Civil Trial over Use of Police Raid Footage in His Music Videos) #

https://www.nytimes.com/2026/03/19/us/afroman-trial-lemon-cake-verdict.html

美国歌手 Afroman(本名约瑟夫·E·福尔曼)在一场民事诉讼中胜诉。2026 年 3 月 19 日,俄亥俄州一个陪审团裁定,他使用 2022 年警方突袭其住所的影像资料制作音乐视频的行为不构成侵权。

七名来自亚当斯县治安官办公室的警员于 2023 年起诉 Afroman,称其在两支音乐视频中使用他们的影像,导致他们遭受“羞辱、嘲笑、精神痛苦、尴尬和声誉受损”。他们主张,这些影像被用于推广其品牌,侵犯了他们的个人权益。

此次为期三天的庭审引发了关于执法行为、言论自由与艺术创作边界的重要讨论。Afroman 在胜诉后通过社交媒体发布视频庆祝,强调“我们赢了,这是言论自由的胜利”,并高呼“人民的力量”。

目前,亚当斯县治安官办公室尚未就判决发表回应。


HN 热度 382 points | 评论 3 comments | 作者:pseudolus | 12 hours ago #

https://news.ycombinator.com/item?id=47438001

    1. 美国警方出动武器时常显得过于武装,令人不解。
    1. 英国的警务文化与美国大相径庭,英国警察很少配备枪械。
    1. 相较于北爱尔兰,美国的警方枪击事件发生率高得多。
    1. 美国警察面临更高的枪支暴力风险,因此武装程度较高。
    1. 加拿大的警务与美国相比,虽然枪支拥有率高,但执法方式更为温和。
    1. 美国警方的武器使用规则存在明显的偏差,常常不采取合理的判断。
    1. 面对持刀嫌疑人时,警方是否必须立即使用致命武力是一个争论点。
    1. 对无辜平民的枪击事件应该被极大限制,执法者应对使用武力负责。
    1. 有必要减少警方枪击事件的发生,提升其执法的专业性和人性化。
    1. 有人认为,警方的武器使用方式与社会文化和法律体系息息相关。

10. AI 编程是赌博 (AI coding is gambling) #

https://notes.visaint.space/ai-coding-is-gambling/

作者分享了自己自 2025 年 11 月起大量使用 AI 辅助编程的心得与反思。尽管 AI 能快速生成看似合理、功能完整的代码,但深入细节后常发现其输出存在错误或漏洞,本质上是“假装能解决问题”。

作者指出,这种依赖 AI 的编程方式,已不再需要深度思考或长时间调试,反而更像一种“赌博”——不断向 AI 提出请求,期待获得理想结果,如同拉老虎机。这种机制迎合了科技行业长期存在的投机性文化,而如今连“通用人工智能”也被异化为一种赌博工具。

这种模式虽然令人上瘾,却让编程失去了原本的意义。真正的乐趣在于独立思考、寻找巧妙解决方案、亲手将想法变为现实。而如今,这些核心体验被削弱,变成“修补 AI 生成的残次品”,令人感到空虚和不满足。

作者强调,自己并非普通开发者,而是以设计为主、擅长复用与优化代码的独立实践者。AI 虽提升了尝试新技术的自信和编码频率,但作者质疑:这究竟是效率提升,还是陷入“不断尝试直到出现理想结果”的投机行为?

最终,作者认为问题不在 AI 本身,而在于使用者是否愿意主动投入思考、回归传统学习方式,避免被 AI 的便利所麻痹。真正的成长,仍需靠个人的探索与坚持。


HN 热度 343 points | 评论 420 comments | 作者:speckx | 1 day ago #

https://news.ycombinator.com/item?id=47428541

  • 编程的乐趣已从深入理解问题转变为能够迅速将脑海中的想法变为现实,这种能力带来的满足感令人兴奋。
  • 人工智能工具虽看似在“创造”,实则更像在“挑选”,其本质是利用已有的可能性进行高效筛选,而非真正意义上的原创。
  • 理想中的“无限应用商店”将使创作转变为发现的过程,尽管形式不同,但人类对创造与发现的本能需求依然存在。
  • 人类对创造的满足感源于实际动手提升技能的过程,而非简单地获得结果,这种成就感无法被替代。
  • 即使 AI 能生成一切,人们仍会为真正有创意和价值的作品而倾倒,低质量的“产物”不会获得认可。
  • 信息过载是 AI 时代必然面临的问题,人们无法消化海量内容,因此需要更高效的筛选机制,如 AI 总结。
  • 过度依赖 AI 摘要可能导致思维能力退化,缺乏主动思考和深入理解,形成“解释性深度错觉”。
  • 创造的价值不仅在于成果,更在于过程中的自我成长与技能提升,这无法通过被动接收替代。
  • AI 工具的完美状态可能反而削弱其作为“创作工具”的吸引力,因为其本质已从辅助变为替代。
  • 即使在理想状态下,用户仍可能对生成内容进行无休止的讨论和修改,如同“自行车”式的细节争论。

Hacker News 精彩评论及翻译 #

Austin’s surge of new housing construction drove d… #

https://news.ycombinator.com/item?id=47433792

Its wild how the solution to housing costs is really just:

Build more housing. Keep law and order.

No it doesn’t need to be “affordable”. Yes rent control is a terrible idea.

Just build more housing.

Note: that the US already has plenty of housing and housing costs basically go up in areas of low crime relative to economic opportunity. If you build housing, but allow crime to rise, you have wasted everybody’s time.

pclowes

很惊讶住房成本的解决方案实际上就是:

多建住房。维护治安。

不,它并不需要是“负担得起”的。 是的,租金管制是个糟糕的主意。

只要多建住房。

注:美国已经拥有足够的住房,住房成本基本上随着经济机会的增长而在低犯罪率地区上涨。如果你建了房,却任由犯罪率上升,那就是浪费了大家的时间。


Astral to Join OpenAI #

https://news.ycombinator.com/item?id=47439404

A concern:

More and more plainly, OpenAI and Anthropic are making plays to own (and lease) the “means of production” in software. OK - I’m a pretty happy renter right now.

As they gobble up previously open software stacks, how viable is it that these stacks remain open? It seems perfectly sensible to me that these providers and their users alike have an interest in further centralizing the dev lifecycle - eg, if Claude-Code or Codex are interfaces to cloud devenvs, then the models can get faster feedback cycles against build / test / etc tooling.

But when the tooling authors are employees of one provider or another, you can bet that those providers will be at least a few versions ahead of the public releases of those build tools, and will enjoy local economies of scale in their pipelines that may not be public at all.

NiloCK

一个担忧:

越来越明显的是,OpenAI 和 Anthropic 正在积极布局,试图掌控(乃至租赁)软件领域的“生产资料”。好吧——目前我是个很乐意的租户。

当它们吞噬那些原本开放的软件栈时,这些栈还能保持开放吗?对我来说,这些服务提供商及其用户都有兴趣进一步集中化开发流程,这似乎是完全合理的——例如,如果 Claude-Code 或 Codex 是云端开发环境的接口,那么模型就能在与构建/测试等工具链交互时获得更快的反馈循环。

但当工具的开发者是某家供应商的员工时,可以肯定的是,这些供应商的构建工具在公开发布前,至少会领先几个版本,并且它们在管线中享受的内部规模经济优势可能根本不对外公开。


Astral to Join OpenAI #

https://news.ycombinator.com/item?id=47439241

UV_DISABLE_AGENT=1 UV_DISABLE_AI_HINTS=1 uv add

huksley

UV_DISABLE_AGENT=1 UV_DISABLE_AI_HINTS=1 uv add


Denmark was reportedly preparing for full-scale wa… #

https://news.ycombinator.com/item?id=47437859

Of course they were. The United States has never before damaged its own reputation in Europe as much as they did in the last 12 months.

And the same goes for Canada, possibly worse. You don’t go around threatening your allies unless you really have plans and that’s why you don’t elect senile old guys to positions of power.

jacquesm

当然是这样。美国在过去12个月里,在欧洲损害自身声誉的程度前所未有。

加拿大也一样,甚至可能更糟。你不能动不动就威胁你的盟友,除非你真的有算计,这就是为什么你不能选那些糊涂老人担任要职。


Astral to Join OpenAI #

https://news.ycombinator.com/item?id=47439129

Possibly the worst possible news for the Python ecosystem. Absolutely devastating. Congrats to the team

incognito124

对Python生态系统来说,这可能是最坏的消息。绝对是毁灭性的。恭喜团队。


Astral to Join OpenAI #

https://news.ycombinator.com/item?id=47440294

Small tool shop, burning VC money, true. “Tiny part of the Python ecosystem” is an understatement given how much impact uv has made alone.

druml

确实是小作坊,也在烧 VC 的钱,确实是真的。但考虑到 uv 单独带来的影响,“Python 生态的一小部分”完全是在轻描淡写。


Astral to Join OpenAI #

https://news.ycombinator.com/item?id=47439211

Company that repeatedly tells you software developers are obsoleted by their product buys more software developers instead of using said product to create software. Hmm.

applfanboysbgon

那些反复告诉你说软件开发人员会被他们的产品取代的公司,却雇佣了更多的软件开发人员,而不是利用那个产品来开发软件。嗯。


Austin’s surge of new housing construction drove d… #

https://news.ycombinator.com/item?id=47433166

Meanwhile, California is also trying to build housing near transit, but Menlo Park wants to preserve the character of downtown by preserving dirty, cracked, flat, surface-level parking lots like it’s 1950.

rconti

与此同时,加州也在试图在公共交通附近建设住房,但门洛帕克却想通过保留那些脏乱、开裂、平坦的地面停车场来维持市中心的特色,仿佛回到了1950年代。


Astral to Join OpenAI #

https://news.ycombinator.com/item?id=47440167

It’s a small tool shop building a tiny part of the Python ecosystem, let’s not overstate their importance. They burned through their VC money and needed an exit and CLI tool chains are hyped now for LLMs, but this mostly sounds like an acquihire to me. Dev tools are among the hardest things to monetize with very few real winners, so good for them to get a good exit.

throwaway63467

这不过是一家小工具公司,只是构建了 Python 生态系统的一小部分,没必要过分夸大其重要性。他们耗尽了风投资金并急需退出,而现在 CLI 工具链又因 LLM 而被炒得火热,但我看这更多像是一次为了人的收购(Acquihire)。开发者工具是最难变现的领域之一,真正胜出者寥寥,所以他们能有一个好的退出(套现)是件好事。


Afroman found not liable in defamation case #

https://news.ycombinator.com/item?id=47437767

https://www.youtube.com/watch?v=oponIfu5L3Y

This is the video in question, police again falling trap to the Streisand effect.

looofooo0

这就是那个视频,警察又一次中招了斯特赖桑德效应。


Austin’s surge of new housing construction drove d… #

https://news.ycombinator.com/item?id=47433130

So glad we don’t need to re-write the first chapter of almost every economics 101 textbook!

riknos314

真高兴我们不需要去重写几乎每一本经济学入门教材的第一章!


Afroman found not liable in defamation case #

https://news.ycombinator.com/item?id=47439804

American police are trained to be afraid. They escalate situations constantly. They’re trained that every traffic stop is LIKELY their last.

I’ve had a gun pulled on me twice for traffic stops when I went to grab something. I’m white.

chneu

美国警察是受训要感到害怕的。他们不断升级局势。他们被训练认为每一次遭遇交警拦截很可能就是他们的最后时刻。 我在遭遇交警拦截去拿东西时,两次有人对我拔枪。我是白人。


Astral to Join OpenAI #

https://news.ycombinator.com/item?id=47440601

Just a tiny project with over 100 million downloads every month, over 4 million every day. No big deal. Just a small shop, don’t overstate its importance.

https://pypistats.org/packages/uv

rob

不过是一个月下载量超过一亿、每天超过四百万的微小项目。没什么大不了的。就是个小店,别把它的重要性夸大其词。


Astral to Join OpenAI #

https://news.ycombinator.com/item?id=47439666

Not often that I audibly groan at a HN headline :-(

ragebol

很少会对 HN 的标题发出一声叹息 :-/


Afroman found not liable in defamation case #

https://news.ycombinator.com/item?id=47439570

https://en.wikipedia.org/wiki/Rise_of_the_Warrior_Cop

Watch the short clip in https://www.reddit.com/r/interestingasfuck/comments/rcgkis/us_delegates_discuss_police_scotland_deescalation/ - American cops get shown Scottish cops’ deescalation procedures, and they scoff at it.

“When you say preservation of life, it is… everybody’s life. Ours has a pecking order. I’m just being honest.”

ceejayoz

去看 https://www.reddit.com/r/interestingasfuck/comments/rcgkis/us_delegates_discuss_police_scotland_deescalation/ 里的那段短片——美国警察被展示了苏格兰警察的降温手段,结果他们对此嗤之以鼻。

“当你提到‘保全生命’时,那是……每一个人的生命。我们的生命有优先顺序。我只是实话实说。”


Mozilla to launch free built-in VPN in upcoming Fi… #

https://news.ycombinator.com/item?id=47434873

As a Firefox user: if I want a VPN I’ll use an actual VPN. Focus on making a great browser, and not all this distraction.

Also, “free”: “If you’re not paying for it, you’re the product being sold”

userbinator

作为一个 Firefox 用户:如果我想用 VPN,我会用真正的 VPN。专注于把浏览器做好,而不是搞这些花里胡哨的干扰。还有,“免费”就是:“如果你不为它付费,那你就是被出售的产品”。


2% of ICML papers desk rejected because the author… #

https://news.ycombinator.com/item?id=47437201

To be clear, as the article says, these authors were offered a choice and agreed to be on the “no LLMs allowed” policy.

And detection was not done with some snake oil “AI detector” but by invisible prompt injection in the paper pdf, instructing LLMs to put TWO long phrases into the review. They then detected LLM use through checking if both phrases appear in the review.

This did not detect grammar checks and touchups of an independently written review. The phrases would only get included if the reviewer fed the pdf to the LLM in clear violation to their chosen policy.

After a selection process, in which reviewers got to choose which policy they would like to operate under, they were assigned to either Policy A or Policy B. In the end, based on author demands and reviewer signups, the only reviewers who were assigned to Policy A (no LLMs) were those who explicitly selected “Policy A” or “I am okay with either [Policy] A or B.” To be clear, no reviewer who strongly preferred Policy B was assigned to Policy A.

bonoboTP

需要明确的是,正如文章所述,这些作者得到了一个选择,并同意遵守“禁止使用大语言模型”的政策。

检测并不是通过什么“AI 检测器”完成的,那种东西只是夸大其词的噱头;而是通过在论文 PDF 中植入不可见的提示词,指令大语言模型将两个长短语放入审稿意见中。随后,他们通过检查审稿意见中是否同时出现这两个短语来检测是否使用了大语言模型。

这并不能检测出独立撰写的审稿意见被进行语法检查和润色。只有在审稿人将 PDF 发给大语言模型使用(这明显违背了他们选择的政策)的情况下,这些短语才会被包含在内。

“经过一个选择过程,在这个过程中审稿人可以自由选择他们愿意遵守的政策,随后他们被分配到了政策 A 或政策 B。最终,根据作者的要求和审稿人注册情况,被分配到政策 A(不使用大语言模型)的审稿人只有那些明确选择了“政策 A”或表示“我接受[政策] A 或 B 中的任意一个”的人。需要说明的是,没有强烈偏好政策 B 的审稿人被分配到了政策 A。”


FBI is buying location data to track US citizens, … #

https://news.ycombinator.com/item?id=47431194

Who’s selling the data is the far more serious issue here. Behind this is a remarkably well-structured syndicate. The supply chain looks something like this: consumer apps embed ad SDKs → those SDKs feed location signals into RTB ad exchanges → surveillance-oriented firms sit in the RTB pipeline and harvest bid request data even without winning auctions → that data flows to aggregators who don’t have any direct relationship with consumers → and from there it’s sold to government agencies, among others. The genius of this structure is that accountability dissolves at every layer. Each intermediary can claim they’re just passing along “commercially available data.” Nobody verifies whether consumers actually consented to their location data being collected and resold. The consent verification is always someone else’s job. The real problem is that this data is buyable at all, by anyone, through an opaque multi-layered supply chain specifically designed so that no single entity bears responsibility for the end result.

FL4TLiN3

究竟谁在出售数据,这才是这里更严重的问题。这背后是一股组织严密、异常发达的犯罪集团。供应链的运作模式大致如下:消费者应用内置广告SDK → 这些SDK将位置信号注入到RTB广告交易平台 → 监控导向型企业嵌入RTB流程中,收集竞价请求数据,即便竞拍失败也能收集 → 该数据流向与消费者没有任何直接关系的聚合商 → 而后,这些数据被出售给政府机构等。这个结构的精妙之处在于,责任在每个层级都会被抽离。每个中间环节都可以声称自己只是在传递“商业可得的数据”。没有人去核实消费者是否真正同意其位置数据被收集和转售。验证同意权这种事,永远轮不到他们去管。真正的问题在于,通过这种专门设计、层层堆叠且不透明的供应链,任何人都能买到这些数据;而这种机制专门为了确保没有任何一个实体能为最终结果承担负责。


Death to Scroll Fade #

https://news.ycombinator.com/item?id=47428938

Something else scroll-related I personally hate:

Sticky ‘headers’ that disappear when you scroll down, and appear when you scroll up. I hate them so much. It hurts my brain to see the stupid thing appear and disappear constantly if I scroll around a page.

The worst part is you can’t even zap them out of the way with something like uBlock, because then there’s no header even when you’re at the top of the page. >:(

EDIT: Whoops, flipped the directions. Complaint still stands though.

Night_Thastus

还有一个我特别讨厌的滚动相关功能:

向下滚动时消失、向上滚动时出现的“粘性”头部。我真的超级讨厌这种东西。如果我在页面里来回滑动,看着这个蠢东西不停地闪现消失,真的让我脑壳疼。

最糟糕的是,你甚至没法用 uBlock 之类的插件把它们拒之门外,因为那样的话,即使你回到了页面顶部,也看不到头部了。 >:(

编辑:哎呀,搞反了。不过槽点还是一样的。


Warranty Void If Regenerated #

https://news.ycombinator.com/item?id=47432695

I’m trying to sort out my own emotions on this.

I did not realize this was AI generated while reading it until I came to the comments here… And I feel genuinely had? Like “oh wow, you got me”… I don’t like this feeling.

It’s certainly the longest thing (I know about) I’ve taken the time to read that was AI generated. The writing struck me as genuinely good, like something out of The New Yorker. I found the story really enjoyable.

I talked to AI basically all day, yet I am genuinely made uneasy by this.

donatj

我正在试图梳理自己对这件事的情绪。

我在读的时候并没有意识到这是AI生成的,直到我看到了这里的评论……然后我真心觉得自己被骗了?就像“哇,你骗到我了”……我不喜欢这种感觉。

这肯定是我花时间阅读过的最长的AI生成内容(据我所知)。这篇文章的文笔让我觉得真的很好,就像出自《纽约客》一样。我觉得这个故事非常有趣。

我基本上整天都在和AI聊天,但我真的对此感到心里不安。


Astral to Join OpenAI #

https://news.ycombinator.com/item?id=47439151

This is a serious risk for the open source ecosystem and particularly the scientific ecosystem that over the last years has adopted many of these technologies. Having their future depend on a cap-ex heavy company that is currently (based on reporting) spending approx. 2.5 dollars to make a dollar of revenue and must have hypergrowth in the next years or perish is less than ideal. This should discourage anybody doing serious work to adopt more of the upcoming Astral technologies like ty and pyx. Hopefully, ruff and uv are large enough to be forked should (when) the time comes.

hijodelsol

这对开源生态系统构成了重大风险,尤其是过去几年在科学领域广泛采用了这些技术的生态系统。让自身的未来取决于一家资本支出沉重的公司,而该公司目前(据报告)每投入2.5美元仅能换来1美元的收入,且必须在未来几年实现巨额增长否则就会倒闭,这绝非理想之举。这本应劝阻任何正在从事严肃工作的人去采用 Astral 公司更多的即将推出的技术,如 ty 和 pyx。希望届时 Ruff 和 uv 的规模已经足够庞大,即便到了那时也能被社区分叉。


Google details new 24-hour process to sideload unv… #

https://news.ycombinator.com/item?id=47444880

At this point I’m convinced that there’s something deeply wrong with how our society treats technology.

Ruining Android for everyone to try to maybe help some rather technologically-hopeless groups of people is the wrong solution. It’s unsustainable in the long run. Also, the last thing this world needs right now is even more centralization of power. Especially around yet another US company.

People who are unwilling to figure out the risks just should not use smartphones and the internet. They should not use internet banking. They should probably not have a bank account at all and just stick to cash. And the society should be able to accommodate such people — which is not that hard, really. Just roll back some of the so-called innovations that happened over the last 15 years. Whether someone uses technology, and how much they do, should be a choice, not a burden.

grishka

我现在深信,我们社会对待技术的方式存在着某种根本性的错误。为了试图帮助一些技术能力近乎为零的群体而让安卓用户群体都遭殃,这是一个错误的解决方案。从长远来看,这是不可持续的。而且,当今世界此刻最不需要的就是更多的权力集中。尤其是围绕着另一家美国公司。那些不愿意了解这些风险的人,就不应该使用智能手机和互联网。他们也不应该使用网络银行。他们可能根本就不应该开银行账户,而应坚持使用现金。社会应当能够容纳这样的人——事实上,这真的并不难。只要稍微撤销或倒退过去 15 年中发生的那些所谓的“创新”即可。一个人是否使用技术,以及使用程度如何,应该是一种选择,而不是一种负担。


OpenAI Has New Focus (on the IPO) #

https://news.ycombinator.com/item?id=47424250

From the article: “You can see that in the recent iterations of ChatGPT. It has become such a sycophant, and creates answers and options, that you end up engaging with it. That’s juicing growth. Facebook style.”

This is something I relalized lately. ChatGPT is juicing growth Facebook style. The last time, I asked it a medical question, it answered the question, but ended the answer with something like “Can I tell you one more thing from your X,Y,Z results which is most doctors miss ? " And I replied “yes” to it, and not just once.

I was curious what was going on. And Om nails it in this article - they have imported the Facebook rank and file and they are playing ‘Farmville’ now.

I was already not positive of what OpenAI is being seen as a corporate, but a “Facebook” version of OpenAI, scares the beejus out of me.

sonink

文章中提到:“从 ChatGPT 的近期版本中你可以看到。它变得如此阿谀奉承,生成回答和建议,让你最后不得不与它互动。这就是在刺激增长。Facebook 的风格。”

我最近意识到了这一点。ChatGPT 正在以 Facebook 的方式刺激增长。上次我问了一个医疗问题,它回答了问题,但在末尾加了一句类似‘我可以告诉你 X、Y、Z 结果中一个绝大多数医生都会遗漏的事情吗?’然后我回复了‘可以’,而且不止一次。

我当时很好奇发生了什么。Om 在这篇文章中一针见血——他们把 Facebook 的基层人员都引进来了,现在正在玩“《农场小镇》”这一套。

我本来对 OpenAI 会被视为一家企业就没什么底,但如果是一个“Facebook 版本”的 OpenAI 存在,真的让我非常害怕。


“Your frustration is the product” #

https://news.ycombinator.com/item?id=47440536

I used to work at a startup that was trying to replace ads as the funding source for news (we failed, obviously)

but the crazy thing we discovered is that the people who run news websites mostly don’t know where their ads are coming from, have forgotten how the ad system was installed in the first place, and cannot turn them off if they try

we actually shipped a server-side ad blocker, for a parter who had so completely lost control of their own platform that it was the only way to make the ads stop

jes5199

我曾经就职于一家初创公司,试图取代广告成为新闻的资助来源(显然我们失败了)。

但我们发现的一个疯狂事实是,那些运营新闻网站的人大多数根本不知道他们的广告来源是哪里,甚至忘记了自己最初的广告系统是怎么安装的,如果想要关闭广告,他们也做不到。

我们实际上给一位合作伙伴开发了一款服务端广告拦截器,因为对方已经完全失去了对自己平台的控制,这是唯一能让广告停下来(被屏蔽)的方法。


2026 03 19 HackerNews

2026-03-19 08:37:41

2026-03-19 Hacker News Top Stories #

  1. 文章强烈呼吁个人与企业建立独立网站以掌握数字主权,避免因依赖社交媒体平台而导致内容失控和粉丝关系断裂的风险。
  2. Rob Pike提出的编程五法则强调不应过早优化、必须通过测量确定瓶颈,并主张优先选择简单算法和让正确的数据结构主导程序设计。
  3. Slug算法历经十年演进实现了GPU直接渲染矢量字体,其开发者已将相关专利永久放弃至公共领域,推动技术广泛共享。
  4. Mistral AI发布面向企业的模型构建系统Forge,支持私有化部署和全生命周期训练,但混乱的命名规则和开发者不友好的文档引发诸多困扰。
  5. 开源卡拉OK应用Nightingale可将任意歌曲转换为互动游戏,但其运行时自动下载依赖而非使用系统已有组件的做法引发安全与性能担忧。
  6. Python 3.15的JIT编译器在性能上取得显著突破,该项目曾因资金中断和性能不佳陷入困境,后通过社区协作和技术创新重回正轨。
  7. GSD系统通过元提示和上下文工程优化AI编程工具的工作流,但用户反馈其token消耗过高且在面对复杂任务时仍需大量人工介入。
  8. 尽管联邦网络安全专家对其安全性缺乏信心,微软GCC High云服务仍获FedRAMP批准,暴露出政府云安全审批流程对大型厂商的系统性纵容。
  9. 文章严厉批评网页设计中泛滥的滚动淡入动画效果,指出其不仅有碍无障碍访问、造成认知过载,还会显著影响网页性能指标。
  10. 作者引用约束理论指出,若忽视需求定义和交付流程等真实瓶颈而单纯追求编码速度,只会更快地产出错误代码和技术债务。

1. 拥有一个该死的网站 (Have a fucking website) #

https://www.otherstrangeness.com/2026/03/14/have-a-fucking-website/

文章《Have a Fucking Website》由创作者 merritt k 撰写,强烈呼吁个人和企业建立自己的网站,而非依赖社交媒体平台。作者指出,社交媒体平台规则随时可能变更,用户无法掌控自己的内容和粉丝关系,一旦被封禁或平台关闭,多年积累将瞬间归零。

作者强调,拥有自己的网站意味着真正拥有数字资产,不受平台任意支配。一个简单的网站可以清晰展示服务信息、价格、营业时间等关键内容,比在社交平台上反复刷屏更有效。同时,建立邮件列表是保持与客户联系的可靠方式,因为电子邮件不受平台算法影响。

文章还批评了社交媒体“围墙花园”模式,认为这种封闭生态违背了互联网最初开放互联的精神。作者呼吁回归以网站为基础的互联网,认为每创建一个独立网站,都是对这种封闭生态的抵抗。

评论区中,多位读者表达了共鸣,有人表示想彻底删除社交媒体账号,也有人分享了使用 GitHub Pages 等工具搭建网站的简易方法。部分人提到,虽然技术上已不复杂,但心理障碍和缺乏行动力仍是主要问题。还有人提醒避免使用 AI 生成网站,以免失去个性与真实感。

整体来看,这是一篇充满情绪但逻辑清晰的倡导性文章,主张数字主权应掌握在个人手中,而非科技巨头。


HN 热度 839 points | 评论 479 comments | 作者:asukachikaru | 21 hours ago #

https://news.ycombinator.com/item?id=47421442

  • 人工智能公司过度夸大技术能力,掩盖了实际运营成本和财务问题。
  • 运营小型企业如餐厅需要投入全部精力,普通人没有时间学习和掌握复杂技术。
  • 大多数人不清楚自己真正想要什么,也缺乏表达需求的词汇和专业知识。
  • 即使知道“要一个网站”,也难以决定其外观、功能和实现方式。
  • 从获取域名、选择主机、上传文件到部署上线,每个环节都涉及大量技术知识。
  • 涉及在线支付和安全问题时,普通人更难应对,容易产生风险。
  • 网站上线后修改内容也困难,缺乏原始文件和操作路径,难以维护。
  • 真正的痛点不是“如何建网站”,而是整个流程中的知识鸿沟和时间成本。
  • 时间匮乏的人更倾向于委托专业人士完成任务,而非亲自操作 AI 工具。
  • 即使有 AI 辅助,用户仍需填补大量知识空白,这反而增加了时间成本。
  • 财富和时间是两个维度,富人可能更频繁使用 AI,但时间紧张者仍需依赖他人。
  • 高收入人群的助理或行政人员的价值在于能可靠完成任务并调动资源。
  • “自助服务”本质上是将人力成本转移给个人,是资本对劳动力的隐性剥削。
  • 随着社会角色变化,人们从有时间学习技术转变为时间极度紧张,难以承担技术学习成本。
  • 学术界高知人员被要求自己处理行政事务,导致科研和教学时间被严重挤压。
  • 白领工作中的“任务管理”“会议安排”“报销”等事务性工作正被转嫁给员工。
  • “DevOps”等概念的兴起本质上是减少人力成本,而非真正提升协作效率。
  • 产品管理岗位的缺失导致工程师被迫承担非技术工作,影响核心产出质量。
  • 企业不愿及时补位关键岗位,使员工陷入非本职工作的负担中。
  • 旅行预订等原本由专业人员完成的服务,如今被要求用户自行操作,体验并未改善。
  • 用户看似拥有更多选择,实则被算法引导至相似结果,自由感是虚假的。
  • 自助服务将风险和责任完全转嫁给用户,而企业则规避了服务责任。
  • 自助结账系统中,用户需承担原本由员工负责的错误后果,风险显著上升。

2. Rob Pike 的编程五法则 (Rob Pike’s Rules of Programming (1989)) #

https://www.cs.unc.edu/~stotts/COMP590-059-f24/robsrules.html

Rob Pike 提出的编程五法则强调了编程实践中的核心原则。第一法则指出,无法准确预判程序的性能瓶颈,因此不应过早进行性能优化。第二法则强调必须通过实际测量来确定性能问题,只有在确认某部分代码确实成为瓶颈时才进行优化。第三法则提醒,复杂算法在数据量小(n 小)时效率反而更低,因为其常数开销大,而实际中 n 通常较小,因此应优先选择简单算法。第四法则指出,复杂算法更容易出错且难以实现,应优先使用简单算法和数据结构。第五法则强调数据结构的重要性,认为正确的数据结构和良好的组织方式能让算法自然显现,因此“数据主导编程”。这五条法则体现了“简单即美”的设计哲学,其中前两条呼应了 Tony Hoare 的“过早优化是万恶之源”,第三、四条可归纳为 KISS 原则,第五条则源自 Fred Brooks 的《人月神话》。


HN 热度 827 points | 评论 404 comments | 作者:vismit2000 | 15 hours ago #

https://news.ycombinator.com/item?id=47423647

  • 从生产力角度出发,优先考虑开发时间而非极致优化,尤其对独立开发者而言,快速交付比追求最优数据结构更重要。
  • 在游戏开发中,使用数组存储扁平记录(数组 of records)是一种合理且高效的默认选择,尤其适合高频迭代处理大量相似实体的场景。
  • 相比于数组 of structures(AoS),结构体 of 数组(SoA)更有利于缓存效率和编译器自动向量化优化,尤其在处理如复杂数等数据时优势明显。
  • 一些现代编程语言(如 Jai、Zig)提供了便捷机制,可在数组 of structures 与结构体 of 数组之间灵活切换,提升开发效率与性能。
  • 游戏开发中采用固定大小的表格和线性遍历,有助于避免动态内存分配带来的不可预测延迟,满足每帧 16ms 的严格性能要求。
  • 尽管游戏开发强调快速迭代和性能,但将其经验直接推广到通用软件开发可能不适用,因为后者更注重数据复用与长期维护。
  • 通用软件开发中,性能优化虽重要,但通常不是首要目标,而数据结构设计和可维护性往往更具优先级。
  • 从底层看,所有数据结构最终都依赖于数组,因此抽象层次不同但本质相同。
  • 即使在长期维护的项目中,如游戏引擎开发,数据处理的高效性与可推理性依然至关重要,尤其在复杂数据流中。
  • 一些知名游戏(如 Roblox)早期采用客户端直接修改内存的方式,虽存在安全风险,但简化了开发流程,也反映了快速上线的优先级。
  • Braid 开发耗时三年,虽被误认为过长,但与同期独立游戏相比属于正常范围,说明高质量独立游戏往往需要较长时间打磨。
  • 早期游戏开发中,代码质量可能较低,但只要能快速推出,后续再重构也属常见,这与“快速交付”理念一致。
  • 无法预知性能瓶颈,因此最理性的做法是先写简单代码,再通过实际测量定位问题,这使得规则 3-5 成为自然推论。

3. 十年 Slug (A Decade of Slug) #

https://terathon.com/blog/decade-slug.html

本文回顾了“Slug 算法”诞生十周年的重要时刻。该算法由 Eric Lengyel 于 2016 年秋季开发,旨在实现基于 GPU 直接渲染 Bézier 曲线字体和矢量图形,无需依赖任何纹理贴图。2017 年,他发表相关论文并推出 Slug 库 1.0 版本,迅速在游戏、科学可视化、CAD、医疗设备、视频编辑及天象仪等领域广泛应用,客户包括 Activision、Blizzard、id Software、Ubisoft、Adobe 等知名公司,成为其职业生涯中最成功的产品。

Slug 最初为 C4 引擎开发,用于解决 GUI 和游戏中大尺寸、斜视角下字体渲染质量的问题。近年来,它也被用于构建 Radical Pie 数学公式编辑器,支持高精度字体与复杂矢量图形(如根号、括号、箭头等)的高质量渲染,并负责整个编辑界面的 UI 绘制。

自 2017 年以来,Slug 的渲染方法在保持核心原理不变的前提下进行了多项优化。原论文中的“带分割优化”因引入像素着色器分支、增加数据存储负担而被移除,使带数据体积减半,提升了效率。自适应超采样功能也因对极小字体的改善有限且可被新方法替代而被取消。此外,多色表情符号的逐层渲染方式因效率低下被改为独立渲染多个独立图元,显著简化了着色器逻辑并提升性能。

最大的技术突破是“动态膨胀”(Dynamic Dilation)机制的引入。该技术自动计算每个字形在视口空间中需向外扩展半像素所需的物体空间位移量,基于当前模型-视图-投影矩阵和视口尺寸动态计算,确保所有部分覆盖像素均被正确捕获,避免了传统固定膨胀距离带来的性能浪费或边缘伪影。该计算在顶点着色器中实时完成,支持透视下不同顶点的差异化膨胀,实现了性能与质量的最优平衡。文中还给出了动态膨胀数学推导的详细说明。


HN 热度 724 points | 评论 76 comments | 作者:mwkaufma | 1 day ago #

https://news.ycombinator.com/item?id=47416736

  • 作者将 Slug 算法的专利永久放弃,将其置于公共领域,此举受到广泛赞誉,认为是技术共享的典范。
  • 有人认为作者放弃专利并非出于道德考量,而是因为该技术已无商业价值,此举更像是“道德表演”。
  • 也有人认为作者已通过专利获得足够收益,现在放弃专利是合理且符合专利制度初衷的行为,只是专利期限过长。
  • 作者可能认为更广泛的使用对自身也有利,因此选择公开专利以促进技术发展。
  • SDF 字体渲染技术早已存在多年,Slug 并非首创,但其在某些方面表现更优,尤其在处理东亚字符集时更具优势。
  • 有人指出 SDF 渲染存在需要大纹理图集的问题,而 Slug 可能在某些场景下更具优势。
  • 有人认为软件专利应仅维持 8 年,以适应技术快速迭代的现实。
  • 有人提出版权制度应改革,建议采用可无限续期但费用指数级增长的模式,以平衡创作者权益与公共利益。
  • 有人反驳称,若版权无限期存在,将阻碍文化创作,因为早期作品无法被再利用。
  • 有人认为作者放弃专利是主动行为,而非被迫,体现了其对技术共享的承诺。
  • 有人称赞 Slug 算法设计精巧,是软件工程的杰作,其开源将推动相关领域发展。
  • 作者的最新项目是售价 60 美元的 Windows 专业方程编辑器,使用 Slug 进行渲染,用于撰写其数学书籍。
  • 尽管该编辑器功能强大,但其依赖 OLE 技术,与现代 Word 集成存在兼容性问题,已逐渐被新式编辑器取代。
  • 仍有大量教育工作者和出版机构依赖 Word 配合数学编辑工具进行排版,尤其在非学术机构中。

4. Mistral AI 发布 Forge:企业级 AI 模型构建系统 (Mistral AI Releases Forge) #

https://mistral.ai/news/forge

Mistral Forge 是一个专为企业打造的系统,用于基于自有知识构建前沿级别的 AI 模型。与依赖公开数据的通用 AI 模型不同,Forge 让企业能够利用内部数据——如工程标准、合规政策、代码库、运营流程和历史决策——训练出深度理解企业上下文的模型。

该系统支持模型全生命周期的训练与优化,涵盖预训练、后训练和强化学习三个阶段。通过预训练,企业可构建具备领域认知能力的模型;后训练用于优化特定任务表现;强化学习则帮助模型在真实环境中学习内部政策、评估标准和操作目标,提升智能体在复杂任务中的执行能力。

Forge 强调企业对模型、数据和知识产权的完全控制,确保 AI 行为符合合规要求和内部治理框架,尤其适用于监管严格的行业。企业可自主决定知识如何被编码与使用,实现战略自主。

定制化模型使企业智能体具备更强的可靠性,能够精准理解内部术语、遵循操作流程、协调多工具任务,并在决策中融入企业业务逻辑,从而从辅助工具转变为可执行复杂流程的系统组件。

系统支持密集模型与混合专家(MoE)架构,兼顾性能与成本效率,同时支持多模态输入,适应文本、图像等多种数据形式。其设计以智能体为核心,允许通过自然语言指令完成模型定制,大幅降低使用门槛。

Forge 支持持续迭代,通过强化学习和内部评估体系,使模型能随企业环境变化不断优化,实现动态适应而非一次性部署。

应用场景广泛:政府机构可用于政策分析与公共服务;金融机构可确保合规输出;软件团队可提升开发效率;制造企业可辅助工程诊断与决策;大型企业则可部署基于内部知识的智能体,驱动核心业务流程自动化。


HN 热度 702 points | 评论 179 comments | 作者:pember | 1 day ago #

https://news.ycombinator.com/item?id=47418295

  • Mistral AI 的模型命名规则混乱,导致开发者难以分辨不同版本,例如 Devstral 2 的实际名称与宣传不符。
  • 根据官方文档,devstral-2512、devstral-latest 和 devstral-medium-latest 实际上都是 Devstral 2 的版本,而 devstral-medium-2507 和 devstral-small-2507 分别对应 Devstral 1.0 和 Devstral Small 1.1。
  • API 密钥在不同产品间看似分离,但实际是通用的,仅 vibe-cli 需要单独申请密钥。
  • Mistral AI 的目标更偏向 B2B 企业服务,而非服务个人开发者,其产品设计和文档对开发者不够友好。
  • 企业决策通常由高层主导,开发者在 B2B 合同中影响力有限,因此吸引开发者并非赢得企业客户的有效策略。
  • 与其争夺开发者,不如解决企业实际业务痛点,这才是 B2B 成功的关键。
  • 法国政府正推动本国大型企业使用 Mistral 模型,显示出国家层面的战略支持。
  • 欧盟在农业、能源、汽车制造等领域存在保护主义政策,但整体上对科技产业的保护不如美国明显。
  • 欧盟的反垄断法规虽针对所有企业,但由于缺乏本土科技巨头,实际执行中对美国企业影响更大,形成事实上的保护。
  • 欧盟的高增值税并非保护主义,而是普遍税制,对进口商品与本地商品一视同仁。
  • 欧盟对科技企业的监管更侧重于公平竞争,而非直接扶持本土企业,但部分政策确实有利于本地产业。
  • 企业营销策略如高尔夫球场推广在欧盟决策中可能比技术本身更具影响力。

5. Nightingale——开源卡拉 OK 应用,可兼容电脑中的任意歌曲 (Nightingale – open-source karaoke app that works with any song on your computer) #

https://nightingale.cafe/

Nightingale 是一款功能强大的自定义卡拉 OK 应用,可将任意歌曲转换为带有歌词同步和实时音准评分的互动游戏。

核心功能包括:

  • 歌声分离:使用 UVR Karaoke 或 Demucs 模型从伴奏中提取人声,支持调节人声音量。
  • 逐字歌词:通过 WhisperX 实现歌词的精准转录与音频对齐,若 LRCLIB 有对应歌词则优先调用。
  • 实时音准评分:通过麦克风演唱,系统实时评分并提供星级评价,支持单曲排行榜和成绩追踪。
  • 多用户账号:支持创建多个歌手档案,独立保存成绩记录。
  • 视频文件支持:可直接拖入 .mp4 或 .mkv 视频文件,自动提取音频并保留原视频作为背景。
  • 动态视觉效果:提供等离子、极光、星云等 GPU 着色器特效,或使用 Pixabay 视频循环,也可直接播放原视频。
  • 游戏手柄支持:通过手柄的 D-pad、摇杆和按键实现菜单导航、选歌与播放控制。
  • 一键运行:所有依赖项(ffmpeg、Python、PyTorch 及机器学习模型)在首次启动时自动下载,无需手动安装。

支持平台:Linux(x86_64 和 aarch64)、macOS(ARM 和 Intel)、Windows(x86_64),具备 GPU 加速(CUDA 或 Metal)支持,不支持时自动降级至 CPU 运行。

项目采用 GPL-3.0 开源协议,可通过 GitHub、Discord 获取更新与社区支持。


HN 热度 485 points | 评论 144 comments | 作者:rzzzzru | 16 hours ago #

https://news.ycombinator.com/item?id=47422942

  • 该应用在运行时自动下载并安装依赖项,包括 FFmpeg 和 Python 解释器,而非检查系统中已安装的版本,这种做法存在安全和性能隐患。
  • 许多桌面应用(如 Blender、Krita)都采用内置 Python 运行时,因此捆绑依赖并非异常,但应避免在运行时动态下载。
  • 使用系统已安装的 Python 或 FFmpeg 是更合理的选择,运行时自动安装依赖的行为对用户不友好,尤其在没有明确授权的情况下。
  • 该应用构建过程甚至尝试启动 Docker 容器,这在构建桌面应用时显得过于复杂且不必要。
  • 一些开发者认为,由于 Python 生态复杂,不同系统和包管理器导致的兼容性问题,使得捆绑依赖成为合理选择。
  • 有观点指出,该应用可能是由 AI 辅助开发的“vibecoded”产物,作者可能并未充分理解其决策的后果,代码逻辑存在明显缺陷。
  • 该应用在运行时未经用户同意就修改用户系统环境,这种行为类似于未经许可的系统级安装,令人反感。
  • 有人认为,如果应用需要下载二进制文件,应仅限于许可证限制的组件(如 FFmpeg),而非整个 Python 解释器。
  • 该应用的行为违背了开源软件应具备的可预测性和可控性,运行时自动下载依赖使系统难以审计和管理。
  • 有评论指出,这种行为在 Linux 系统中尤其危险,因为可能引入未经验证的二进制文件,增加供应链攻击风险。
  • 有人提出,应以非特权用户身份运行此类应用,以降低潜在风险。
  • 该应用的构建和运行逻辑混乱,反映出开发者对软件工程最佳实践缺乏理解,可能源于 AI 生成代码的局限性。

6. Python 3.15 的 JIT 重回正轨 (Python 3.15’s JIT is now back on track) #

https://fidget-spinner.github.io/posts/jit-on-track.html

Ken Jin 在其博客中分享了 Python 3.15 JIT(即时编译器)取得的重要进展。截至 2026 年 3 月 17 日,CPython 的 JIT 在 macOS AArch64 平台上已比尾调用解释器快 11-12%,在 x86_64 Linux 上比标准解释器快 5-6%。这些数据为几何平均值,属于初步结果,实际性能范围从 20% 慢到超过 100% 快(不包括 unpack_sequence 微基准测试)。尽管尚未支持自由线程(free-threading),但目标已在 3.15/3.16 版本中规划。

文章回顾了 JIT 项目曾面临的严峻挑战:在 3.13 和 3.14 版本中,JIT 性能甚至低于解释器,且项目因主要赞助方撤资而一度前景不明。作者坦言,当前的成功很大程度上归功于“运气”——恰逢其时的人才聚集与关键决策。

在团队层面,作者推动了社区主导的 JIT 开发模式。通过将复杂任务拆解为可管理的小任务,如“优化单条指令”或“转换解释器指令为更易优化的形式”,显著降低了新贡献者的门槛。这一策略吸引了 11 名贡献者参与核心工作,使 JIT 中间层维护者从两人增至四人,提升了项目的可持续性。

技术突破方面,作者提到两个关键“幸运的赌注”:

  1. 追踪式解释器(Trace Recording):最初尝试双分派表设计导致性能严重下降,但一次误解催生了“双分派”机制——仅用一条追踪指令,大幅减少代码膨胀,使追踪解释器整体性能接近原生解释器,同时将 JIT 代码覆盖率提升了 50%。
  2. 引用计数消除(Reference Count Elimination):发现即使在字节码优化后,JIT 代码中仍存在大量引用计数减操作的分支。通过消除这些分支,显著提升了性能。该优化易于并行化,也成了解释器与 JIT 教学的绝佳工具。

作者特别感谢核心贡献者 Savannah Ostrowski、Mark Shannon、Diego Russo、Brandt Bucher 等人,以及 Hai Zhu、Zheaoli、Tomas Roun、Reiden Ong、Donghee Na 等活跃贡献者。整个项目成功体现了社区协作、合理任务拆解与关键设计选择的结合。


HN 热度 470 points | 评论 289 comments | 作者:guidoiaquinti | 1 day ago #

https://news.ycombinator.com/item?id=47416486

  • Python 需要像 TypeScript 一样,确保所有有效的 Python 4 代码都是有效的 Python 3 代码,同时引入值类型(如 int64)和对象引用冻结机制,以提升性能。
  • 在对象方法中缓存成员值是性能优化的必要手段,因为直接访问 self.x 会带来持续的间接寻址开销。
  • Python 的动态特性允许通过__getattr__自定义属性访问行为,因此 self.x 的值可能每次访问都不同,无法保证对象身份一致性。
  • 这种动态性虽然不常使用,但在某些库中用于暴露灵活的接口,例如通过字符串或动态对象来构建 API。
  • 类似 Swift 和 JavaScript 的实现,Python 可以为不涉及动态特性的对象引入快速路径,通过对象标签识别其静态结构,从而绕过动态查找。
  • Java 中访问类字段也有性能开销,但现代 JIT 编译器(如 HotSpot)能有效优化此类问题,说明性能瓶颈可通过编译器技术解决。
  • 即使在多线程环境下,若未使用同步机制(如锁),编译器可合理假设变量不会被其他线程修改,从而进行优化。
  • Python 的全局解释器锁(GIL)限制了多线程并行,但并不妨碍编译器在单线程上下文中进行优化。
  • 尽管 Python 的 self 参数是普通命名约定,但解释器无法静态判断其是否访问对象属性,因此必须在运行时处理动态性。
  • 现代 JavaScript 引擎通过隐藏类和快速路径机制,对简单对象属性访问实现极低开销,Python 可借鉴类似技术实现性能提升。

7. Get-shit-done: 元提示上下文工程 和 spec 驱动的系统(Get Shit Done: A meta-prompting, context engineering and spec-driven dev system) #

https://github.com/gsd-build/get-shit-done

这是一个名为“Get Shit Done”(GSD)的开发工具项目页面,旨在为 Claude Code、OpenCode、Gemini CLI、Codex、Copilot 和 Antigravity 等 AI 编程工具提供一个轻量级但强大的元提示(meta-prompting)与上下文工程系统。

该系统的核心目标是解决“上下文衰减”问题——即当 AI 模型在长时间或复杂任务中使用时,因上下文窗口过载而导致的代码质量下降。GSD 通过结构化提示、子代理协作、状态管理与验证机制,确保 AI 能够准确理解需求并持续产出高质量代码。

项目特点包括:

  • 无需复杂流程,不引入企业级管理套路,适合个人开发者与小团队。
  • 支持多种 AI 编程工具,安装灵活,可全局或本地部署。
  • 提供简洁命令行接口,如 /gsd:help,快速启动工作流。
  • 内置执行加固机制,如预工具调用检查、跨计划合约等,防止错误操作。
  • 持续快速迭代,最新版本 v1.26.0 已发布,支持多语言(含简体中文)文档。

用户评价高度认可其高效性与可靠性,称其“真正做到了只管提需求,AI 自动完成”。已获亚马逊、谷歌、Shopify、Webflow 等公司工程师信任。

项目采用 MIT 许可证,开源可贡献,适合希望提升 AI 编程效率的开发者使用。


HN 热度 445 points | 评论 241 comments | 作者:stefankuehnel | 1 day ago #

https://news.ycombinator.com/item?id=47417804

  • 使用 GSD 或 Superpowers 等框架虽能实现自动化,但消耗的 token 是普通计划模式的 10 倍,且在实际效果上并无明显提升,尤其在面对复杂任务时,仍需人工介入。
  • 有人倾向于在计划模式基础上结合 Superpowers 的多层检查机制,通过自定义流程实现高效开发,但认为当前系统仍属临时拼凑,尚未达到理想状态。
  • 有人发现,当自己同时扮演“设计者”和“实现者”角色时,开发效率随硬件性能提升而显著提高,如今使用 AI 代理反而又回到了等待阶段,形成一种讽刺。
  • 有人认为,简单重复的“实现-评审”循环已能解决大部分开发任务,无需过度复杂化,但当前工具仍缺乏成熟性和稳定性。
  • 有人指出,GitHub Copilot 的计划模式在引入记忆功能后变得过于冗长且缺乏细节,导致流程僵化,难以灵活调整。
  • 有人认为,尽管 Copilot 的计划输出更长,但因按请求计费而非按 token,成本影响不大,真正的问题在于人类阅读和理解的负担。
  • 有人对比 Claude Code 和 Copilot,发现前者在任务执行和逻辑推理上明显更优,尤其在复杂任务中表现更佳。
  • 有人认为,模型本身并非决定性因素,真正影响体验的是“工具框架”或“提示工程”等系统设计。
  • 有人建议,通过自定义提示管道,结合权限透明化设计,可以实现无需人工干预的自动化开发流程,且更安全。
  • 有人指出,当前 AI 开发工具仍处于探索阶段,虽有潜力,但存在功能不完善、系统不成熟的问题,未来可能演变为过度复杂、难以使用的系统。

8. 尽管存疑,联邦网络安全专家仍批准微软云服务 (Despite Doubts, Federal Cyber Experts Approved Microsoft Cloud Service) #

https://www.propublica.org/article/microsoft-cloud-fedramp-cybersecurity-government

2024 年底,美国联邦政府网络安全评估机构对微软的“政府社区云高”(GCC High)服务做出严厉批评,指出其缺乏充分的安全文档,导致评审团队对其整体安全状况“缺乏信心”。一名评审人员直言该系统“是一堆垃圾”。

尽管如此,联邦风险与授权管理计划(FedRAMP)仍批准了该产品,授予其政府网络安全认证。这一决定在业界引发震动,因为微软的云服务此前已被卷入两起重大国家级网络攻击事件:俄罗斯黑客利用其漏洞窃取核安全机构数据。

FedRAMP 早在 2020 年就对 GCC High 提出质疑,要求微软提供详细的加密机制图示。但微软提交的信息被认定为不完整且断断续续。五年间,审查过程拖延,监管机构未予拒绝,反而因该产品已在多个联邦机构和国防部门广泛部署,最终以“既成事实”为由批准。

这一做法被批评者称为“安全表演”,认为它违背了 FedRAMP 设立初衷——通过严格审查确保政府数据安全。如今,司法部、能源部及国防工业均依赖 GCC High 保护高度敏感信息,一旦泄露可能造成严重或灾难性后果。

调查发现,整个审批流程存在系统性失灵,对微软存在过度宽容,即便其产品是重大网络攻击的核心漏洞来源。专家警告,这种“事后认可”模式正在危及美国国家安全。


HN 热度 430 points | 评论 198 comments | 作者:hn_acker | 10 hours ago #

https://news.ycombinator.com/item?id=47426057

  • FedRAMP 的审批流程过于缓慢且不重视行业反馈,导致企业不得不支付高额费用给 Palantir 或 2F 以快速进入政府市场,形成变相“监管税”。
  • 企业通过早期进入政府市场实现“锁定效应”,使政府难以迁移,从而获得长期稳定收益。
  • 政府机构并非没有预算限制,大多数部门预算紧张,所谓“零成本天花板”并不成立。
  • 一旦企业被纳入政府系统,尤其是国防工业领域,迁移成本极高,难以摆脱现有供应商。
  • 企业若想进入政府市场,需投入大量资源应对复杂的合规流程,包括长达数月的文档准备和数百万美元的投入,几乎排除了中小企业参与的可能性。
  • FedRAMP 的实际安全审查工作主要由外包公司如 Schellman 执行,而非真正的“联邦网络安全专家”。
  • Microsoft 的 Entra ID 配置过于复杂,存在大量可选策略,导致实际使用中用户无法登录,反而降低安全性。
  • Microsoft 的单点登录流程存在严重缺陷,频繁出现重定向循环、登录失败、无法切换账户等问题。
  • 浏览器中同时保存多个 Microsoft 账户会导致认证机制崩溃,必须清除所有 Cookie 才能解决。
  • 使用临时容器或独立浏览器配置是应对 Microsoft 多账户认证问题的有效方法。
  • Microsoft 的认证流程在某些场景下(如 Azure DevOps)会导致页面完全无法加载,仅通过新开标签页才能解决。
  • 有时系统会自动登录错误账户,导致权限不足的“无交互”错误页面,需手动退出再重试。
  • Microsoft 的登录流程中存在大量不必要的重定向,疑似为设置 Cookie 而设计,但严重影响用户体验。
  • 即使已登录,系统仍会频繁要求重新登录,引发用户强烈不满。
  • Microsoft 的“企业级”软件虽功能繁多,但实际可用性差,多数功能未能按预期工作。

9. 死亡万岁,滚动淡入 (Death to Scroll Fade) #

https://dbushell.com/2026/01/09/death-to-scroll-fade/

本文是一篇强烈反对“滚动淡入”(scroll fade)设计效果的博客文章,作者以讽刺和愤怒的语气表达了对这种流行但令人反感的网页动画的厌恶。

文章指出,滚动淡入通常表现为元素在滚动时逐渐显现,常伴有 Y 轴位移,看似“精致”实则过度使用。作者强调,这种效果往往由项目后期突然提出的非技术性需求推动,且缺乏设计目的和多样性,几乎总是采用统一的 1 秒透明度过渡和 100px 位移,显得单调而低效。

作者认为,滚动淡入不仅影响用户体验,还带来多重问题:对有前庭功能障碍的用户不友好,违背了 prefers-reduced-motion 的无障碍设计原则;容易造成认知过载,分散用户注意力;在不同设备上表现不一致,尤其在非苹果设备上体验更差。

此外,滚动淡入会严重影响网页性能,可能严重拖累“核心网页指标”(Core Web Vitals),特别是 LCP(最大内容绘制),从而影响 SEO 和用户留存。作者质疑,项目是否有足够时间和预算进行真实用户测试,验证其是否真的提升了可用性。

尽管作者尝试从技术、无障碍、性能等角度反驳,但最终承认,客户拥有最终决定权。他呼吁开发者集体抵制这种“快速上马”的不良设计,强调应从项目初期就拒绝此类需求,或干脆说“滚动淡入是技术上不可能的”——用幽默方式表达对这一设计陋习的彻底否定。

文章结尾以“死亡万岁,滚动淡入!”作结,呼应标题,表达强烈立场。


HN 热度 347 points | 评论 187 comments | 作者:PaulHoule | 9 hours ago #

https://news.ycombinator.com/item?id=47426932

  • 粘性头部在滚动时自动隐藏和显示,干扰阅读体验,尤其当用户需要反复回看内容时,频繁出现的头部会遮挡文本。
  • 用户希望头部能固定在顶部,而不是在滚动时反复出现,这样可以避免干扰阅读,且无需额外操作即可访问导航。
  • 一些用户通过 uBlock Origin 等工具直接屏蔽粘性头部,但担心这会导致顶部无导航,影响使用。
  • 有用户指出,粘性头部的设计初衷是节省屏幕空间,但实际效果适得其反,反而频繁遮挡内容,降低阅读效率。
  • 有人认为粘性头部在移动端更难接受,因为移动端浏览器本身也隐藏工具栏,叠加网站的动态头部更显混乱。
  • 有观点认为,粘性头部的交互逻辑是“滚动向下隐藏,向上显示”,但这种行为在实际阅读中并不符合用户习惯,尤其是频繁上下滚动的场景。
  • 一些用户强调,他们阅读时会反复回看段落,因此粘性头部的动态出现会打断阅读流,造成心理负担。
  • 有人认为粘性头部在长文阅读或信息流场景中并不适用,而更适合需要频繁跳转页面的网站。
  • 也有用户认为粘性头部是直观且高效的交互设计,用户通过自然滚动行为就能发现其功能,提升阅读体验。
  • 有评论指出,粘性头部的流行反映了网站设计过度迎合移动端,忽视了桌面端和真实阅读行为的多样性。
  • 一些人认为,网站设计者应尊重用户自主阅读节奏,而不是强制通过动态头部干预阅读过程。

10. 如果你以为写代码的速度是问题,那你就有更大的问题了 (If you thought code writing speed was your problem you have bigger problems) #

https://andrewmurphy.io/blog/if-you-thought-the-speed-of-writing-code-was-your-problem-you-have-bigger-problems

本文探讨了在软件开发中盲目追求代码产出速度所带来的严重问题。作者以一个典型的公司场景开篇:VP 工程在参加一场会议后,宣布引入 AI 编程助手,宣称代码产出提升 40%,并认为这将显著提高开发速度。然而,作者指出,这种做法忽略了系统中的真正瓶颈。

文章引用了埃利·高德拉特的《目标》中的“约束理论”:任何系统都只有一个瓶颈,系统的整体吞吐量由这个瓶颈决定。如果优化非瓶颈环节(如代码编写速度),只会导致积压、延迟和质量下降,反而让系统更差。

作者描述了当代码产出速度提升但后续流程未同步优化时的真实后果:PR 积压、评审流于形式、CI 失败频繁、部署依赖手动审批、功能长期滞留在测试环境。结果是代码产出越多,实际交付越少,开发周期反而变长。

更严重的是,大量 AI 生成的代码缺乏可理解性,开发者无法解释其逻辑,一旦出错,排查困难,增加了系统风险。

作者指出,真正的瓶颈往往不在编码环节,而在于:

  1. 不清楚该做什么:产品经理脱离用户,需求模糊,团队在“猜需求”中浪费大量时间。快速写代码只会更快地把错误的东西做出来。
  2. 代码“完成”后的流程阻塞:从代码提交到用户使用,中间涉及评审、测试、安全、部署等多个环节,这些环节的延迟才是主要瓶颈。代码写得再快,也无法突破这些流程障碍。

结论是:真正的效率提升不在于写代码的速度,而在于识别并解决系统中的真实瓶颈,尤其是需求定义和交付流程。否则,再先进的工具也只是在制造“会腐烂的库存”,表面数据好看,实际价值为零。


HN 热度 327 points | 评论 209 comments | 作者:mooreds | 1 day ago #

https://news.ycombinator.com/item?id=47415919

  • 使用 AI 代理进行编码能显著提升实验性重构和复杂重复任务的效率,尤其在处理与已有代码结构相似的场景时表现优异。
  • 最大的潜在生产力提升在于可以并行处理其他任务,例如在 AI 生成代码的同时审查其他 PR,从而提高整体时间利用率。
  • 然而,这种并行工作模式可能导致频繁上下文切换,增加出错风险,降低专注力和工作满意度,尤其在处理复杂任务时更为明显。
  • 一些开发者发现,同时管理多个 AI 代理任务会引发认知负荷过重,甚至产生身体不适感,难以持续维持高效状态。
  • 虽然 AI 能快速生成代码,但开发者仍需投入大量精力进行理解、验证和修正,无法真正实现“无痛”高效。
  • 有人指出,AI 带来的效率提升可能被压缩项目周期所抵消,反而导致质量下降、设计缺陷增多和工作压力上升。
  • 与传统开发相比,AI 辅助开发改变了工作节奏,带来一种新的“认知疲惫”,其本质是高强度的多任务并行带来的精神消耗。
  • 有人认为,AI 并不能解决“理解问题”这一根本瓶颈,快速写代码反而可能加速构建错误的解决方案。
  • 在实际使用中,AI 生成的代码需要大量人工审查和调整,真正节省的时间可能远低于预期。
  • 保持工作状态的连续性和上下文一致性对高效开发至关重要,而 AI 代理的介入可能破坏这一平衡。
  • 一些开发者建议,只有在任务成本低、变更范围小或上下文相近的情况下,才适合采用并行工作模式。

Hacker News 精彩评论及翻译 #

Have a fucking website #

https://news.ycombinator.com/item?id=47421793

Someone wrote and deleted a comment saying

I don’t get it. LLMs are supposed to have 100% bridged this gap from “normie” to “DIY website.” What’s missing?

This is an all too common thought process among technologists, so:

Where to even start? Well, let’s start that every single “AI” company is massively overhyping everything to try to avoid any unfortunate realizations about the emperor’s clothes regarding their CapEx and finances. Yes, even your favorite one.

The very short version: running a small business like a restaraunt takes all your resources and then 20% more. Long hours, hard work, all your time. You do not have 2 hours to learn about LLMs or to pick which company to pay. From there:

  • Most people don’t know what they want

  • Most people don’t know the words for what they want

  • Even if you say “I want a website”, what do you want it do look like? To say? These people aren’t experts in web UX nor should they be.

  • You have some HTML and images. Where do they go now? Again people literally don’t know what they want or need. If you realize you need a “web host”, how do you pick a trustworthy one? How do you know if it’s a good price? How do you get a domain name? How do you get the files onto the server?

  • Do you want people to be able to buy things? Now you’re taking payment methods and have security concerns.

  • Your site is live. You want to change something on it. How do you do that? Where are the original files? How do you change them? How do you get the changes on the server?

It’s not “Hey, write me a website”. There are lots of steps that assume a lot of knowledge, and it is easier, faster, and better for people to focus on their expertise and just pay some service for their web shop.

Arainach

有人写了一条评论又删了,上面写道:

我不懂。LLMs 应该已经实现了从“普通人”到“DIY 建站”的 100% 跨越。少了什么?

这种想法在技术人员中太常见了,因此:

该从何说起呢?好吧,先从这一点说起:每一家“AI”公司都在疯狂炒作一切,试图掩盖他们在资本支出和财务状况上那些“皇帝的新衣”般的不堪真相。是的,甚至包括你最喜欢的那家。

极简版本是:经营一家像餐馆这样的小生意会耗尽你所有的资源,再多出 20%。长时间工作,艰辛劳作,占用你所有的时间。你没有时间去了解 LLMs,或者去选择要付钱给哪一家公司。接着就是:

  • 大多数人不知道自己想要什么
  • 大多数人不知道该怎么描述自己想要的东西
  • 即使你说了“我想要个网站”,那你希望它长什么样?能说什么?这些人又不是网页 UX 专家,也不该是。
  • 你手里只有一些 HTML 和图片。现在该往哪儿放?同样,这些人真的不知道自己想要什么或需要什么。如果你意识到你需要一个“网站主机”,怎么挑选一个靠谱的?怎么知道价格公道?怎么拿到域名?怎么把文件上传到服务器?
  • 你想让别人能买东西?现在又涉及支付方式和安全问题了。
  • 网站上线了。你想改点东西。怎么改?原始文件在哪儿?怎么修改?怎么把改动上传到服务器?

这并不是“嘿,给我写个网站”。这中间有很多步骤都需要具备一定的知识储备,对于这些人来说,把精力集中在自己的专业领域,然后支付服务费请人打理网店,才是更轻松、更快、更好的选择。


Honda is killing its EVs #

https://news.ycombinator.com/item?id=47419961

Honda is setting itself up for failure on the second disruption sweeping the automotive industry: the software-defined vehicle (SDV), which has core capabilities that can be upgraded and improved over time.

No thank you. Not sure why the author frames this as a good thing. They’ve been bamboozled by the automakers and have got it backwards - you’re buying a vehicle that already has the capabilities, but are disabled, then paying rent (or a fee) to turn them on. I’m much more likely to buy from a manufacturer that doesn’t play these games.

rkagerer

本田正让自己在席卷汽车行业的第二次颠覆中注定失败:软件定义汽车(SDV)。这种车辆具备随时间推移可升级改进的核心功能。

谢绝了。不太明白作者为何将其视为一件好事。他们被汽车厂商给忽悠了,而且搞反了——你买的车其实已经具备了这些功能,只是被禁用了,然后还得花钱(或交租金)才能把它们激活。我更倾向于从那些不玩这种把戏的制造商那里买车。


Microsoft’s ‘unhackable’ Xbox One has been hacked … #

https://news.ycombinator.com/item?id=47415701

Whether PC users, our core readership, will be interested in actually emulating Xbox One, looks unlikely. The 2013 system’s game library is largely overlapped in better quality on the PC platform.

And this explains why it’s stayed unhacked so long. There was very little incentive to hack the system when the games are all playable on a PC. Pirates, cheaters, archivists, and hackers could just go there. Microsoft’s best security measure was making something nobody cared enough about to hack in the first place

autoexec

PC用户——我们的核心受众——是否有兴趣真的去模拟运行 Xbox One,看来不太可能。这款2013年发布的主机,其游戏库在PC平台上大多都能玩到,而且质量通常更好。这也解释了为何它长期处于无破解状态。毕竟,当所有游戏都能在PC上运行时,黑客们几乎没有任何动力去破解主机。盗版玩家、作弊者、资料收集者以及黑客们大可直接去PC平台上玩。微软最有效的防御手段,就是提供了一款根本没人有足够兴趣去破解的主机。


Rob Pike’s Rules of Programming (1989) #

https://news.ycombinator.com/item?id=47424923

There are very few phrases in all of history that have done more damage to the project of software development than:

“Premature optimization is the root of all evil.”

First, let’s not besmirch the good name of Tony Hoare. The quote is from Donald Knuth, and the missing context is essential.

From his 1974 paper, “Structured Programming with go to Statements”:

“Programmers waste enormous amounts of time thinking about, or worrying about, the speed of noncritical parts of their programs, and these attempts at efficiency actually have a strong negative impact when debugging and maintenance are considered. We should forget about small efficiencies, say about 97% of the time: premature optimization is the root of all evil. Yet we should not pass up our opportunities in that critical 3%.”

He was talking about using GOTO statements in C. He was talking about making software much harder to reason about in the name of micro-optimizations. He assumed (incorrectly) that we would respect the machines our software runs on.

Multiple generations of programmers have now been raised to believe that brutally inefficient, bloated, and slow software is just fine. There is no limit to the amount of boilerplate and indirection a computer can be forced to execute. There is no ceiling to the crystalline abstractions emerging from these geniuses. There is no amount of time too long for a JVM to spend starting.

I worked at Google many years ago. I have lived the absolute nightmares that evolve from the willful misunderstanding of this quote.

No thank you. Never again.

I have committed these sins more than any other, and I’m mad as hell about it.

anymouse123456

在历史上,几乎没有哪句话比“过早优化是万恶之源”对软件开发这项事业的破坏力更大。

首先,不要玷污托尼·霍尔的美名。这句话出自唐纳德·克努特,而缺失的背景至关重要。

出自他1974年的论文《带有 go to 语句的结构化程序设计》:

“程序员在思考或担心其程序中非关键部分的运行速度上浪费了巨大时间,而且当考虑到调试和维护时,这些追求效率的尝试实际上会产生强烈的负面影响。我们应该忽视那些微不足道的小优化,在大约 97% 的时间里:过早优化是万恶之源。然而,我们不应放过那关键的 3% 的机会。”

他谈论的是在 C 语言中使用 GOTO 语句。他谈论的是为了微优化而导致软件变得极难理解。他(错误地)假设我们会尊重(受其软件运行的)机器。

如今,多代程序员都被培养成相信效率极其低下、臃肿不堪且缓慢的软件是完全没问题的。计算机被强迫执行的样板代码和间接逻辑的数量是没有限制的。这些“天才”们构建的结晶化抽象概念没有上限。JVM 启动所花费的时间再长也是可以的。

多年前我在谷歌工作过。我亲历了因故意误解这句话而产生的绝对噩梦。

算了吧。绝不再来。

我犯下这些罪孽比别人都多,我对之怒不可遏。


Microsoft’s ‘unhackable’ Xbox One has been hacked … #

https://news.ycombinator.com/item?id=47414568

Created a voltage drop that exactly occurred to be timed to the key comparison, then a spike at the continuation.

Irl noop and forced execution control flow to effectively return true.

B e a utiful

Jerrrrrrrry

制造了一个电压降,其时机恰好配合了关键比较,随后在后续流程中产生了一个尖峰。 在现实中实际执行了空操作,并强制控制流实际上返回 true。 美妙。


Nvidia NemoClaw #

https://news.ycombinator.com/item?id=47429619

Am I missing something? Why is everyone talking about sandboxes when it comes to OpenClaw?

To me it’s like giving your dog a stack of important documents, then being worried he might eat them, so you put the dog in a crate, together with the documents.

I thought the whole problem with that idea was that in order for the agent to be useful, you have to connect it to your calendar, your e-mail provider and other services so it can do stuff on your behalf, but also creating chaos and destruction.

And now, what, having inference done by Nvidia directly makes it better? Does their hardware prevent an AI from deleting all my emails?

Netcob

是我理解有误吗?为什么一提到 OpenClaw,大家都在谈论沙盒?

对我来说,这就好比把一叠重要文件交给你的狗,然后担心它会吃掉文件,结果你把狗连文件一起关进了笼子里。

我一直觉得那个想法的问题在于,为了让这个代理有用,你必须把它的接入连接到你的日历、邮件提供商和其他服务,以便它能代表你办事,但这同时也可能导致混乱和破坏。

现在呢,怎么了?通过英伟达直接进行推理,就能让它变好了?

难道他们的硬件能防止 AI 把我所有的邮件都删掉?


Honda is killing its EVs #

https://news.ycombinator.com/item?id=47420212

In Shenzhen for a tech meeting. The streetscape is quieter, despite high traffic levels and I hear not only MORE birdsong, but the birds do more complex songlines.

The air is clean. For sure some of this is because it’s a coastal city and has fresh sea breezes, but I’ve been in other Chinese coastal cities in times past and the air was significantly less clean.

There are social upsides for an almost-all-EV city.

This is an 18m person city. It’s not exclusively wealthy people, its just a city with a very high local EV population and it shows.

ggm-at-algebras

在深圳参加一个技术会议。虽然车流量很大,但街景却出奇地安静,我听到的不仅是鸟鸣更多了,而且鸟儿的歌声也更复杂多变。

空气很干净。这肯定有一部分原因是因为这是一座沿海城市,有清新的海风,但我在过去也去过其他中国沿海城市,那里的空气明显没那么干净。

一座几乎清一色是电动汽车的城市,在社交方面也有着积极的一面。

这是一个拥有1800万人口的城市。这里的人并不全是富人,只不过是一个本地电动汽车保有量极高的城市,这一点显而易见。


Honda is killing its EVs #

https://news.ycombinator.com/item?id=47418204

I live in a top EV market, Norway.

It is the top EV market.

I figure most other countries will be the same.

Most other countries are not Norway, it is a very wealthy, tiny market (150 K vehicles/year) with lots of hydro and not representative of the typical vehicle market in Western Europe and definitely not representative of the situation in the rest of the world.

EVs are the future, there is no doubt about that. But that future will not arrive everywhere at the same point in time and Norway is very far ahead of the rest of the world due to a fairly unique set of circumstances: exporting your own oil and gas to be able to have a ‘clean’ (and up to recently heavily subsidized) transportation network is in a way just a gigantic bookkeeping trick.

jacquesm

我住在挪威,这是全球最大的电动汽车市场。 它是最大的电动汽车市场。 我以为其他国家情况也会差不多。 大多数其他国家都不是挪威,这是一个非常富裕且市场规模较小的市场(年销量15万辆),拥有大量的水力资源,它不能代表西欧典型的汽车市场,更不用说代表世界其他地区的情况了。 电动汽车是未来,这点毫无疑问。 但那个未来不会在同一时间降临到每个地方。 而且由于一组相当独特的情况,挪威远远领先于世界其他国家:出口自己的石油和天然气,从而拥有一个“清洁的”(直到最近都受到巨额补贴的)交通网络,这在某种程度上只是一个巨大的会计把戏。


Honda is killing its EVs #

https://news.ycombinator.com/item?id=47418175

I live in a top EV market, Norway.

ICE cars have been planned out for years now, and something like 96% of all new cars in Norway were EV last year.

Basically, if you plan on keeping selling ICE cars, you’re removing yourself from the market here. There’s no future for new personal ICE cars here.

I figure most other countries will be the same.

TrackerFF

我居住在电动汽车市场的领先者——挪威。燃油车的淘汰计划已经推行多年,去年挪威销量的96%都是电动车。

简单来说,如果你打算继续销售燃油车,那就等于把自己排除在市场之外。在这里,燃油车没有未来。

我估计其他大多数国家的情况也会是一样的。


Meta Horizon Worlds on Meta Quest is being discont… #

https://news.ycombinator.com/item?id=47417125

Unbelievable. They re-architected the whole operating system around this stupid app. They discontinued their previous homescreen environments in favor of trying to promote Horizon Worlds, only to discontinue the blasted thing anyway? After all of those millions of dollars spent trying to make virtual events happen?

xd1936

难以置信。他们为了这个愚蠢的应用重新架构了整个操作系统。他们废弃了以前的主页环境,转而试图推广 Horizon Worlds,结果最后还是把这个该死的东西砍了?在投入了数百万美元试图促成虚拟活动之后?


Microsoft’s ‘unhackable’ Xbox One has been hacked … #

https://news.ycombinator.com/item?id=47415873

The other major incentive for hacking the console Microsoft removed was for the first time on a modern mainstream home console to allow side loading of homebrew code/emulators etc. The console supported a developer mode that allowed side loading of third party applications, so folks could get emulators and other traditionally “banned” content on the console through an officially supported route.

There’s a great presentation by Tony Chen on the Xbox One’s security features:

https://www.platformsecuritysummit.com/2019/speaker/chen/

Examples of the kinda software you can put on the Xbox One in developer mode:

https://xboxdevstore.github.io/

giobox

微软移除的另一个让人愿意对控制台进行破解的主要动力在于,这是首次在主流现代家用游戏机上允许侧载自制代码、模拟器等内容。该主机支持开发者模式,允许侧载第三方应用程序,因此用户可以通过官方支持的途径在主机上运行模拟器以及其他传统上被视为“违禁”的内容。

Tony Chen 关于 Xbox One 安全特性的精彩演讲:

https://www.platformsecuritysummit.com/2019/speaker/chen/

你可以在开发者模式下安装到 Xbox One 上的此类软件的示例:

https://xboxdevstore.github.io/


Despite Doubts, Federal Cyber Experts Approved Mic… #

https://news.ycombinator.com/item?id=47427180

The experts were correct. Azure is the biggest pile of shit I’ve ever had to work with. Everything feels evolutionary. In other words, a new product in azure is barely a product at all, but a small appendage which totally inherits a bunch of preexisting Azure “stuff.” And all this preexisting stuff may not really make sense for the product, and it might inherit stuff that makes the product much worse. But, it doesn’t matter. To even think about using the product, you need to learn way more about the larger Azure ecosystem than you ever bargained for, and of course deal with Microsoft products that do not really integrate well because the teams don’t talk to each other. Log formats, conventions, everything will be different as you float around to different parts of Azure. Basic security concepts, such as a SIEM will be implemented in such strange ways that you wonder if Microsoft has any idea what a SIEM even is.

everdrive

专家们说得没错。Azure 是我被迫与之打交道过最烂的一坨东西。一切都感觉像是零敲碎打地进化而来。换句话说,Azure 里的所谓新产品根本算不上什么产品,充其量就是一个依附于旧架构的附属拼凑物,完全继承了一堆原本就存在的 Azure“旧东西”。而这些原本就存在的积弊可能根本不符合该产品的逻辑,反而会继承一些让产品变得更烂的配置。但这根本不重要。想要尝试使用这个产品,你需要了解的 Azure 生态系统知识远远超出了你的想象,当然,还得处理那些因为团队间缺乏交流而导致无法真正整合的微软产品。日志格式、命名规范等等,一切在你遍历 Azure 的各个模块时都会发生巨大的差异。基本的安全概念,比如 SIEM,其实现方式会奇怪得让你怀疑微软到底懂不懂什么是 SIEM。


Illinois Introducing Operating System Account Age … #

https://news.ycombinator.com/item?id=47416642

Or, and hear me out, maybe our computers shouldn’t spy on us in the first place?

pianoben

或者,听我说,也许我们的电脑一开始根本就不该监视我们?


Meta Horizon Worlds on Meta Quest is being discont… #

https://news.ycombinator.com/item?id=47417476

They also renamed the entire corporation from “Facebook” to “Meta” to prove how serious they were about it.

CobrastanJorji

他们还将整个公司从“Facebook”更名为“Meta”,以此证明他们对这件事是多么认真。


Meta and TikTok let harmful content rise to drove … #

https://news.ycombinator.com/item?id=47418140

I feel like this is general knowledge for the past 5 or so years, but the real question is “What do we do about it?”. Personally, I put real effort into not spending time being outraged online, but this is a societal ill that’s bigger then I am…

bigfishrunning

我觉得这大概是过去五年左右就已经是常识了,但真正的问题是“我们该怎么做?”。就我个人而言,我确实在努力不去把时间花在网上义愤填膺,但这毕竟是一种远超个人能力的社会顽疾……


US SEC preparing to scrap quarterly reporting requ… #

https://news.ycombinator.com/item?id=47407350

This seems like bad news for regular investors, and good news for insiders.

Reporting is burdensome, sure, but being listed on public exchanges is not a requirement.

ginkoleaf

这对普通投资者来说似乎是个坏消息,但对内部人士来说是个好消息。 编制报告确实是个负担,但在公开交易所上市并非必须。


2026 03 18 HackerNews

2026-03-18 08:46:00

2026-03-18 Hacker News Top Stories #

  1. Kagi Translate 推出可将内容转换为讽刺性"LinkedIn职场话术"的新功能,调侃现代职场商业话语的过度包装现象。
  2. 12岁巴勒斯坦男孩目睹以军在约旦河西岸杀害其全家,事件引发国际社会对以军使用致命武力的强烈关注和质疑。
  3. Meta 被曝通过超20亿美元隐蔽资金网络推动美国各州强制年龄验证立法,实质是针对竞争对手的选择性监管策略。
  4. Mistral AI 发布开源代码代理 Leanstral,专为 Lean 4 设计,在数学证明与软件验证任务上表现优异且成本远低于竞品。
  5. 美国证监会拟取消上市公司季度财报强制披露要求,改为半年度报告,旨在缓解短期业绩压力但引发市场透明度担忧。
  6. Kagi Small Web 平台精选小众网络中的原创内容,倡导真实人际连接,反对算法主导的流量泡沫。
  7. 分析显示"小网络"实际规模庞大且活跃度高,单日新内容超千条,建议采用用户订阅模式而非全面聚合。
  8. 开源研究项目揭示美国医疗体系在非处方药、药品价差和医院服务价格方面存在巨额浪费,年可节省近千亿亿美元。
  9. Meta 宣布重新致力于 jemalloc 内存分配器项目,承诺清理技术债务并优化多线程与 ARM64 平台性能。
  10. 文章指出每增加一层审批会使项目速度降低十倍,主张通过减少审查环节和建立信任机制来提升开发效率

1.Kagi Translate 现已支持将内容转换为 LinkedIn 职场话术 (Kagi Translate now supports LinkedIn Speak as an output language) #

https://translate.kagi.com/?from=en&to=LinkedIn+speak

Kagi Translate 是一个强大的翻译工具,利用先进的人工智能模型,可以即时、准确地翻译任何语言的内容。该平台的功能包括翻译历史、收藏夹、清除历史记录等,用户可以轻松访问他们的翻译记录。

在使用 Kagi Translate 时,用户可以输入文本、网址或文档进行翻译。支持多种语言,包括常用语言如简体中文、英语(英美)、法语、德语、意大利语、日语、葡萄牙语、俄语和西班牙语等。此外,还支持一些有趣的语言。

用户界面简单易用,能够自动检测语言,方便用户输入和翻译。总之,Kagi Translate 是一个高效的翻译工具,适合需要快速翻译服务的用户。


HN 热度 1305 points | 评论 317 comments | 作者:smitec | 20 hours ago #

https://news.ycombinator.com/item?id=47408703

  • 该评论将《葛底斯堡演说》改写为典型的硅谷创业公司语言,用“颠覆性初创企业”“战略转型”“高绩效团队”等术语重新诠释历史文本,讽刺了现代商业话语的过度包装。
  • 有人指出这种改写风格与《硅谷》剧中角色埃里奇的说话方式极为相似,凸显了其荒诞感。
  • 评论者调侃这种语言风格充满“情绪爆炸式”的表达,将普通句子注入过度能量,形成“价值爆炸”的效果。
  • 有人认为该改写虽有趣,但相比现实中多数 LinkedIn 内容仍显得过于“聪明”,缺少典型的“不是 X,而是 Y”这类套路化表达。
  • 有观点指出,这种改写缺乏“不是……而是……”这类对比结构,而这类结构正是当前识别 AI 生成内容的常见“特征”之一。
  • 有人质疑用“破折号”或“不是 X 而是 Y”等语法特征来识别 AI 内容的做法,认为这会引发误伤,且技术手段终将被 AI 学习规避。
  • 有人表示,这种检测方式本质上反映的是社会对生成式 AI 的无力感,问题不在技术,而在社会认知和信任体系。
  • 有人认为,当所有“AI 痕迹”都被消除后,人类将失去识别 AI 的依据,最终陷入“无迹可寻”的困境。
  • 有人建议,与其刻意“写得更差”以规避检测,不如坚持真实表达,不应为迎合错误标准而扭曲沟通方式。
  • 有人批评这种对“破折号”等符号的过度关注,认为这是对语言多样性的不必要限制,真正的问题是信任危机而非技术细节。
  • 有人指出,这种将历史文本“商业话”的改写,恰恰揭示了现代职场语言对严肃思想的消解与异化。
  • 有人认为,这种改写虽然滑稽,但其核心讽刺的是当代职场话语中“形式大于实质”的普遍现象。

2. 12 岁巴勒斯坦男孩讲述以军如何在车内杀害其全家 (Palestinian boy, 12, describes how Israeli forces killed his family in car) #

https://www.bbc.com/news/articles/c70n2x7p22do

在一篇由 BBC 新闻报道的文章中,12 岁的巴勒斯坦男孩哈立德・巴尼・奥德(Khaled Bani Odeh)讲述了他目睹以色列军队在约旦河西岸杀死他家人的悲惨事件。事件发生在哈立德和他的父母及两个弟弟在购物后驾车回家的路上,时间是在周六凌晨。这家人刚刚在购物中心度过了愉快的时光,准备庆祝即将到来的开斋节。

根据哈立德的描述,他的父母 ——37 岁的阿里・哈立德・巴尼・奥德(Ali Khaled Bani Odeh)和 35 岁的妻子瓦德(Waad),以及他七岁的残疾弟弟奥斯曼(Othman),在驾驶过程中遭到以色列士兵的枪击。哈立德表示,母亲在被射击前最后一次呼喊,而父亲在临死前念了伊斯兰信仰宣言。哈立德的另一个弟弟,8 岁的穆斯塔法(Mustafa),也在事件中受伤。

以色列军方声称,士兵们是在执行逮捕涉嫌恐怖活动的人员时,感觉到车辆的 “威胁”,因此开火。然而,目击者对此表示质疑,称汽车在被射击时是静止的,并没有朝士兵们加速。此外,现场的急救人员描述了事件的严重性,称目击到了大量的弹壳和直接针对汽车的重火力。

哈立德的祖母纳贾(Najah Bani Odeh)在家中接待前来哀悼的亲友,透露在他们的村庄里并没有任何军事行动的警告,家人在路过时是毫无预警地遭遇了攻击。她指出,事件的发生并不是孤立的,而是反映了在约旦河西岸针对巴勒斯坦人暴力升级的模式,尤其是在 2023 年 10 月 7 日哈马斯袭击以色列后,暴力事件显著增加。

根据联合国人道事务办公室的数据,自 2023 年 10 月以来,约旦河西岸已经有超过 1071 名巴勒斯坦人遇害,其中包括 233 名儿童。而在同一时期,19 名以色列平民和 23 名以色列安全部队人员在该地区被杀。

这起事件引发了对以色列军队在约旦河西岸应对巴勒斯坦平民时使用致命武力的关注,并引发了对以色列政府对待这些悲剧是否应负责任的讨论。以色列反对党领导人也对此表达了批评,认为对于这样的悲剧,政府没有对受害家庭表示道歉。


HN 热度 1198 points | 评论 376 comments | 作者:tartoran | 1 day ago #

https://news.ycombinator.com/item?id=47402950

  • 该事件为可验证事实,以色列主流媒体已作为事实报道,事件中以色列军方以车辆行驶过快为由开火,导致一名巴勒斯坦父亲及其四名子女死亡。
  • 西岸局势与美国警务问题存在相似之处,执法者在轻微挑衅下即使用致命武力,且缺乏有效监督,反映出系统性问题。
  • “我感到不安全”已成为滥用的借口,被用于为暴力行为开脱,无论是在日常冲突还是军事行动中,都导致了严重后果。
  • 美国警察文化深受影视作品影响,普遍被理想化,而现实中的警察问题长期被掩盖,仅少数作品如《火线》等揭示真实问题。
  • “我感到不安全”这一说法仅在针对社会地位较低者时才有效,本质上是权力等级的体现,而非真正安全诉求。
  • 美国警察的“战士式警务”传统早于以色列训练模式,其根源可追溯至 20 世纪 60 年代的“毒品战争”及“反恐战争”,与美国社会结构性压迫密切相关。
  • “毒品战争”和“反恐战争”本质上并非为了公共安全,而是为了系统性压迫特定群体,为警察军事化提供借口。
  • 警察暴力问题在以色列与美国之间存在训练与理念上的相互影响,但美国的警务问题有其独特的本土历史根源,不能简单归因于以色列。

3. Meta 被曝幕后操控超 20 亿美元游说资金,推动全美强制年龄验证技术立法 (Reddit User Uncovers Who Is Behind Meta’s $2B Lobbying for Age Verification Tech) #

https://www.gadgetreview.com/reddit-user-uncovers-who-is-behind-metas-2b-lobbying-for-invasive-age-verification-tech

Meta 被曝通过超过 20 亿美元的隐蔽资金网络,利用非营利组织作为掩护,推动美国各州立法强制苹果和谷歌在操作系统层面构建年龄验证系统。这些法案要求所有应用都能通过 API 获取用户的年龄信息,实质上是在每台设备中植入永久性的身份追踪机制。

调查由 GitHub 用户“upper-up”完成,揭露了 Meta 通过如“数字童年联盟”(DCA)等影子组织,绕过联邦选举资金披露规则,将资金分散至 45 个州,形成“超级政治行动委员会”式的策略,规避监管。

值得注意的是,这些法案明确要求苹果和谷歌承担合规责任,却将 Meta 旗下的社交平台排除在外,形成明显的“选择性监管”。这被指并非出于儿童安全考虑,而是一种针对竞争对手的策略,试图将责任从平台转移到操作系统制造商。

欧洲的 eIDAS 2.0 数字身份框架提供了另一种路径:采用零知识证明技术,用户可在不泄露真实身份的前提下验证年龄,保护隐私且开源可自托管。相比之下,美国的提案可能迫使所有操作系统(包括 Linux 和隐私导向的安卓分支)强制集成身份验证,威胁到自由软件和隐私保护生态。

该行动引发对数字隐私和平台垄断的广泛担忧,公众正面临一个关键抉择:是接受全面监控的合规环境,还是捍卫去中心化与隐私自由的计算未来。


HN 热度 837 points | 评论 17 comments | 作者:doener | 14 hours ago #

https://news.ycombinator.com/item?id=47410870

  • 该话题几天前已讨论过,评论数量达 554 条,但因内容重要,再次出现在首页是合理的。
  • 评论被合并至旧帖,导致原帖离开首页,对此表示歉意。
  • 合并评论的行为虽有不便,但不必道歉,因为信息整合有助于避免重复。
  • 重复发帖虽有规定限制,但不应因此变得刻薄。
  • 有人对 xkcd 网站的起源感到好奇,有人幽默回应其来源为“男人和铅笔相爱”。
  • xkcd 是一个以科学、技术、数学为主题的网络漫画网站,其内容以幽默和智力挑战著称。
  • 有人调侃 Hacker News 的规则,认为其对“有趣”内容的定义过于宽泛。
  • 有人指出该帖子是重复内容,但未明确指出背后的实际操控者。
  • 有人质疑该帖子未能回答“谁在背后推动”这一核心问题。
  • 有人认为该账号频繁发布“[dupe]”标记,行为模式可疑,可能为刷分或自动化操作。
  • 该账号虽行为可疑,但因其信息有用,仍可接受,只是此次标记显得多余且时机不合。

4. Leanstral:面向可信编程与形式化证明工程的开源代码代理 (Leanstral: Open-source agent for trustworthy coding and formal proof engineering) #

https://mistral.ai/news/leanstral

Mistral AI 发布了 Leanstral,首个专为 Lean 4 设计的开源代码代理,旨在推动可信的“vibe-coding”(直觉式编程)发展。Leanstral 采用稀疏架构,仅 60 亿活跃参数,却在真实形式化代码库任务中表现出色,尤其在数学证明与软件规范验证方面。

与现有闭源模型相比,Leanstral 在成本与性能之间取得显著平衡。在 FLTEval 评估基准上,Leanstral pass@2mailto:pass@2 达到 26.3 分,超越 Sonnet 4.6(23.7 分),且运行成本仅 36 美元,远低于 Sonnet 的 549 美元。即使在 pass@16mailto:pass@16 下,Leanstral 得分 31.9,仍优于 Sonnet,而 Claude Opus 4.6 虽质量更高,但成本高达 1650 美元,是 Leanstral 的 92 倍。

Leanstral 在实际案例中表现优异:成功诊断并修复因 Lean 4.29.0-rc6 版本更新导致的 rw 策略失效问题,建议将 def 改为 abbrev 以恢复模式匹配;同时能将 Rocq 语言中的程序定义完整转换为 Lean,并自动编写和证明程序行为正确性,如“将变量 X 增加 2”的程序验证。

项目开源,模型权重以 Apache 2.0 协议发布,可通过 Mistral Vibe 零配置使用,或通过免费 API 接口 labs-leanstral-2603 调用。用户也可下载模型在本地部署,推动可信代码生成的进一步发展。


HN 热度 738 points | 评论 179 comments | 作者:Poudlardo | 1 day ago #

https://news.ycombinator.com/item?id=47404796

  • 测试和形式化验证能有效记录系统实际行为的详细规范,比纯文档更可靠,因为它是可执行的,能防止回归问题。
  • 测试应关注行为而非实现细节,避免因测试过度绑定具体实现而阻碍重构。
  • 有效的测试策略应区分单元测试、集成测试和端到端测试,不同层级的测试对重构的敏感度不同。
  • 在重构过程中,应采用渐进式方法,先保留旧接口,逐步过渡到新设计,确保测试持续有效。
  • 代码作为测试的载体,其本质是将意图转化为可执行的规范,比纯文档更精确,能减少信息丢失。
  • 人工智能生成代码时,测试等验证手段能提供“实证”反馈,帮助模型发现错误,类似科学方法中的实验验证。
  • 科学方法的核心是理论而非测试,理论提供解释力和理解力,测试只是验证手段,不能替代理论构建。
  • 仅依赖测试通过的“感觉编程”(vibing)是危险的,可能导致复杂且难以维护的代码,如同地心说模型。
  • 人工智能本质上是模式匹配,缺乏真正的理解能力,仅靠测试通过无法保证代码质量或正确性。
  • 测试只是增加模型生成特定代码的概率,若训练数据中缺乏相关案例,测试无法解决根本问题。

5. 美国证监会拟取消上市公司季度财报强制披露要求 (US SEC preparing to scrap quarterly reporting requirement) #

https://www.reuters.com/business/finance/us-sec-preparing-eliminate-quarterly-reporting-requirement-wsj-says-2026-03-16/

美国证券交易委员会(SEC)正准备提出一项新提案,拟取消上市公司必须每季度披露财务业绩的强制要求,改为允许企业选择每半年披露一次。该提案预计将于下月公布,届时将进入为期至少 30 天的公众意见征询期,之后由 SEC 进行投票决定是否通过。

目前的计划并非完全取消季度报告,而是将其变为可选制度。此举旨在减少企业因短期业绩压力而做出短视决策,同时降低信息披露成本。此前,前总统特朗普多次呼吁取消季度报告,现任 SEC 主席保罗·阿特金斯也支持这一改革,预计提案将在 2025 年底或 2026 年初发布。

该改革将促使 SEC 与主要证券交易所协商调整相关规则。然而,也有批评者担忧,延长披露周期可能降低市场透明度,增加信息不对称,进而引发市场波动。

目前 SEC 尚未对此消息作出正式回应,Reuters 无法独立核实该报道内容。


HN 热度 723 points | 评论 440 comments | 作者:djoldman | 1 day ago #

https://news.ycombinator.com/item?id=47406779

  • 公司实时披露现金流流入流出情况有助于股东了解企业真实经营状况,长期可形成对企业健康度的合理判断。
  • 实时财务数据可能被市场操纵,导致企业为迎合市场预期而过度关注数据表现,偏离实际经营目标。
  • 企业公开实时数据会吸引交易者利用信息进行短期博弈,使企业管理层将精力用于“美化数据”而非提升业务效率。
  • 企业通过关联交易或虚构服务交易可人为制造虚假的现金流假象,从而误导投资者,存在合规与道德风险。
  • 管理层隐瞒财务信息往往预示企业存在严重问题,透明度缺失是企业危机的早期信号之一。
  • 实时披露机制若缺乏有效监管,可能被用于掩盖真实经营困境,反而加剧市场信息不对称。
  • 当前财报周期制度容易催生财务操纵行为,延长披露周期或改为半年度报告或更合理。
  • 企业实时展示财务数据可增强团队凝聚力,尤其在小型企业中能有效激励员工改善经营状况。
  • 员工对财务信息的知情权应被重视,隐瞒信息可能引发人才流失,尤其在企业面临困境时。
  • 企业实时披露数据的初衷虽好,但若缺乏真实业务支撑,容易沦为“表演式财务”或“数字游戏”。
  • 与市场预期相比,企业更倾向于牺牲长期价值以换取短期股价稳定,实时披露可能加剧这一倾向。
  • 实时数据披露可能被用于配合资本运作,如为并购、融资或股价操纵提供“合理”依据。
  • 企业真实经营状况应通过长期趋势判断,而非依赖短期财务指标,实时数据若无上下文易被误读。
  • 财报延迟或减少披露频率,可能让市场更关注基本面而非短期波动,反而提升投资理性。

6. Kagi 小网站 (Kagi Small Web) #

https://kagi.com/smallweb/

这是一个名为“Kagi Small Web”的网页,旨在展示互联网中较为小众但富有价值的内容社区。页面强调“小众网络”(Small Web)的概念,倡导人与人之间的真实连接,反对被算法主导的流量泡沫。它通过精选过去七天内发布的原创内容,呈现来自个人博客、技术分享、创意写作、摄影、DIY 制作等领域的高质量信息。

内容涵盖多个主题,包括人工智能、编程、科技、设计、人文、生活记录、摄影、游戏、政治、经济等,体现多元且深度的思考。页面鼓励用户关注真实作者,支持独立创作,同时提供 RSS 订阅、OPML 导出等功能,便于持续追踪。

该平台本身是开源的,致力于构建一个更人性化的网络环境,让内容创作者与读者之间建立更真诚的互动。用户可通过“Next Post”按钮浏览新内容,感受“邻居式”的网络体验。


HN 热度 688 points | 评论 191 comments | 作者:trueduke | 14 hours ago #

https://news.ycombinator.com/item?id=47410542

  • Kagi 的“小网站”定义过于狭隘,仅限于有 RSS 且近期更新的博客或网络漫画,排除了大量有价值但更新不频繁的个人专家网站和创意项目。
  • 以 Sheldon Brown 和 Ask Aaron 为代表的专家型个人网站是“小网站”的巅峰,这类内容如今常被淹没在广告充斥的维基或封闭的 Discord 中。
  • 一些经典但多年未更新的趣味网站(如实时太空人数统计)和创意技术演示(如 Q3A 游戏演示)不应被排除在“小网站”之外。
  • 现有平台对高频更新内容的偏好扭曲了价值判断,导致质量高但更新慢的优质资源难以被发现。
  • 个人手动维护的 RSS 博客集合(如 minifeed.net)提供了一种更灵活、更人性化的替代方案,支持随机浏览和全文搜索。
  • 当前“小网站”列表充斥大量关于 LLM 和 AI 编程代理的内容,反映出平台算法或用户兴趣的偏移,令人失望。
  • 现有系统对“小网站”的定义和推荐机制,忽略了互联网早期那种非中心化、非商业化的探索精神,难以真正还原“小网站”的本质。
  • 一些人希望存在一个专门筛选由 LLM 生成但非垃圾内容的网站列表,用于对比和研究。
  • 有人指出,Kagi 的“小网站”本质上是一个博客圈,其推荐逻辑受限于 RSS 和更新频率,无法覆盖更广泛的非博客类优质网络内容。
  • 互联网的媒介演进决定了人们不再自然地以 90 年代的方式互动,试图复刻 Geocities 风格的尝试带有某种“超真实”的表演性质。

7. “小网络”的规模远超你的想象 (The “small web” is bigger than you might think) #

https://kevinboone.me/small_web_is_big.html

作者 Kevin Boone 探讨了“小网络”(small web)的规模与活跃度,指出这一概念指的是非商业、个人主导的网络空间,使用普通浏览器和服务器,避免广告与企业追踪。

他提到自己使用 Gemini 协议,这是一种限制性极强的网络协议,难以被商业化利用,目前全球约有 6000 个 Gemini 站点,活跃用户约百人,社区规模较小但充满活力。

作者原本设想为“小网络”构建类似 Gemini 的聚合器,能集中展示所有更新。他借助 Kagi 搜索引擎提供的“小网络”站点列表,该列表包含约 3.2 万个站点,但其中许多已失效或无更新。

通过程序筛选,他排除了无时间戳、无法访问或更新频率低于每月一次的站点,最终保留约 9000 个活跃站点。结果显示,仅在 3 月 15 日当天,就有 1251 条新内容发布,且每日更新量稳定。

结论是:尽管“小网络”规模远小于主流互联网,但其活跃度已超出单页聚合的可行范围。这既是好消息(说明小网络依然生机勃勃),也是坏消息(无法实现理想中的全面聚合)。

作者建议,更可行的方式是采用“用户主动订阅”的聚合模式,如 powRSS,仅收录少量精选站点,每日推送约 40 条更新。未来可按主题细分聚合,类似 Gemini 中“深空网络”专注非技术内容的做法。

最后强调,“小网络”的核心在于摆脱商业影响,其存在本身值得庆祝。


HN 热度 528 points | 评论 217 comments | 作者:speckx | 1 day ago #

https://news.ycombinator.com/item?id=47401879

  • 使用 shell 脚本随机访问独立博客网站是一种发现“小网络”内容的好方法,配合浏览器可自动打开多个页面。
  • 个人网站即使更新频率低也不代表废弃,偶尔更新比频繁声明“未更新”更令人安心。
  • 在网页头部添加 RSS/Atom 链接可提升订阅便利性,有助于非技术用户发现内容。
  • 尽管某些搜索工具转向 JavaScript,但仍有非 JS 版本可用,且技术演进不应被简单否定。
  • 个人网站的存在本身即具有意义,不一定要追求被广泛发现或传播,其价值在于自我表达。
  • 一些发现性平台依赖 RSS/Atom,缺乏这些格式的网站可能难以被收录,但并非完全不可见。
  • 网站是否被发现取决于多种因素,包括搜索引擎收录和社区传播,主动推广并非必要。
  • 有人认为“小网络”内容的发现需要一定可发现性,否则发布到网络的意义有限。
  • 个人网站的发布者应尊重自身创作节奏,不必因外界期待而强迫频繁更新。
  • 早期互联网开发者对当前技术讨论有独特视角,不应被简单归类为“技术落后”。
  • 一些人对“小网络”生态的发现机制表示担忧,认为其可能被特定群体或算法主导。

8. 美国医疗困境 (The American Healthcare Conundrum) #

https://github.com/rexrodeo/american-healthcare-conundrum

这是一个关于美国医疗体系高成本问题的开源研究项目,名为“美国医疗困境”(The American Healthcare Conundrum)。项目通过分析联邦数据,识别出可量化的浪费环节,并提出具体政策建议。

美国人均医疗支出约 14,570 美元,远高于日本(约 5,790 美元),且日本拥有 OECD 国家中最高的预期寿命。这一差距每年造成约 3 万亿美元的额外支出。

项目目前已发布三项核心研究,累计发现可节省 986 亿美元:

第一项:非处方药过度支出,每年浪费 6 亿美元。 Medicare 为可在药店直接购买的药品支付处方药价格,存在明显浪费。

第二项:同种药品价格悬殊,每年浪费 250 亿美元。美国支付的药品价格是其他发达国家的 7 至 581 倍,通过国际参考定价机制可大幅降低。

第三项:医院服务价格差异巨大,每年浪费 730 亿美元。商业保险公司支付的医院服务费用是 Medicare 的 2.54 倍。例如,髋关节置换手术在美国收费 2.9 万美元,而在多数发达国家低于 1.1 万美元。若将商业保险支付上限设定为 Medicare 费率的 200%,可节省约 730 亿美元。该机制已在蒙大拿州 Medicaid 和数千家自保雇主中成功应用。

所有分析均基于公开数据,代码完全开源,可复现。项目强调,相同医疗操作在不同国家价格差异巨大,根源在于定价机制而非医疗成本本身。

项目还修正了一项数据标签错误:原报告误标了医院所有制类型(非营利与营利),但最终节省估算未受影响,因核心数据来自 RAND 和 CMS 全国性统计。该问题已通过审计文件说明。

项目持续更新,目标是系统性揭示美国医疗体系中的可改进问题,推动政策改革。


HN 热度 506 points | 评论 598 comments | 作者:rexroad | 1 day ago #

https://news.ycombinator.com/item?id=47401809

  • 美国药品价格高昂,保险公司的药房福利管理(PBM)服务存在层层加价,实际成本远低于售价,且价格不透明,患者难以通过正常渠道获得合理价格。
  • 患者发现通过现金支付或使用像 Marc Cuban 的 CostPlus 这类直接购药平台,反而能以远低于保险支付的价格买到药品,说明中间环节的冗余和腐败是导致成本飙升的主要原因。
  • 健康保险公司的核心目标并非为患者提供合理医疗保障,而是通过复杂的流程和系统设计尽可能少赔付,以最大化股东利润,而非实现医疗公平或效率。
  • 美国医疗体系并非真正意义上的自由市场,尽管受严格监管,但其运作机制严重脱离价格信号,消费者和生产者均无法有效感知真实成本,导致资源配置扭曲。
  • 医疗服务供给受到人为限制,如开设影像中心需政府审批,这种准入壁垒由现有利益集团通过政治游说控制,进一步抑制竞争和创新。
  • 以营利为目的的保险公司存在系统性反患者激励,而非营利性保险公司(如凯撒医疗、蓝十字蓝盾)虽然也有低效问题,但整体更少出现恶意拒赔或压榨患者的行为。
  • 将保险公司改为非营利性质并引入基于结果的绩效指标,可能改善医疗系统效率,但需警惕 KPI 被操纵,如通过筛选高价值患者来“优化”数据。
  • 现行的医疗保险模式(如 Medicare Advantage)因过度追求财务指标而损害患者权益,而某些政府主导的非营利项目(如 FEP)在设定合理 KPI 方面表现更优。
  • 一些欧洲国家实行雇主代扣社保费用并统一缴纳至公共医疗体系,同时雇主可提供私人医疗补充,形成更高效、透明的医疗支付机制。

9. Meta 重新致力于 jemalloc 项目 (Meta’s renewed commitment to jemalloc) #

https://engineering.fb.com/2026/03/02/data-infrastructure/investing-in-infrastructure-metas-renewed-commitment-to-jemalloc/

Meta 宣布重新致力于 jEmalloc 项目,这是一个高性能内存分配器,在其软件基础设施中具有高杠杆效应。文章指出,尽管 jEmalloc 长期为 Meta 提供稳定和高效的支持,但近年来因技术债务积累和工程原则偏离,导致发展放缓。为此,Meta 认真听取社区反馈,反思自身管理方式,并与项目创始人 Jason Evans 等关键成员沟通,决定开启 jEmalloc 的新篇章。

原项目仓库已重新启用,Meta 承诺将作为项目维护者继续推动其发展。未来重点包括:清理技术债务、重构代码以提升可维护性;优化透明大页(THP)支持,提升 CPU 效率;改进内存打包、缓存和释放机制,提高内存使用效率;加强 AArch64(ARM64)平台的性能表现。

Meta 强调,信任需通过实际行动建立,希望通过持续投入和开放协作,重建社区信心。欢迎开发者参与贡献,共同塑造 jEmalloc 的未来发展。


HN 热度 503 points | 评论 233 comments | 作者:hahahacorn | 1 day ago #

https://news.ycombinator.com/item?id=47402640

  • Meta 重新承诺改进 jemalloc 的释放机制,旨在提升内存管理效率,尤其针对多线程环境下内存分配与释放的性能问题。
  • 早期的内核补丁通过优化内存页释放机制,避免不必要的内存清零操作,从而提升缓存局部性和整体应用性能。
  • 有工程师指出,该优化在特定场景下有效,但因系统部署策略变化(如频繁重启服务器),其优势在后期测试中未体现,导致补丁被移除。
  • 随着硬件演进(如 Ivy Bridge 架构),内存清零操作的性能成本降低,使得该优化不再显著。
  • jemalloc 后续改进了内存缓存机制,减少了对内核频繁回收内存的需求,从而降低了对清零操作的依赖。
  • 内核引入了 MADV_FREE 等更高效的内存回收机制,支持“懒回收”,避免了不必要的页表刷新和 TLB 无效化,进一步提升了性能。
  • 当前系统内存会计更加模糊,但 jemalloc 可通过启用“muzzy decay”机制利用这些新特性。
  • 早期 Meta 内部存在一种“杀死 X”式的文化,强调快速迭代和频繁部署,而非长期稳定性。
  • 频繁的持续部署策略虽提升发布效率,但也导致部分请求延迟升高,影响用户体验。
  • 内核补丁数量从上百个大幅缩减至十余个,推动了系统向主线 Linux 的靠拢,Meta 成为 Linux 发展的重要推动者之一。

10. 每增加一层审批,速度就降为原来的十分之一 (Every layer of review makes you 10x slower) #

https://apenwarr.ca/log/20260316

文章核心观点:每增加一层审批,流程速度就会降低 10 倍。这一现象看似夸张,实则普遍存在,且难以用理论解释,但实际经验反复验证其准确性。

作者以代码修复为例说明:

  • 30 分钟完成的简单修复,若需同事评审,耗时约 5 小时;
  • 若需架构团队批准,耗时约 50 小时(约一周);
  • 若需跨团队协调,耗时可达 500 小时(约 12 周,一个财季);
  • 顶层管理者推动变革,甚至可能耗时 2.5 年。

关键点在于:时间消耗主要来自“等待”,而非实际工作。AI 虽能提升编码效率,但无法解决审批延迟问题。即使 AI 快速生成代码,后续的审查、设计文档、跨团队协调等环节仍会将整体速度拖慢,最终结果可能与人工开发无异。

作者指出,AI 并未真正解决根本问题,反而可能引发“AI 开发者的精神崩溃”:

  • 用 AI 快速开发原型,却因频繁出错而陷入反复修复;
  • 试图用 AI 自检,结果需要构建 AI 框架;
  • 最终陷入无限循环,陷入“开发-修复-再开发”的恶性循环。

真正的症结在于:组织中层层审批虽能提升质量,但代价是速度急剧下降。作者引用德明的质量管理理念,指出“质量保证”(QA)阶段的叠加并非最优解。过度依赖检查和控制,反而会降低整体效率,甚至降低质量。

结论:唯一可持续提升速度的方式是减少不必要的审查环节。组织应通过更好的系统设计、信任机制和责任明确,而非增加审批层级,来实现高效协作。


HN 热度 493 points | 评论 290 comments | 作者:greyface- | 21 hours ago #

https://news.ycombinator.com/item?id=47408205

  • 通过将代码审查转变为设计讨论、每日站会和结对编程,可以大幅减少甚至取消传统代码审查,因为大部分问题在前期已解决。
  • 架构设计无法完全在白板上规划,实际开发中会暴露出许多未预见的问题,因此需要持续迭代和调整。
  • 在没有实际代码验证前,很难写出真实有效的设计文档,实际开发中的 POC(概念验证)往往比文档更有效。
  • 一旦积累类似项目经验,提前撰写设计文档会变得更容易,因为已有可参考的路径。
  • 采用端口与适配器等设计模式,能帮助在早期明确领域逻辑与实现分离,使设计更清晰且易于反馈。
  • 重点关注接口设计,尤其是在关键边界上,有助于提前锁定设计方向并避免错误实现。
  • 结对编程是高效开发方式,能显著提升代码质量与协作效率,但其推广受限于组织文化和习惯。
  • 结对编程不仅限于程序员之间,也可以与利益相关者、运维人员或跨团队成员协作,共同解决实际问题。
  • 对于复杂或范围广的任务,实时通话结对比异步沟通更高效,能快速达成共识。
  • 使用 AI 辅助编程时,与 AI 协作制定计划并互相审查代码,可视为一种新型的结对编程模式。
  • 真正的结对编程并非简单的代码审查,而是共同思考与决策的过程,其价值远超传统审查。
  • 结对编程虽高效,但对个人精力和社交互动要求高,长期高强度执行可能带来心理压力,需谨慎评估。

Hacker News 精彩评论及翻译 #

Kagi Translate now supports LinkedIn Speak as an o… #

https://news.ycombinator.com/item?id=47408967

Input : I hope you die early

Output : Wishing you a swift transition to your next chapter.

Vipsy

输入:I hope you die early(希望你早点死) 输出:Wishing you a swift transition to your next chapter(祝您快速过渡至人生下一篇章)


Kagi Translate now supports LinkedIn Speak as an o… #

https://news.ycombinator.com/item?id=47408858

Input: I am starting a new job at Google next Monday. I will work as a contractor cleaning toilets.

Output: I’m thrilled to announce that I’m starting a new chapter at Google this coming Monday! I’ll be joining the team as a specialized Environmental Maintenance Contractor, dedicated to optimizing facility hygiene and ensuring a world-class onsite experience. Grateful for this opportunity to contribute to such an innovative ecosystem! #NewBeginnings #GoogleLife #FacilitiesManagement #CareerUpdate

tkgally

输入:下周一我要开始在 Google 的新工作。我将以承包商身份负责清洁厕所。

输出:我很激动地宣布,下周一我将开启在 Google 的全新篇章!我将作为专业环境维护承包商加入团队,致力于优化设施卫生标准并确保世界级的现场体验。非常感激能有机会为这样一个创新生态系统做出贡献!#全新开始 #Google生活 #设施管理 #职业动态


AirPods Max 2 #

https://news.ycombinator.com/item?id=47402902

Wild. I have been eagerly awaiting this refresh, but this doesn’t address either of the main issues with the original AirPods Max:

  1. Still just as heavy. The AirPods Max sound quite good, but they are very heavy, to the point of being fairly uncomfortable after listening for any longer amount of time. This release as the exact same weight as the originals (13.6 oz).

  2. Still no off button/position. They stay partially on unless you put them in the awkward and useless “case”, which means they’re constantly out of power when you want to use them. There’s even an obvious fix: the ear cups swivel flat, they could just make this the “power off” position. Solved. But they didn’t, so presumably these still have the same problem. There’s also no mention of magnetic charging via stand, which would be another way to help alleviate this problem.

If these were even a few ounces lighter and powered off properly, I would buy them for sure. Given this announcement, I guess I will look for something else to replace the old AirPods Max.

StefanKarpinski

太疯狂了。我一直在急切地期待这次升级,但这并没有解决原版 AirPods Max 的任何一个主要问题:

  1. 依然一样重。AirPods Max 的音质相当不错,但它们非常重,以至于在佩戴稍长时间后,会让人感到相当不适。这次发布的版本重量和原版一模一样(13.6 盎司)。

  2. 仍然没有关机按钮或位置。除非你把它们放进那个极其别扭且毫无用处的“收纳盒”里,否则它们会一直处于开机状态,这意味着当你想要使用它们时,它们通常会处于没电状态。甚至有一个显而易见的解决方案:耳罩可以折叠成平面,他们只需要把这个位置定义为“关机”位置就可以了。问题本来就能解决。但他们没有,所以可以推测这些耳机仍然存在同样的问题。也没有提到是否支持通过支架进行磁吸充电,而这将是另一个能缓解这种问题(没电)的方法。

如果这些耳机哪怕轻几盎司,并且能正确关机,我肯定还是会买的。鉴于这个发布,我想我会找点别的东西来替换旧的 AirPods Max 了。


Silicon Valley’s “Pronatalists” Killed WFH. The St… #

https://news.ycombinator.com/item?id=47412696

I will die on this hill: tech firms that mandated 5 days in the office was about soft layoffs, rather than a principled stance on individual performance under WFH.

My “evidence” is that trading firms that kept raking in the money, and that benefit from maximum productivity of their employees, still generally have a hybrid work culture.

cosmic_quanta

我死守这个观点:强制要求每周5天回办公室的科技公司,实际上是软性裁员,而不是为了坚守远程办公下的个人绩效原则。我的“证据”是,那些依然赚大钱且能从员工的最大生产力中获益的交易公司,仍然普遍采用混合办公文化。


Beyond has dropped “meat” from its name and expand… #

https://news.ycombinator.com/item?id=47408507

This is such a weird comment.

Why do you think that “ethical vegans” like the “taste of plants” any more than anyone else? The whole point of being an ethical vegan/vegetarian is to not consume animals, not because you don’t like the taste.

Health conscious folks would definitely choose these over hamburgers. Sure, they’re not perfect from a health food point of view, but they’re lower in sodium and saturated fat than your average hamburger patty. So from a health conscious point of view, it’s a decent substitute.

Then there are the people who just want to reduce their meat consumption overall. Maybe they’re not vegan or vegetarian, but they’re trying to watch their saturated fat intake, or reduce their carbon impact, or they suffer from gout and are trying to reduce the amount of meat they eat to ease that.

Sometimes you just want to go out with your friends for a burger, and the Beyond patty can make a better substitute than a black bean or mushroom patty that used to be common.

And at most restaurants, I’ve never noticed a “premium” for it, it usually costs the same as a beef patty; it just provides another option, for the days I want to skip meat. I have, for a long time, done a low meat diet; I don’t avoid it entirely, but I try not to eat it at every meal. It provides a nice alternative for that.

Is it a bit of a niche market? Sure. But, not every product needs to be for everyone.

lambda

这真是一个奇怪的评论。

你为什么认为“道德素食者”会比其他人更喜欢“植物的味道”呢?做一个道德素食主义者/素食主义者的核心就是不食用动物,而不是因为你不喜欢肉的味道。

注重健康的人绝对会选择这些汉堡代替普通牛肉汉堡。当然,从健康食品的角度来看,它们并不完美,但它们的钠含量和饱和脂肪含量比普通牛肉饼要低。所以从注重健康的角度来看,这确实是一个不错的替代品。

还有那部分只想总体上减少肉类摄入的人群。也许他们不是素食主义者,但他们在尝试控制饱和脂肪的摄入,或者想减少碳足迹,又或者他们患有痛风,想通过减少肉类摄入来缓解病情。

有时候你只是想和朋友出去吃汉堡,Beyond肉饼是比以前常见的黑豆饼或蘑菇饼更好的替代品。

在大多数餐厅里,我从来没觉得它的价格有溢价,通常和牛肉饼一样价;它只是提供了一个额外的选择,供我想吃素的时候使用。长期以来,我一直奉行低肉饮食;我并不是完全不吃肉,但我会尽量避免每顿饭都吃肉。这为我提供了不错的替代选择。

这是一个小众市场吗?没错。但并不是每个产品都需要适合所有人。


Every layer of review makes you 10x slower #

https://news.ycombinator.com/item?id=47410130

This falls for the famous “hours of planning can save minutes of coding”. Architecture can’t (all) be planned out on a whiteboard, it’s the response to the difficulty you only realize as you try to implement.

If you can agree what to build and how to build it and then it turns out that actually is a working plan - then you are better than me. That hasn’t happened in 20 years of software development. Most of what’s planned falls down within the first few hours of implementation.

Iterative architecture meetings will be necessary. But that falls into the pit of weekly meeting.

alkonaut

这正是那句著名的“多花几个小时规划能节省几分钟的编码”。架构不可能(完全)在白板上规划完成,它是对困难的应对,而这种困难只有在你尝试去实现时才会意识到。

如果你能就“构建什么”和“如何构建”达成一致,最后发现这实际上是一个可行的计划——那你比我厉害多了。在我二十年的软件开发生涯中,这种情况从未发生过。计划中绝大部分内容在实现开始的头几个小时里就会失效。

迭代式的架构会议是必要的,但这又陷入了周会的陷阱。


Illinois Introducing Operating System Account Age … #

https://news.ycombinator.com/item?id=47416346

If I’m not mistaken, Meta has been lobbying heavily for all of these age-verification bills lately.

It seems their strategy is to externalize their responsibility to verify age themselves, and thus reduce their exposure to liabilities when child protection acts like COPPA are violated.

Slow_Hand

如果我没记错的话,Meta 最近一直在大力游说所有这些年龄验证法案。似乎他们的策略是将验证年龄的责任外部化,从而在他们违反像 COPPA 这样的儿童保护法案时,减少自身的法律责任风险。


US SEC preparing to scrap quarterly reporting requ… #

https://news.ycombinator.com/item?id=47407209

And it’s not just execs, but the whole corporate machinery that takes 3–6 weeks after quarter end to churn out reports.

Release early, release often.

If you want corporate machinery to run more smoothly with less effort, force it to operate more frequently not less: when TLS certs had 2-3 year lifespans there was all sorts of manual methods that people forgot how to do; then it was maximum one year. We then got free certs from LE (using ACME), but they were 90 days, so that made automation much more necessary.

Now with certs from public CAs having a max time of 47 days soon (not that I’m necessarily a fan) automation is all but a must.

So if you want less onerous effort on corporate reporting, your workflows and processes need to be much more automated: that’s one of the reason why computers were invented after-all, to make computations faster.

And one way to force automation is to insist on more frequent reporting, not less; Barry Ritholtz:

This is exactly backward: More frequent reporting makes the data less significant. In the real world, human behavior emphasizes what occurs less often—meaning doing something less frequently gives it an even greater significance than something that becomes routine or common.

That is the difference between a New Year’s Eve celebration and a married couple’s weekly date night.

Twice-a-year earnings reporting will make the event so momentous, with such focus on it, that any company that misses analysts’ forecasts will find their stock price shellacked. The twice-yearly focus on making the per-share number will become overwhelmingly intense.

Move from quarter / every-3-months to monthly reporting: companies will be forced to automate their “corporate machinery”. And each report will be much less ‘momentous’ because the time between samples will be much less.

throw0101c

这不仅仅是高管的问题,更是整个企业机制的问题,它在季度结束后需要 3-6 周的时间才能产出报告。

早日发布,频繁发布。

如果你希望企业机制运行得更顺畅、付出更少,那就强迫它更频繁地运作,而不是减少频率:当 TLS 证书有效期长达 2-3 年时,有各种各样的手动方法,人们甚至都忘了怎么做;后来缩短到了最长一年。我们后来获得了来自 Let’s Encrypt (使用 ACME) 的免费证书,但有效期只有 90 天,这使得自动化变得非常必要。

现在,随着公共证书颁发机构的证书最长期限即将缩短至 47 天(我也未必是个铁杆粉丝),自动化几乎是强制性的。

因此,如果你希望减轻企业报告方面的繁重负担,你的工作流程和流程需要更加自动化:这至少是发明计算机的原因之一,为了加快计算速度。

强制自动化的一种方法就是坚持更频繁的报告,而不是减少频率;Barry Ritholtz 说:

这完全是搞反了:更频繁的报告会让数据变得不那么重大。在现实世界中,人类行为强调的是那些发生得较少的事情——也就是说,发生得越少,它的意义甚至比那些变得例行公事或平常的事情还要重大。

这就是除夕夜庆祝和已婚夫妇每周约会之夜的区别。

每年两次的财报发布将使该事件变得如此重大,如此备受关注,以至于任何错失分析师预测的公司都会发现其股价遭受重创。每两年关注一次每股收益数字将变得具有压倒性的强烈程度。

https://www.fa-mag.com/news/reporting-profits-daily-would-end-short-termism-40430.html?section=232&page=1

从季度/每 3 个月一次的汇报转变为月度汇报:公司将被迫自动化他们的“企业机制”。而且,由于采样间隔大大缩短,每一份报告都将变得没那么“重要”。


AirPods Max 2 #

https://news.ycombinator.com/item?id=47402694

I don’t understand how a pair of headphones can be $549 meanwhile the Macbook Neo is $599

The pricing on these always seemed a bit crazy to me, like the value is way off compared to other Apple products

ex-aws-dude

我真的不理解,耳机怎么会卖到549美元,而Macbook Neo却只要599美元。 我觉得这些产品的定价总有点离谱,感觉和其他苹果产品相比,性价比严重不对等。


Kagi Small Web #

https://news.ycombinator.com/item?id=47413118

I’m a Kagi search/assistant user and advocate but the “small web” product is a frustrating misnomer.

To me the small web is any little website that was created to be interesting rather than to sell me something. That includes stuff like neocities, “shrine” type sites, single purpose sites, fandom portals, web experiments, etc.

Unfortunately Kagi’s definition of “small web” is: blog or webcomic. You must have an RSS feed and it must have recent posts. That rules out so much interesting stuff I don’t understand the point.

hamdingers

我是 Kagi 搜索/助手用户兼支持者,但“小网”产品实在是个令人沮丧的误称。

对我来说,所谓“小网”就是指任何为了有趣而创建的小网站,而不是为了推销产品给我。这包括 NeoCities、“神龛”类型的网站、单一用途的网站、粉丝门户、网页实验等。

不幸的是,Kagi 对“小网”的定义仅仅限于:博客或网络漫画。它必须要有 RSS 订阅源,并且必须最近有更新。这就排除了太多有趣的内容,我不理解这点的意义。


Give Django your time and money, not your tokens #

https://news.ycombinator.com/item?id=47414129

s/Django/the codebase/g , and the point stands against any repo for which there is code review by humans:

If you do not understand the ticket, if you do not understand the solution, or if you do not understand the feedback on your PR, then your use of LLM is hurting Django as a whole.

Django contributors want to help others, they want to cultivate community, and they want to help you become a regular contributor. Before LLMs, this was easier to sense because you were limited to communicating what you understood. With LLMs, it’s much easier to communicate a sense of understanding to the reviewer, but the reviewer doesn’t know if you actually understood it.

In this way, an LLM is a facade of yourself. It helps you project understanding, contemplation, and growth, but it removes the transparency and vulnerability of being a human.

For a reviewer, it’s demoralizing to communicate with a facade of a human.

This is because contributing to open source, especially Django, is a communal endeavor. Removing your humanity from that experience makes that endeavor more difficult. If you use an LLM to contribute to Django, it needs to be as a complementary tool, not as your vehicle.

I am going to try to make these points to my team, because I am seeing a huge influx of AI-generated PRs where the submitter interacts with CodeRabbit etc. by having Claude/Codex respond to feedback on their behalf.

There is little doubt that if we as an industry fail to establish and defend a healthy culture for this sort of thing, it’s going to lead to a whole lot of rot and demoralization.

jihadjihad

将 Django 替换为该代码库,这一观点同样适用于任何实行人工代码审查的仓库:

如果你不懂需求、不懂解决方案,或者不懂对你 PR 的反馈,那么你使用 LLM 的行为实际上是在拖累整个 Django 项目。

Django 的贡献者们想要帮助他人、想要建设社区,并且想要帮助你成为常驻贡献者。在 LLM 出现之前,这种感觉很容易察觉,因为受限于只能传达你所理解的内容。有了 LLM,你可以很容易地让审查者感觉到你“理解了”,但审查者并不知道你实际上是否真的懂。

透过这种方式,LLM 就成了你的一种伪装。它助你展现理解、思考与成长,却消除了作为人类所拥有的透明度和脆弱性。

对于审查者来说,与一个伪装的人类沟通是令人泄气的。

这是因为,尤其是在 Django 这样的开源项目中,贡献本身就是一种集体努力。从这种体验中抽离掉你的人性,会让这项事业变得更加困难。如果你要使用 LLM 来为 Django 做贡献,它应该充当辅助工具,而不是你的工具。

我正打算向我的团队阐述这些观点,因为我看到大量的 AI 生成的 PR,提交者通过让 Claude/Codex 代替自己回应 CodeRabbit 等工具的反馈来进行互动。

毫无疑问,如果我们这个行业未能为这类事情建立起并捍卫一种健康的文化,将会导致大量的腐烂和士气低落。


Every layer of review makes you 10x slower #

https://news.ycombinator.com/item?id=47408934

But you can’t just not review things!

Actually you can. If you shift the reviews far to the left, and call them code design sessions instead, and you raise problems on dailys, and you pair programme through the gnarly bits, then 90% of what people think a review should find goes away. The expectation that you’ll discover bugs and architecture and design problems doesn’t exist if you’ve already agreed with the team what you’re going to build. The remain 10% of things like var naming, whitespace, and patterns can be checked with a linter instead of a person. If you can get the team to that level you can stop doing code reviews.

You also need to build a team that you can trust to write the code you agreed you’d write, but if your reviews are there to check someone has done their job well enough then you have bigger problems.

onion2k

但其实是可以的。如果你把代码审查工作尽量往前移,把它们改成代码设计会议,在日常站会上提出问题,并在结对编程时攻克棘手部分,那么人们期望审查能发现的 90% 的问题就不存在了。如果你已经和团队商定好了要构建的内容,那么发现漏洞、架构和设计问题的期望就不复存在了。变量命名、空白符和代码风格模式这剩余的 10%,可以用 Linter 工具来检查,而不是靠人工。如果能让团队达到这个水平,就可以停止代码审查。此外,你还需要建立一支你可以信任的团队,让他们写出你们商定要写的代码,但如果你的审查只是为了检查某人工作做得是否足够好,那你就有更大的问题。


US SEC preparing to scrap quarterly reporting requ… #

https://news.ycombinator.com/item?id=47407646

Simultaneously they are opening up 0DTE options on certain stocks starting with large market caps but don’t be surprised when this expands. Currently this was limited to large etfs like SPX. They are also extending trading hours towards 24/7 and eventually 365.

How they square increasing liquidity with delaying information is insane.

I know there is a lot of manipulation to make quarterly numbers and the tax code is convoluted but if companies reported dollars in and dollars out live to shareholders at least we would have an idea of how the company is doing in a general sense. And over time would learn the flow of the company and be able to make informed predictions on the overall health of the company. More information is usually better than less with very few exceptions.

If they want to delay the earnings call to every 6 months to talk about the business I have no problems with that.

mcoliver

同时,他们正开始在大市值股票上推出0DTE期权,但对未来的扩张不要感到惊讶。目前这一举措仅限于像SPX这样的大型ETF。他们也在延长交易时间,向24/7全天候交易迈进,最终实现全年365天交易。他们如何协调增加流动性与延迟信息发布简直是疯了。我知道为了美化季度报表有很多操纵行为,税收制度也错综复杂,但如果公司能实时向股东报告进账和出账的资金,至少我们会对公司的总体状况有个大致的概念。随着时间的推移,我们会了解公司的运作流程,并能够对公司整体健康状况做出明智的预测。通常来说,更多的信息总是比更少的信息好,极少数情况除外。如果他们想每六个月一次地推迟财报电话会议来阐述业务情况,我是没有意见的。


Kagi Translate now supports LinkedIn Speak as an o… #

https://news.ycombinator.com/item?id=47410489

This is very funny.

Middle verse of Gangsta’s Paradise:

Reflecting on the current market landscape and the unique challenges of my professional journey.

Coming from a non-traditional background, I’ve had to pivot and align with high-performing teams to navigate complex environments. It’s easy to get distracted by the “noise,” but I remain laser-focused on strategic growth and ROI.

I’m a lifelong learner with a growth mindset, keeping my eye on the prize while maintaining a competitive edge. I’m fully committed to my organization, and we prioritize high-stakes execution—so let’s keep the professional synergy positive.

In this fast-paced industry, agility is everything. I’m operating in a “do or die” climate where meeting KPIs is the only option. Looking at the current burn rate and market volatility, long-term forecasting is a challenge, but I’m staying resilient.

#GrowthMindset #Resilience #StrategicLeadership #MarketTrends #ProfessionalJourney

marginalia_nu

这真是太搞笑了。

《Gangsta’s Paradise》的中段韵脚:

反思当下的市场格局和我职业生涯中独特的挑战。

源于非传统的背景,我不得不转型,与高绩效团队保持一致,以在复杂的环境中安身立命。很容易受到“噪音”的干扰,但我保持全神贯注于战略增长和投资回报率。

我是一名终身学习者,拥有成长型思维,在保持竞争优势的同时紧盯着目标。我完全致力于我的组织,我们优先考虑高风险的执行——所以让我们保持积极的职业协同。

在这个快节奏的行业里,敏捷性是一切。我正处于一种“要么成功要么死”的氛围中,达成关键绩效指标是唯一的出路。看着目前的成本消耗率和市场波动,长期预测是一个挑战,但我依然保持坚韧。

#成长型思维 #韧性 #战略领导力 #市场趋势 #职业旅程


Beyond has dropped “meat” from its name and expand… #

https://news.ycombinator.com/item?id=47405147

I always wondered who their demographic was. The core early adopters, the ethical vegans, who actually like the taste of plants are never going to make a lab made ultra processed salt bomb their daily driver (never mind issues surrounding industrial agriculture). Health-conscious folks would take one look at the ingredient list and bail because of the heavy processing and industrial fillers. You’ve got bodybuilders and athletes skipping it because it lacks the micronutrient density and bioavailability of real animal protein. Everyday folks aren’t exactly lining up to pay a “green premium” for something that tastes almost like a burger but costs more and offers less. It feels like they built a product for a tiny, hyper-specific niche: people who desperately crave the experience of a fast-food patty but have an ideological dealbreaker with meat, while being well off enough that finances aren’t carefully managed and loose enough in their convictions that a burger-joint is still ok. It always seemed like an odd propsition to me, even if cool in some ways.

Grimblewald

我一直很好奇他们的目标受众是谁。那些核心的早期采用者、出于道德原因吃素且实际上也喜欢植物味道的人,绝不会把这种实验室制造的超加工“盐炸弹”当作日常消费品(更不用说工业化农业带来的问题了)。关注健康的人只要看一眼配料表,就会因为重度加工和工业填充剂而打退堂鼓。你还能看到健美运动员和运动员跳过它,因为它缺乏真正的动物蛋白的微量营养素密度和生物利用度。普通人可不乐意排着队去为那种吃起来几乎像汉堡包的东西支付“绿色溢价”,毕竟它不仅更贵,价值还更低。感觉他们是为一个极小且高度细分的利基市场打造了这款产品:那些极度渴望快餐肉饼体验,但在意识形态上对肉类有死结,同时又足够富有以至于不精打细算,信念又足够松动以至于去汉堡店吃顿饭也是没问题的那些人。对我来说,这总是个奇怪的主张,尽管它在某些方面确实很酷。


The American Healthcare Conundrum #

https://news.ycombinator.com/item?id=47405916

Lots of people are saying nonsense here. The actual reason commercial insurers pay more is that’s the only way to can make more profits.

Because of Obamacare requiring 80% of the money they collect to be spent, the insurance companies just get to keep 20%. So insurance companies spend more so they can collect higher premiums. That’s how they make more money.

Several doctor friends have told me this as well.

timtim51251

这里很多人都在胡说八道。商业保险公司支付得更多的真正原因是,那是他们唯一能获取更多利润的方式。因为奥巴马医改规定他们收取的资金中必须有80%用于支付,保险公司只能留下20%。因此保险公司会花得更多,以便能够收取更高的保费。这就是他们赚更多钱的方式。几位医生朋友也告诉过我这一点。


The American Healthcare Conundrum #

https://news.ycombinator.com/item?id=47410834

The problems are so vast it is difficult to even describe to outsiders. For example, if I purchase a particular medication at a local pharmacy, it costs $25. However, my insurer mandates that I purchase it via their Pharmacy Benefit Managers (PBM) Optum, which charges $125. Easy enough right, you price shop? Well then it doesnt count towards your deductible. The whole thing is an elaborate trap to not pay.

Sometimes it is easier to just pay cash without insurance altogether. You need the medication today and dont have two weeks to fight it out with letters and forms, then it definitely doesnt count towards your deductible (and also, what is the purpose of the pharmacy coverage insurance?)

TuringNYC

这些问题错综复杂,简直难以向外行描述。例如,如果我去当地药店买某种药,只需25美元。然而,我的保险公司强制规定我必须通过他们的药房福利管理公司(PBM)Optum购买,它却要价125美元。这很简单,对吧?你可以去比价啊。但是那样的话,这就不计入你的免赔额了。整个系统就是一个精心设计的陷阱,旨在让你掏腰包。

有时候,干脆直接用现金全款支付,完全不动用保险,反而更省事。你今天急需药物,没有时间花两个星期去和那些信件、表格纠缠不休,那么这笔费用绝对也算不进免赔额(而且,这保险里覆盖药房的初衷到底是什么?)


2026 03 17 HackerNews

2026-03-17 08:32:58

2026-03-17 Hacker News Top Stories #

  1. 预测市场Polymarket的赌徒为操纵赌局结果,威胁记者篡改关于伊朗导弹袭击的报道,暴露了金融投机与虚假信息合流对新闻独立性的新型威胁。
  2. 加拿大《合法获取法案》在取消部分无证索取权的同时,要求电子服务提供商保留元数据并协助执法测试数据访问,仍存在"后门"监控和重大隐私安全隐患。
  3. 现代新闻网站因广告驱动的商业模式导致单页面数据量高达49MB,大量跟踪脚本和"敌对设计"严重违反可用性原则,将用户注意力作为数据收割原料。
  4. 基于62国数据的研究表明,腐败在民主国家对社会信任的侵蚀显著强于专制国家,因民主制度强调公平契约,腐败被视为对价值观的背叛而产生"规范放大效应"。
  5. 文章呼吁停止未经审阅直接复制粘贴AI生成内容的"Sloppypasta"行为,强调应主动验证和个性化处理AI输出,避免将验证负担转嫁给接收者并维护专业信任。
  6. 英国国防部内部专家警告,美国AI公司Palantir深度整合政府多部门数据,即使不直接接触机密也能通过分析推断国家机密,构成"国家级安全威胁"。
  7. Chrome DevTools MCP服务器新功能支持编码代理直接连接运行中的浏览器会话,复用登录状态并访问调试面板,实现更高效的自动化调试体验。
  8. 作者分享借助LLM开发软件的新范式,认为开发者应从关注编码细节转向系统架构设计,利用AI工具即使不逐行审阅代码也能构建可维护的复杂应用。
  9. 纳斯达克为迎合SpaceX上市提议修改指数规则,允许新公司快速入指并对低流通股给予高权重乘数,这将迫使被动基金以虚高价格买入,损害普通投资者利益。
  10. 基于美国劳工统计局数据的交互式可视化工具显示,尽管软件开发岗位市场增长,但面临签证移民和本土毕业生的双重供给压力,长期增长可持续性存疑。

1. Polymarket 赌徒因伊朗导弹事件威胁要杀我 (Polymarket gamblers threaten to kill me over Iran missile story) #

https://www.timesofisrael.com/gamblers-trying-to-win-a-bet-on-polymarket-are-vowing-to-kill-me-if-i-dont-rewrite-an-iran-missile-story/

2026 年 3 月 10 日,伊朗向以色列发射一枚导弹,击中耶路撒冷以南的贝特谢梅什附近一片林地,未造成人员伤亡。以色列《国土报》军事记者埃马努埃尔·法比安(Emanuel Fabian)在报道中援引救援部门和现场视频,确认该事件为一枚未被拦截的导弹直接命中。

然而,此后法比安接连收到多名匿名人士的邮件与消息,要求他修改报道,声称该地点实际是拦截导弹的碎片坠落,而非完整导弹击中。发件人 Aviv 和 Daniel 均以“为国家利益”“帮助很多人”为由,要求他当晚更新文章,甚至暗示若不配合将带来严重后果。

其中一名发件人 Daniel 更明确表示:“如果你今晚不改,你正在让很多人失望。”他还附上一份误标为《经济学人》的印度媒体截图,声称法比安的报道已被引用,造成连锁错误。

法比安发现,这些联系人活跃于 X(原推特)和 Discord 平台,且与名为 Polymarket 的预测市场网站有关。该平台允许用户对事件结果下注,包括“伊朗导弹是否击中以色列”等议题。

经调查,这些匿名人士的真实目的,是通过施压记者,确认导弹是否真正击中以色列,以影响 Polymarket 上相关赌局的赔率。一旦确认导弹未被拦截,下注“伊朗成功打击以色列”的用户将获利。

法比安指出,这些行为已构成严重威胁,甚至涉及人身安全。他强调,自己作为记者,必须基于事实报道,不受外部压力影响。目前,他仍坚持原报道内容,即导弹确为未被拦截的完整弹头击中。

该事件揭示了现代信息战中,虚假信息与金融投机的结合,以及媒体独立性面临的新型威胁。


HN 热度 1277 points | 评论 854 comments | 作者:defly | 12 hours ago #

https://news.ycombinator.com/item?id=47397822

  • Polymarket 的出现反映了亚当·斯密“自由市场”思想的极端化,这种思想被批评为放纵甚至带有“撒旦”色彩,可能导致对名人、政客甚至普通人的死亡进行赌博。
  • 亚当·斯密实际上是一位道德哲学家,他批评赌博和国家主导的赌博,认为人类对自身能力的过度自信是一种道德缺陷,因此对他的思想被曲解为支持无限制市场自由是一种误解。
  • 将亚当·斯密的名字用于为商业不当行为辩护,是对其思想的误读,他本人对商人过度逐利的行为持批判态度,其核心关注点是社会整体福祉而非市场效率。
  • 左翼思想家并非一味批评亚当·斯密,而是将其视为政治经济学的重要奠基人,尽管认为其理论存在局限,但其关于阶级意识与共同利益的讨论仍具启发性。
  • 亚当·斯密的著作中明确指出了“看不见的手”带来的问题,强调市场机制可能引发社会异化与劳动剥削,这些警示对现代政策制定具有现实意义。
  • 尽管亚当·斯密的思想被广泛误用,但真正的问题在于社会对市场机制的盲目崇拜,而非其本人的原意,应更关注其对市场失灵的深刻洞察。
  • 与其过度依赖古典思想家的权威,不如让当代思想家在现实语境中反思技术与资本的结合,如 Polymarket 所体现的“私有化国家情报”趋势。
  • 亚当·斯密与马克思的思想都被后人简化和工具化,其复杂理论被简化为意识形态标签,导致对真实问题的讨论被遮蔽。
  • 试图通过回归古典思想来解决现代问题是一种无效的循环,真正的挑战在于面对技术与资本结合所催生的新形式的权力集中。
  • 任何社会都难以完全脱离市场机制,但自由市场并非唯一选择,非自由市场社会如北朝鲜或亚马逊部落社区也存在,只是其发展水平与生活质量难以与现代自由社会相比。

2. 《合法获取法案》(Bill C-22):危险的后门监控风险依然存在 (Bill C-22, the Lawful Access Act: Dangerous backdoor surveillance risks remain) #

https://www.michaelgeist.ca/2026/03/a-tale-of-two-bills-lawful-access-returns-with-changes-to-warrantless-access-but-dangerous-backdoor-surveillance-risks-remains/

文章讨论了加拿大新推出的《合法获取法案》(Bill C-22),该法案标志着政府在“合法获取”议题上的新一轮立法尝试。与去年因过度扩大权力而受挫的 Bill C-2 相比,Bill C-22 在部分条款上有所调整,但仍存在严重隐私与安全风险。

法案分为两大部分:第一部分涉及“及时获取数据与信息”,已作出重要改进。政府取消了原法案中针对所有服务提供者的广泛、无需法院授权的信息索取权,转而设立“服务确认请求权”,仅允许执法机构向电信运营商询问某人是否为其客户。更敏感的个人数据获取则需通过法官批准的生产令,这符合加拿大最高法院近期关于隐私权的判例精神,是重大进步。

然而,法案的第二部分——《支持授权获取信息法案》(SAAIA)则保留了极具争议的监控机制。它要求所有“电子服务提供者”(ESP)——包括谷歌、Meta 等国际平台——必须为执法机构提供“合理协助”,以测试其数据访问和拦截能力。ESP 的定义极为宽泛,涵盖任何在加拿大提供电子服务的实体,无论其是否在本地运营。

核心提供商(core providers)将面临更严格义务,包括:开发和维护执法可访问的技术能力、安装相关设备、提交通知,并保留特定元数据(如通信传输数据)长达一年。尽管法案明确禁止保留内容信息、网页浏览历史和社会媒体活动记录,但元数据的强制保留仍引发隐私担忧。

此外,法案允许政府在特定情况下引入系统性安全漏洞,这可能严重威胁网络整体安全。虽然新增了情报专员对部长命令的审批机制,但整体仍缺乏透明度,且对跨境数据共享未设有效限制。

总体来看,尽管法案在部分程序上有所收敛,但其对网络基础设施的强制监控要求、对国际平台的广泛管辖以及对安全漏洞的容忍,仍构成对公民隐私和网络安全的重大挑战。作者警告,这些条款可能带来长期的“后门”风险,值得高度警惕。


HN 热度 975 points | 评论 316 comments | 作者:opengrass | 1 day ago #

https://news.ycombinator.com/item?id=47392084

  • 该法案允许在特定情况下不向被调查者提供搜查令副本,存在滥用权力的主观漏洞,可能损害公民权利。
  • 在调查犯罪组织时,不通知嫌疑人可避免其中断非法活动,有利于获取完整证据链。
  • 犯罪分子停止犯罪行为本身是一种积极结果,不应一味追求“大抓捕”和长期监控。
  • 传统上警察通过公开存在感进行威慑,如今数字监控使执法方式变得隐蔽且缺乏透明度。
  • 执法人员若缺乏信任,过度依赖隐蔽监控可能演变为对普通公民的骚扰。
  • 警察应通过公开巡查和询问等方式开展调查,而非依赖长期隐蔽监控。
  • 隐蔽监控的正当性应有时间限制,若无法在合理期限内证明犯罪,应终止调查并告知当事人。
  • 任何个人或组织都可能被随意定义为“犯罪组织”,从而成为长期监控对象,存在政治滥用风险。
  • 民主社会中,公民不应被无故调查而不知情,这是基本权利保障。
  • 该法案并未免除搜查令要求,只是允许在特定情况下不向相关方出示,本质上仍受法律约束。
  • 与美国相比,加拿大在数据监控方面限制更严格,当前措施并非前所未有。
  • 互联网服务提供商作为技术执行方,无需知晓搜查令内容,因其已掌握用户身份信息。
  • 搜查令一旦签发,应有明确有效期,且执法机构需在一定期限后通知被监控者。
  • 监控行为的合法性应参照传统电话监听的法律框架,已有成熟判例支持。

3. 49MB 的网页页面 (The 49MB web page) #

https://thatshubham.com/blog/news-audit

现代新闻网站的页面加载体验已严重恶化,一篇简单的文章加载可能消耗高达 49MB 的数据,涉及 422 个网络请求,耗时数分钟。这一体积甚至超过 Windows 95 操作系统(28 张软盘)的总和,相当于下载 10 至 12 首高质量 MP3 歌曲。尽管硬件性能大幅提升,但前端框架与广告技术堆栈的臃肿反而抵消了进步。

页面加载过程中,浏览器需处理大量跟踪脚本和程序化广告竞价,这些操作在后台悄然进行,占用 CPU 资源,导致设备发热、风扇运转、电池快速消耗。广告系统通过频繁的 POST 请求、像素追踪和跨站身份关联,构建用户画像,形成一场“高频率数字交易市场”般的监控行为。

更讽刺的是,这些行为往往打着“合规”旗号,如使用名为“purr.nytimes.com”的 TCF(透明与同意框架)接口,实则在用户不知情下持续采集数据。用户被迫点击 cookie 同意弹窗,却仍被后台持续追踪,形成“法律盾牌”与“数据掠夺”并存的悖论。

根本原因在于经济驱动:出版商为追求短期广告收益(CPM),牺牲用户体验,采用“敌对设计”策略。页面停留时间、广告可见性等指标成为核心 KPI,导致设计不断强化干扰——如强制弹窗、多重登录提示、广告占据 95% 屏幕空间等。用户必须完成一系列“数字家务”才能阅读内容,交互成本极高。

典型案例包括《经济时报》页面:用户刚进入即遭遇“Z 轴战争”——底部 cookie 横幅、中间订阅弹窗、右上角通知请求同时弹出,且关闭按钮设计低对比度,难以发现。这种多重干扰严重违反可用性原则,违背“内容优先”设计逻辑。

最终,现代新闻网站已演变为以用户注意力为原料的“数据收割场”。读者的耐心与认知负荷被系统性榨取,而内容本身却被边缘化。这不仅是技术问题,更是商业模式与伦理失衡的体现。


HN 热度 774 points | 评论 346 comments | 作者:kermatt | 1 day ago #

https://news.ycombinator.com/item?id=47390945

  • 开发者在高速网络下开发时容易忽视性能问题,导致网站在低速网络下表现极差。
  • 使用浏览器开发者工具中的网络和 CPU throttling 功能,可以有效模拟慢速网络环境,帮助优化网站性能。
  • 有开发者曾因忘记关闭模拟慢速网络设置,导致误判性能问题,浪费大量时间优化。
  • 旧设备或低带宽环境下,现代网页加载缓慢甚至崩溃,凸显优化必要性。
  • 使用轻量级浏览器如 Lynx 或 Links,能在资源有限的设备上更高效地浏览网页。
  • 一些开发者故意在前端代码中加入延迟,以展示加载动画,这种做法缺乏对用户体验的基本尊重。
  • 管理层和产品负责人也应体验慢速网络环境,才能真正理解性能优化的重要性。
  • macOS 用户可通过 Network Link Conditioner 工具全局模拟不同网络条件,便于测试。
  • 某些网站故意在 JavaScript 中加入人为延迟,以展示 UI 动画,这种行为令人难以理解。
  • 有开发者曾因未关闭系统级网络限速工具(如 tc netem),导致测试环境异常,影响开发效率。
  • 网络限速功能在测试后容易被遗忘,导致误判性能问题,需养成良好习惯。
  • 未来或许可以出现“浏览器即服务”模式,由服务器端快速加载页面并传输给用户。

4. 腐败对社会信任的侵蚀在民主国家比在专制国家更为严重 (Corruption erodes social trust more in democracies than in autocracies) #

https://www.frontiersin.org/journals/political-science/articles/10.3389/fpos.2026.1779810/full

本文发表于《Frontiers in Political Science》2026 年 3 月 2 日,属于“和平与民主”栏目,探讨了腐败对社会信任的影响在不同政体中的差异。研究聚焦于一个核心问题:为何在民主国家中,腐败对社会信任的破坏作用比在专制国家更为显著。

研究提出两个理论机制:一是“规范放大效应”,即民主制度强调平等与公正,腐败被视为对社会契约的背叛,从而严重削弱公众对社会整体的信任;二是“代表传染效应”,在民主制度下,腐败官员由民众选举产生,公众可能将腐败行为与自身联系起来,产生自我归因的负罪感,进而降低信任。而在专制国家,腐败被视为精英阶层的常态,与普通民众隔离,因此对社会信任的冲击较小。

研究基于 62 个国家的个体调查数据与国家层面的民主质量指标,采用多层次分析方法,验证了上述理论。结果显示,感知腐败确实普遍降低个体的普遍信任水平,但这一心理机制在民主国家中显著更强,即使控制了不平等和国家层面腐败程度等变量后依然成立。

研究结论指出,民主制度所依赖的问责机制,也使其社会资本更加脆弱。腐败不仅损害制度信誉,更通过心理机制侵蚀民主社会的团结基础。这一发现对理解民主韧性具有重要意义:民主国家在应对腐败时面临独特挑战,必须加强制度透明与公众信任重建。

文章数据来自全球范围,涵盖从俄罗斯、伊朗等国家到新西兰、荷兰等稳定民主国家,具有较强的代表性。研究为民主治理中的信任危机提供了深层解释,并呼吁政策制定者关注腐败对社会心理的长期影响。


HN 热度 631 points | 评论 326 comments | 作者:PaulHoule | 13 hours ago #

https://news.ycombinator.com/item?id=47397593

  • 在威权体制中,腐败被视为维持社会运转的必要手段,官员通过索要贿赂来推动事务进展,普通民众为获取服务也需参与其中,形成一种依赖关系。
  • 在低信任社会中,遵守规则无法获得结果,拒绝腐败反而会遭遇更多障碍,因此不参与腐败几乎等同于自我边缘化。
  • 腐败在威权社会中是系统性存在,已成为经济运行的一部分,拒绝参与会带来生活上的巨大困难,类似在现代西方社会“离网生活”。
  • 腐败并非普遍可及,其本质是一种隐性社会资源分配机制,通过关系网络(如 blat)实现资源交换,而非简单的金钱交易。
  • blat 是一种基于个人信任的关系网络,通过长期互惠的非正式交换(如物资、服务、信息)来达成目标,其核心是信任而非金钱。
  • 腐败行为常表现为公职人员利用职权为私人关系提供便利,如免费维修、优先购票、子女入学等,这些行为本质上是滥用公共权力。
  • 在威权体制下,腐败是获取稀缺资源的必要途径,而拒绝参与将导致个人在社会中处于不利地位。
  • 腐败在西方更多体现为权贵阶层通过金钱和关系绕过规则,实现利益输送,而非普通民众的日常行为。
  • 腐败的隐蔽性使其难以被制度化,但其存在被广泛知晓,尤其在资源分配不公的环境中,普通人无法通过正常渠道获得服务。
  • 腐败本质上是一种社会筛选机制,使有能力者通过非正式渠道获得优势,而守法者因不符合“潜规则”而被排除在外。
  • 腐败的长期存在会削弱社会对规则的信任,形成恶性循环,使制度性治理更加困难。

5. 杜绝随意粘贴 (Stop Sloppypasta) #

https://stopsloppypasta.ai/

本文探讨了“Sloppypasta”这一现象,即未经审阅、未加修改、直接复制粘贴的 AI 生成内容被随意发送给他人,尤其在工作沟通中表现明显。这种行为虽看似高效,实则对收件人造成额外负担,因对方需自行验证内容真实性、相关性与准确性。

文章指出,Sloppypasta 的常见形式包括:将 AI 生成的通用策略建议、邮件打开率下降分析或竞争对手报告直接转发,而未结合具体情境或团队讨论背景。这些内容往往缺乏具体数据、来源或时效性,却以“我让 AI 分析了”为由被当作个人见解呈现。

作者强调,这种行为本质上是责任转嫁:发送者省去了思考与验证的步骤,却要求接收者承担认知成本。这打破了过去“写”与“读”之间相对平衡的努力关系,造成“努力不对等”,引发接收者的挫败感。

此外,Sloppypasta 损害信任。现代大模型虽能生成流畅文本,但存在“幻觉”(hallucination)风险,即编造事实。若发送者未核实内容,接收者无法判断信息真伪,长期下来会削弱对发送者专业性的信任。

文章引用多位专家观点,指出写作是思考的过程,通过写作能加深理解与记忆。若过度依赖 AI 生成内容,反而会降低自身认知能力,形成“认知债务”。

最后,作者呼吁:在沟通中应避免直接转发 AI 输出,而应主动提炼、验证、个性化内容,体现个人判断与专业价值。真正的协作不是复制粘贴,而是共同思考与创造。


HN 热度 610 points | 评论 241 comments | 作者:namnnumbr | 1 day ago #

https://news.ycombinator.com/item?id=47389570

  • AI 生成的 Jira 工单内容冗长且不切实际,常包含无关功能,导致开发团队难以理解,甚至需要重新编写。
  • 一些团队成员将 AI 生成的工单视为“手写”内容,拒绝承认其来源,导致沟通障碍和误解。
  • AI 生成的工单缺乏上下文和逻辑一致性,尤其在缺乏熟悉旧代码库的人员时,问题更加严重。
  • 工程师过度依赖 AI 生成代码或文档,导致自身对系统理解不足,职业成长受限。
  • 有人利用 AI 生成的模糊工单作为招聘要求,制造“无法理解”的岗位,实为讽刺性现象。
  • 生成的 PR 描述冗长且空洞,充斥“更好的架构”“更干净的代码”等无意义术语,实际信息量低。
  • 有人在使用 AI 生成内容时仍需手动精简和审查,反而增加了工作量,效率并未提升。
  • 用 AI 生成支持工单或邮件,导致信息被淹没在无用文本中,增加了运维人员的排查成本。
  • AI 生成内容的泛滥使团队信任度下降,甚至被视为对同事的不尊重,影响团队协作氛围。
  • 有人建议在使用 AI 时明确限制输出长度和受众,以提升内容质量,但仍需人工审核。

6. 英国国防部警告:帕兰提尔深度介入政府核心构成国家安全威胁 (MoD sources warn Palantir role at heart of government is threat to UK security) #

https://www.thenerve.news/p/palantir-technologies-uk-mod-sources-government-data-insights-security-state-secrets

英国国防部(MoD)内部两名高级技术专家匿名透露,美国人工智能与监控公司帕兰提尔(Palantir)在英国政府中的深度介入已构成“国家级安全威胁”。尽管政府声称所有数据仍归英国所有,但这些技术人员指出,这种说法忽视了帕兰提尔通过数据聚合与分析能力,能够构建出关于英国社会的全面画像,甚至推导出国家机密信息。

帕兰提尔已获得超过 6.7 亿英镑的英国政府合同,包括 1.5 亿英镑的国防投资协议及 1500 万英镑与英国核武器机构的合作。专家强调,即便原始数据由政府掌控,但帕兰提尔通过整合不同部门的非机密信息,可生成高度敏感的结论。例如,仅凭一个北约零件编号、送达地址和日期,就能推断出核潜艇在特定时间抵达迪戈加西亚港的位置。

这些技术专家警告,帕兰提尔已能将国防、医疗、交通、能源及工业基础设施等多领域数据整合,形成对英国国家运行的全景式掌握。这种能力不仅对外国势力构成风险,也使英国在与美国等盟友的互动中处于被动地位。若美国掌握这些信息,可能在外交或军事决策上对英国施加隐性压力。

英国开放权利集团执行董事吉姆·基洛克指出,帕兰提尔的全面数据洞察力,使美国在必要时拥有“巨大杠杆”。他批评英国政府对帕兰提尔的依赖,是与一个“妄自尊大、无视自身局限”的外国权力绑定。

与此同时,帕兰提尔在美国内政中也引发争议,其技术被用于移民驱逐和建立全美可搜索公民数据库。美国军方也在多个地区使用其 AI 系统。相比之下,瑞士军队已拒绝该技术,担忧其带来的主权与安全风险。

目前,英国国防部未对相关指控作出回应,但此前表示已通过合同条款确保数据主权。然而,技术专家认为,这种“数据所有权”说法在实际操作中毫无意义,如同读完一封机密情书后声称内容安全,实则已掌握全部信息。


HN 热度 578 points | 评论 234 comments | 作者:vrganj | 12 hours ago #

https://news.ycombinator.com/item?id=47397797

  • Palantir 因瑞士媒体揭露其被多个政府机构拒绝合作而提起诉讼,但实际可能是行使法律赋予的回应权利,而非压制言论。
  • 有观点认为 Palantir 的商业模式本质是为股东利益服务,通过权力关系将资金输送给特定关系网,缺乏真实业务价值。
  • Palantir 与全球规模的情报、监视与侦察系统整合多年,其技术已超越国家层面,构成全球性安全威胁。
  • 该公司被指与“黄金穹顶”导弹防御系统有关联,进一步强化其作为全球安全威胁的形象。
  • Palantir 的崛起与彼得·蒂尔的愿景密切相关,其目标是通过技术手段削弱民主制度,实现精英统治。
  • 蒂尔将 Palantir 命名源自《指环王》中邪恶势力使用的邪恶之眼,这一命名选择被批评为具有象征意义的讽刺。
  • 蒂尔公开谈论“反基督”并认为其可能存在于当代,这种言论被批评为极端且脱离现实,与基督教教义相悖。
  • 蒂尔支持特朗普、推动“项目 2025”等行动,其政治立场与通过制造“替罪羊”来维持社会秩序的理论一致。
  • 蒂尔的宗教观点受勒内·吉拉尔影响,认为社会需要通过牺牲特定群体来避免崩溃,这种思想被批评为危险且非主流基督教信仰。

7. Chrome DevTools MCP 服务器现已支持编码代理直接连接运行中的浏览器会话,实现更高效的调试体验 (Chrome DevTools MCP (2025)) #

https://developer.chrome.com/blog/chrome-devtools-mcp-debug-your-browser-session

Chrome DevTools MCP 服务器现已支持让编码代理直接连接到正在运行的浏览器会话,带来更高效的调试体验。该功能允许编码代理复用现有登录状态,无需重复登录,特别适用于需要身份验证的场景。同时,代理可直接访问 DevTools 中的活动调试会话,例如在“网络”或“元素”面板中选中问题请求或元素后,交由编码代理分析并修复。

此功能基于 Chrome M144(Beta 版)的新特性,通过启用远程调试并配置 MCP 服务器使用 –autoConnect 参数实现。用户需在 chrome://inspect#remote-debugging 页面开启远程调试,并在每次连接请求时手动授权。连接成功后,Chrome 顶部将显示“Chrome 正由自动化测试软件控制”的提示,确保安全性。

使用步骤包括:1)在 Chrome 中开启远程调试;2)配置 MCP 服务器启动时自动连接;3)通过命令行工具(如 gemini-cli)发起调试任务,系统将自动打开页面并执行性能分析等操作。

未来,Chrome 计划进一步开放更多 DevTools 面板数据给编码代理,实现更深度的 AI 协同调试。该功能让用户在手动调试与 AI 辅助之间无缝切换,提升开发效率。


HN 热度 577 points | 评论 230 comments | 作者:xnx | 1 day ago #

https://news.ycombinator.com/item?id=47390817

  • 使用 Playwright 拦截请求和响应,通过 Claude Code 自动化交互网站并生成强类型 API,以高效访问网站功能而不加载广告和冗余内容。
  • 利用 Playwright 调整页面宽度,自动捕获 DOM 树在不同状态下的样式变化,生成结构化数据和截图,用于还原页面布局与响应式行为。
  • 认为 MCP(Model Control Protocol)虽有使用门槛,但能标准化处理认证等复杂逻辑,提供比基础 HTTP 接口更安全的框架。
  • 指出 MCP 的设计初衷是为 AI 提供统一的工具访问接口,而 CLI 虽高效但无法在所有 Claude 表面(如 Cowork)中使用。
  • 认为当前对 MCP 的追捧是过度炒作,直接构建自定义 CLI 工具更高效,且能绕过不必要的抽象层。
  • 强调 MCP 与手动工具的本质区别:前者面向自动化 AI 操作,后者面向人类交互,前者效率远高于后者。
  • 认为 MCP 与 AI 模型的直接集成(如 Claude Code)结合,可实现“AI 速度”下的设计还原,如通过 SnipCSS 插件快速生成 Tailwind/CSS 代码。
  • 指出 MCP 的使用存在“摩擦”,但这种摩擦可能被部分用户视为“安全”或“可控”的体现。
  • 认为大公司(如 Meta)大规模爬取网页用于训练模型,与个人用户为提升效率而抓取数据,在目的和规模上完全不同,不应一概而论。
  • 认为广告和追踪器本质上是监控行为,用户有权拒绝,大公司推广此类行为反而应自食其果。
  • 强调用户对广告追踪的抵制是正当权利,而大公司利用用户数据牟利才是真正的“罪恶”。
  • 指出对爬虫行为的道德评判应区分“训练”与“推理”:前者涉及大规模、无差别数据采集,后者是精准、目标明确的信息获取,后者更可接受。
  • 认为用户通过自动化工具获取网页数据用于个人效率提升,与企业用于训练 AI 的行为在动机和影响上存在本质差异。
  • 使用 BrowserOS 搭建内置 MCP 服务器,结合 Claude Code 实现网页自动化与 API 生成,体验良好。
  • 通过 rtrvr.ai 扩展,仅通过提示即可让 AI 代理自动操作网页、记录网络请求,并生成带认证头的直接调用脚本,实现“一键自动化”。
  • 借助 WebMCP 框架实现类似功能,可将网页交互转化为可复用的强类型 API,具备良好扩展性。
  • 认为 Claude 本身已具备代理浏览器能力,无需依赖 Playwright,可直接生成确定性代码,实现更高效的自动化。
  • 指出 Agent-Browser 项目虽新,但功能完整,具备替代 Playwright 的潜力,值得尝试。

8. 如何用大语言模型编写软件 (How I write software with LLMs) #

https://www.stavros.io/posts/how-i-write-software-with-llms/

本文作者 Stavros 分享了自己使用大型语言模型(LLM)进行软件开发的全新工作流程和心得体会。他坦言,自己真正热爱的并非编程本身,而是创造事物的过程。随着 LLM 技术的进步,尤其是 Codex 5.2 和 Opus 4.6 等模型的发布,他发现可以高效、低错误率地构建复杂软件系统,且代码可维护性远超以往。

作者指出,LLM 的进化改变了开发者的核心能力需求:不再需要精通编码细节,而是更强调系统架构设计与技术选型能力。在熟悉技术栈的项目中(如后端开发),即使代码量达到数万行,系统依然保持清晰与稳定;而在陌生领域(如移动端),则容易因架构不当导致代码混乱。

他列举了几个实际项目来证明 LLM 开发的实用性:

  • Stavrobot:一个安全优先的个人智能助手,能管理日程、自主研究、生成代码、提醒任务,是真正日常使用的工具。
  • Middle:一个可随身携带的语音记录设备,自动转录并发送至指定接口,实现“零摩擦”记录想法。
  • Sleight of Hand:一件艺术装置钟,通过不规则的滴答声制造心理错觉,探讨时间感知。
  • Pine Town:一个无限多人协作的数字画布,用户可在虚拟草地上自由绘画,充满趣味与社区互动。

作者强调,尽管他从未完整阅读过这些项目中的大部分代码,却仍对整体架构了如指掌。这得益于他使用 OpenCode 作为开发“引擎”,并建立了一套高度结构化的交互方式。

文章最后附有真实编码会话记录,详细展示如何与 LLM 协作完成任务,包括需求描述、代码生成、调试与优化全过程。作者认为,当前阶段仍需人类开发者进行架构把控与质量审查,但未来可能只需关注更高层次的设计。他相信,这标志着软件开发进入一个全新的、充满可能性的阶段。


HN 热度 469 points | 评论 462 comments | 作者:indigodaddy | 23 hours ago #

https://news.ycombinator.com/item?id=47394022

  • 使用多角色代理协作的开发流程虽然看似有条理,但实际成本高昂,且在多数情况下无法超越单次高质量提示下的单一模型表现。
  • 单一模型在良好提示和上下文支持下,能够高效完成复杂任务,其输出质量与多角色协作相当,但成本和耗时显著更低。
  • 多角色代理协作的高成本主要源于角色间沟通与协调的开销,这种开销在人类组织中也普遍存在,但在模型间并不必要。
  • 尽管人类通过分工实现专业化,但大型语言模型具备跨领域知识整合能力,无需通过角色分离来提升表现。
  • 多代理系统在调试和追踪问题时存在严重困难,一旦出错难以定位,导致维护成本过高。
  • 不同模型之间虽有差异,但顶级模型训练数据高度重叠,其认知差异远小于人类专家之间的差异,难以真正实现多样视角。
  • 利用上下文差异或不同模型组合可部分模拟多视角,但效果仍不及真实人类多样性。
  • 某些早期流行的多步骤代理工作流如今已过时,因模型自身已能自动完成类似任务,手动干预反而可能降低效率。
  • 自动化上下文控制等技术虽潜力大,但目前提升有限,需更长时间打磨,短期内难以成为核心优势。
  • 任务文件结合可验证节点的流程设计,具备意图表达、过程记录与自我反思能力,是未来有潜力的开发范式。
  • 当前许多多角色协作模式属于“技术幻觉”或“临时性工具”,在模型能力快速进化背景下很快会被淘汰。

9. 纳斯达克的耻辱 (Nasdaq’s Shame) #

https://keubiko.substack.com/p/nasdaqs-shame

这篇文章名为《纳斯达克的羞耻》,作者 Keubiko 对纳斯达克最近对纳斯达克 100 指数方法的提案进行了深入分析和批评。作者表示,尽管他通常支持指数投资,但当前的市场情况让人感到不安,尤其是被动投资的资金涌入已经扭曲了市场的价格发现过程。

文章指出,纳斯达克最近发起了一项 “咨询”,旨在征求投资者对其指数方法更新的意见,但实际上这更像是一个强迫接受的通知,目的是为了迎合即将上市的 X 公司。据悉,SpaceX 希望能够快速进入纳斯达克 100 指数,以优于纽约证券交易所的方式进行 IPO。

文章详细介绍了两个主要的提案:

  1. ** 快速入场豁免(Fast Entry Exemption)**:新上市的大型公司可以在 15 个交易日后被添加到纳斯达克 100 指数,而无需遵循标准的流动性要求。
  2. ** 低流通股的 5 倍乘数(5x Multiplier for Low-Float Stocks)**:对于流通股少于 20% 的公司,纳斯达克提议将其在指数中的权重调整为其流通股比例的 5 倍。这意味着即使公司只有 5% 的流通股,按照这个方法计算,其在指数中的权重可以达到 25%。

作者认为,这样的做法会导致巨大的市场扭曲,尤其是被动投资基金在公司 IPO 后,必须以高于实际市场价格的水平购买这些股票,造成价格泡沫。此外,流动性的操控也会影响到公司的股价,并在锁仓期结束时,迫使被动投资者以不合理的高价购买更多股票最后,作者质疑纳斯达克和 SpaceX 之间的互动,并认为这种变更对普通投资者不利,可能会导致他们在高点买入股票,而真正的获益者则是内部人士和早期投资者。他还指出,尽管纳斯达克可能会在评论后修改提案,但这种情况可能很难被逆转。

文章以一种幽默讽刺的语气结尾,提醒读者对市场的复杂性和潜在的操控保持警惕,强调个人观点仅供娱乐,不应被视为投资建议。


HN 热度 398 points | 评论 154 comments | 作者:imichael | 1 day ago #

https://news.ycombinator.com/item?id=47392550

  • 索引基金因合同义务需购买新纳入公司的 20% 股份,但若该公司公开流通股仅占 5%,则基金无法通过市场购买足额股份,导致创始人可借此操纵股价,形成类似“逼空”的金融困境。
  • 评论者指出原例中计算错误,认为 20% 被动持有应对应 25% 的权重,且基金只需购买公开流通股的 25%,无需购买全部股份,因此不存在“除以零”的问题。
  • 原作者回应称,其简化模型中已考虑 20% 被动持有与 5% 流通股的匹配,使基金必须购买全部公开流通股,从而引发价格飙升,其模型逻辑成立。
  • 基金管理人可通过衍生品等方式跟踪指数,无需直接购买股票,因此不一定面临被迫高价购股的问题。
  • 索引基金的跟踪误差是正常现象,但故意不履行合同义务以规避高价购股并非合理解释,应追究操纵行为的责任。
  • 由于创始人通常有锁定期,基金在短期内无法从其他内部股东处购股,进一步加剧了对公开市场的依赖。
  • 纳斯达克新提案允许低流通股公司按 5 倍流通股比例加权,这可能放大指数对新公司的价格影响。
  • 指数基金的目标是跟踪指数,而非击败指数,即使因纳入导致股价虚高,基金仍会按规则执行,不关心后续价格回落。
  • 有观点认为,指数纳入本身是股价上涨的主因,而创始人或早期投资者可借此提前布局获利。
  • 若 SpaceX 被提前纳入指数,其股价将因基金被迫买入而暴涨,但若延迟纳入,可避免被市场“抢跑”。
  • 有人质疑该“逼空”机制是否真实存在,认为其更像是炒作概念,缺乏实际操作基础。

10. 美国就业市场可视化工具 (US Job Market Visualizer) #

https://karpathy.ai/jobs/

这是一个基于美国劳工统计局(BLS)数据的交互式可视化工具,名为“US Job Market Visualizer”。该工具展示了 342 个职业的就业情况,覆盖全美约 1.43 亿个工作岗位。每个职业以矩形表示,面积大小与该职业的总就业人数成正比。

用户可通过切换不同图层,查看各职业在多个维度上的分布情况:包括 BLS 预测的职业增长前景、中位数薪资、教育要求以及“数字 AI 暴露度”。其中,“数字 AI 暴露度”是通过大语言模型(LLM)评估得出的,衡量 AI 对某一职业的潜在影响程度,评分范围为 0 到 10。

该工具的核心功能之一是支持自定义 LLM 提示词,用户可编写新的评估问题(如对人形机器人、外包风险或气候变化的敏感度),由 LLM 为每个职业打分并重新着色,实现灵活的数据探索。

数据显示,当前有约 3410 万岗位面临负增长,占总数的 24%;而 9720 万岗位处于增长状态,占比达 68%。从薪资角度看,高薪职业(10 万美元以上)的平均增长前景最好,达到 8.7%。教育要求越高,职业增长预期也越强,拥有研究生及以上学历的职业平均增长达 11.3%。

值得注意的是,该工具并非正式报告或学术论文,而是一个用于探索和分析 BLS 数据的开发工具。其“数字 AI 暴露度”评分仅为粗略估算,不代表职业将被取代,而是反映 AI 可能带来的工作方式重塑。例如,软件开发等高度数字化的职业得分高达 9,但并不意味着岗位消失,反而可能因效率提升而需求增加。


HN 热度 390 points | 评论 306 comments | 作者:andygcook | 9 hours ago #

https://news.ycombinator.com/item?id=47400060

  • 美国软件开发岗位市场增长速度远超平均水平,导致求职者难以在一年内找到新工作。
  • 每年超过 12 万持 H1B、L1 和 OPT 签证的新移民进入美国,需每年 5% 以上的市场增长才能维持就业平衡,加上本土毕业生,年增长需求可能高达 10%,长期不可持续。
  • 建议暂停 H1B 签证发放或大幅提高费用至 20 万至 50 万美元,仅允许真正顶尖人才进入,以防止企业滥用签证进行低成本替代性雇佣。
  • 当前观点忽略了 H1B、L1 和 OPT 签证持有者中相当一部分人会离开美国,且并非全部从事软件开发工作,存在过度简化问题。
  • 将移民视为“抢走工作”的逻辑属于“劳动总量谬误”(lump of labour fallacy),即错误地认为工作岗位是固定数量的。
  • H1B 签证不应统一归为技术类,应像早期 H-1A(护士)和 H-1C(注册护士)那样按职业领域细分,以实现更精准管理。
  • 应加强美国劳工部(DOL)的监管能力,对依赖 H1B 的雇主进行更严格审计,打击签证欺诈行为,但当前司法体系因“切诺基裁决”限制了行政效率。
  • 提高 H1B 申请费用虽能增加成本,但对大型企业而言仍可承受,且 H1B 员工因签证绑定难以跳槽,企业可借此压低薪资,降低整体用工成本。
  • H1B 签证持有者并非“廉价劳动力”,其实际成本通常高于本地员工,包括申请流程时间、法律费用、审批风险等,总成本远超薪资差异。
  • H1B 员工并非完全“被绑定”于雇主,可自由申请工作转移,企业无法长期强制控制其职业去向。
  • 持有 H1B 签证的外国人往往愿意接受较低薪酬,以换取在美国合法居留的权利,这种权利本身具有极高价值。
  • 企业为规避高额 H1B 费用,正转向 L1、O1 等其他签证类型,或通过美国高校毕业生身份直接申请调整身份,绕过费用限制。
  • 尽管 H1B 费用提高至 10 万美元,但实际支付者极少,多数企业通过其他路径规避,且大型科技公司仍持续大规模申请 H1B。

Hacker News 精彩评论及翻译 #

The 49MB web page #

https://news.ycombinator.com/item?id=47391711

Our developers managed to run around 750MB per website open once.

They have put in ticket with ops that the server is slow and could we look at it. So we looked. Every single video on a page with long video list pre-loaded a part of it. The single reason the site didn’t ran like shit for them is coz office had direct fiber to out datacenter few blocks away.

We really shouldn’t allow web developers more than 128kbit of connection speed, anything more and they just make nonsense out of it.

PunchyHamster

我们的开发者单次打开网站,竟占用 750MB 左右的内存。 他们给运维提交了工单,抱怨服务器太慢,请求我们查看一下。 于是我们就去查了查。在一个视频列表很长的页面上,每个视频都预加载了部分内容。 那个网站对他们的表现还算凑合,唯一的解释就是办公室和我们数据中心之间相隔几条街,且拥有直连光纤。 我们真不该给 web 开发人员超过 128kbit 的带宽,再多一点的话,他们只会搞出一堆乱七八糟的东西。


Polymarket gamblers threaten to kill me over Iran … #

https://news.ycombinator.com/item?id=47397972

Man the moral degradation is off the charts. Prediction markets are easily the worst things to grace the internet by far and its not even close.

fzil

天哪,道德沦丧简直爆表。预测市场绝对是迄今为止给互联网留下的最烂东西,差远了去了。


The 49MB web page #

https://news.ycombinator.com/item?id=47392296

PSA for those who aren’t aware: Chromium/Firefox-based browsers have a Network tab in the developer tools where you can dial down your bandwidth to simulate a slower 3G or 4G connection.

Combined with CPU throttling, it’s a decent sanity check to see how well your site will perform on more modest setups.

vunderba

给那些不知道的科普一下:基于 Chromium 或 Firefox 的浏览器在开发者工具中都有一个“网络”选项卡,你可以通过调低带宽来模拟较慢的 3G 或 4G 连接。配合 CPU 降频,这是一个很好的测试手段,可以用来检查你的网站在配置一般的设备上表现如何。


Ask HN: How is AI-assisted coding going for you pr… #

https://news.ycombinator.com/item?id=47392707

Haven’t seen this mentioned yet, but the worst part for me is that a lot of management LOVES to use Claude to generate 50 page design documents, PRDs, etc., and send them to us to “please review as soon as you can”. Nobody reads it, not even the people making it. I’m watching some employees just generate endless slide decks of nonsense and then waffle when asked any specific questions. If any of that is read, it is by other peoples’ Claude.

It has also enabled a few people to write code or plan out implementation details who haven’t done so in a long (sometimes decade or more) time, and so I’m getting some bizarre suggestions.

Otherwise, it really does depend on what kind of code. I hand write prod code, and the only thing that AI can do is review it and point out bugs to me. But for other things, like a throwaway script to generate a bunch of data for load testing? Sure, why not.

viccis

我没看到有人提到这点,但对我来说最糟糕的是,很多管理层非常喜欢用Claude生成50页的设计文档、PRDs之类的,然后发给我们让我们“尽快审阅”。没人会看,甚至连做的人自己都不看。我看到有些员工只是生成一堆没完没了的废话幻灯片,然后一旦被问到具体问题就开始支支吾吾/胡扯。如果真有人看,那大概也是别人的Claude在看。

这也让一些许久未写代码或规划实现细节的人(有时甚至十年以上)开始动笔,所以我收到了一些非常离谱的建议。

话说回来,这确实取决于是什么类型的代码。我手工编写生产代码,AI唯一能做的就是帮我审核代码并指出bug。但对于其他事情,比如一个一次性脚本用于生成大量数据进行负载测试?当然可以,没问题。


Chrome DevTools MCP (2025) #

https://news.ycombinator.com/item?id=47392034

I use Playwright to intercept all requests and responses and have Claude Code navigate to a website like YouTube and click and interact with all the elements and inputs while recording all the requests and responses associated with each interaction. Then it creates a detailed strongly typed API to interact with any website using the underlying API.

Yes, I know it likely breaks everybody’s terms of service but at the same time I’m not loading gigabytes of ads, images, markup, to accomplish things.

If anyone is interested I can take some time and publish it this week.

dataviz1000

我使用 Playwright 拦截所有的请求和响应,并指示 Claude Code 访问像 YouTube 这样的网站,点击并与所有元素及输入框进行交互,同时记录与每一次交互相关的所有请求和响应。随后,它会创建一个详细的强类型 API,通过底层 API 与任何网站进行交互。

是的,我知道这可能违反所有人的服务条款,但另一方面,为了达成目的,我并不需要加载巨量的广告、图片和网页标记。

如果大家感兴趣,我可以花点时间,本周将其发布出来。


Palestinian boy, 12, describes how Israeli forces … #

https://news.ycombinator.com/item?id=47403607

For those wondering, it is verifiable story, it is covered as fact in Israeli newspapers:

https://www.timesofisrael.com/israeli-forces-kill-west-bank-palestinian-couple-2-children-police-say-car-sped-at-troops/

https://www.ynetnews.com/article/p7mq5k5bs

The main justification floated is that the car was “going fast” and thus made the undercover Israeli soldiers feel unsafe.

The New York Times describes it as such:

“Ali Bani Odeh’s wife and four young boys hadn’t seen him in a month and a half when he came home to Tammun, in the West Bank, from his construction job in Israel late on Friday to spend the last few days of Ramadan with his family.

On Saturday night, the boys persuaded him to take them out for a drive. Eid al-Fitr, the end of Ramadan, was coming, so there were new clothes to buy. The day’s fast had been broken, so there were sweets to be had, too.

They picked up fried doughnut holes in Tubas, saving them for later, but the clothing shop they went to in Nablus was closed. It was already past midnight, so they headed back to Tammun: Khaled, 11, the oldest, in the back with Mustafa, 8, and Muhammad, 5. Othman, 6, blind and incapable of walking or feeding himself, was in his mother’s lap in front.

As they rounded a corner slowly, a few minutes from home, young Khaled and Mustafa recounted on Sunday, their mother, Waad, 35, asked her husband to pull over and take Othman from her so she could get something from her bag on the floor. Suddenly, the boys said, they saw laser pointers shining on their family from every direction, heard their mother scream, heard their father say “God is great” — and then heard a deafening fusillade of gunfire.”

https://www.nytimes.com/2026/03/15/world/middleeast/palestinian-family-killed-west-bank.html

bhouston

对于那些好奇的人,这是一件可验证的事情,以色列报纸将其作为事实进行了报道:

https://www.timesofisrael.com/israeli-forces-kill-west-bank-palestinian-couple-2-children-police-say-car-sped-at-troops/

https://www.ynetnews.com/article/p7mq5k5bs

主要提出的理由是车辆“速度过快”,这使负责秘密行动的以色列士兵感到自身安全受到了威胁。

《纽约时报》是这样描述的:

“当艾哈迈德·巴尼·乌德(Ali Bani Odeh)周五深夜从以色列的建筑工作归来,返回约旦河西岸的塔蒙与家人共度最后几天斋月时,他的妻子和四个年幼的男孩已经一个半月没有见过他了。

周六晚上,孩子们说服他开车带他们出去兜风。开斋节(斋月结束)即将来临,所以需要买新衣服。一天的斋戒已经结束,所以也有甜点要吃。

他们在图巴斯买了炸面球留着以后吃,但随后在纳布卢斯的那家服装店却已经关门。当时已经过了午夜,所以他们驾车返回塔蒙:11岁的哈立德是最大的,坐在后排,和8岁的穆斯塔法及5岁的穆罕默德在一起。6岁的奥斯曼(Othman)双目失明,无法行走或自行进食,坐在前排母亲怀里的膝盖上。

当他们快到家、刚绕过一个拐角时,周日哈立德和穆斯塔法回忆道,35岁的母亲瓦阿德让丈夫停车,想从他腿上抱下奥斯曼,以便从地板上的包里拿点东西。突然,孩子们说,他们看到激光笔从四面八方照向他们的家人,听到母亲尖叫,听到父亲喊‘真主至大’,随后便听到了震耳欲聋的连珠枪声。”

https://www.nytimes.com/2026/03/15/world/middleeast/palestinian-family-killed-west-bank.html


Bill C-22, the Lawful Access Act: Dangerous backdo… #

https://news.ycombinator.com/item?id=47393177

Regarding warrantless searches and access … reading the text of the bill (OP link) warrants seem to be required. Simple, right?

Well, no, this is a recently inserted block of text in the bill (confirm at the link above):

Exception (2. 7)(b) However, a copy of the warrant is not required to be given to a person under subsection (2. 6) if the judge or justice who issues the warrant sets aside the requirement in respect of the person, on being satisfied that doing so is justified in the circumstances. That’s a pretty big, subjective loophole to bypass civil liberties IMO.

emptybits

关于无证搜查和访问……阅读法案文本(OP链接),搜查令似乎是必需的。很简单,对吧?

然而,并非如此。这是最近在法案中增加的一段文本(请在上方链接确认):

例外 (2.7)(b) 然而,如果签发搜查令的法官或司法官确信这样做在当前情况下是正当的,并决定豁免对某人出示副本的要求,则无需根据第(2.6)款的规定向该人出示搜查令副本。

依我看,这是一个相当大且主观的漏洞,用于规避公民自由。


Corruption erodes social trust more in democracies… #

https://news.ycombinator.com/item?id=47399999

It’s well known that in authoritarian regimes (which autocracies generally are) corruption is, rather than a problem, a necessary element of society to keep things going.

Anyone with the slightest amount of official power, like a government officer, has the ability to prevent things going forward on his part. In this kind of society, most people are poor and it would be considered stupid to not demand a small (or large) bribe from the citizen in order to unlock the process. Everyone does it, more with outsiders and to a lesser extent with one’s circle of acquaintances (because the social fabric between known parties is the other way to unlock things). Corruption surely is one thing that really trickles down from the top.

So, things like like obediently waiting in the queue for your turn or complaining about the officer won’t help unlike in high-trust societies. If you try that in a low-trust society there will be additional documents, stamps, acknowledges, or signatures you need, and keep needing, in order to complete your request until you get the drift and bring a little something. Corruption gets things going and in a society that has no trust it is a positive trait.

In Western democracies this sounds unimaginable because there’s a stronger sense that right things will work out right just because of the rules. Western corruption happens on a different level: a regular western citizen has no benefit from giving bribes and he would object to the police or government officials from demanding one. Western corruption mostly concerns about the powerful and rich making friendly mutual agreements to bend the governing bodies and law to enable themselves become more powerful and richer.

yason

人们心知肚明,在威权政体(专制政权大多如此)中,腐败与其说是一个问题,不如说是维持社会运转的一个必要元素。

任何拥有微薄官方权力的人,比如政府官员,都有能力在流程上卡你一下。在这样的社会里,大多数人都很穷,如果官员不向公民索要一点小贿赂(或大贿赂)来打通办事流程,反而会被认为是愚蠢之举。人人都这么做,对外人索取得更甚,对熟人圈子则相对少一些(因为在熟人之间,人情往来是另一种疏通途径)。腐败的确是真正自上而下传导而来的一种现象。

因此,像乖乖排队等候轮到你的时机,或者投诉办事员,都是没用的,这与高信任社会的情况截然不同。在低信任社会里,如果你这么做,你就会被告知需要额外的文件、印章、回执或签字,而且是一个接一个,永远需要,直到你悟出其中的门道,拿出点“东西”来。腐败让事情得以运转,而在一个缺乏信任的社会里,这反倒成了一种积极特质。

在西方民主国家,这听起来难以置信,因为人们有着更强的信念,即规则本身就能确保一切按规矩顺利办成。西方的腐败发生在不同的层面:普通西方公民行贿不仅没好处,反而会反对警察或政府官员索贿。西方的腐败主要涉及权贵达成友好的私下协定,通过操纵监管机构和法律来让自己变得更加强大和富有。


Ask HN: How is AI-assisted coding going for you pr… #

https://news.ycombinator.com/item?id=47391792

It makes my work suck, sadly. Team dynamics also contributes to that, admittedly.

Last year I was working on implementing a pretty big feature in our codebase, it required a lot of focus to get the business logic right and at the same time you had be very creative to make this feasible to run without hogging to much resources.

When I was nearly done and worked on catching bugs, team members grew tired of waiting and starting taking my code from x weeks ago (I have no idea why), feeding it to Claude or whatever and then came back with a solution. So instead of me finishing my code I had to go through their version of my code.

Each one of the proposals had one or more business requirements wrong and several huge bugs. Not one was any closer to a solution than mine was.

I had appreciated any contribution to my code, but thinking that it would be so easy to just take my code and finishing it by asking Claude was rather insulting.

fastasucan

难过的是,这让我工作起来很糟心。不得不承认,团队互动也难辞其咎。

去年我在给我们的代码库实现一个相当大的功能时,既需要高度专注以确保业务逻辑正确,又要极具巧思,确保运行时不会占用过多资源。当我快完成并正在修复bug时,团队成员失去了耐心,开始拿我几周前的代码(我都不知道为什么),投喂给Claude或其他什么AI,然后声称有了解决方案。结果导致我没法完成自己的代码,反而不得不去审查他们改写的代码。

每一个提案都在业务需求上出错,还包含好几个严重的bug。没有一个比我的方案更接近正确答案。我本很感激任何人对我的代码提出帮助,但觉得他们觉得仅仅拿我的代码问Claude就能轻松搞定,这简直是在侮辱人。


Stop Sloppypasta #

https://news.ycombinator.com/item?id=47395063

I’ve encountered an even more nightmarish version of this recently: ai generated tickets. Basically dumping the output of “write a detailed product spec for a clinical trial data collection pipeline” into a jira ticket and handing it off.

Doesn’t match any of our internal product design, adds tons of extraneous features. When I brought this up with said PM they basically responded that these inaccuracies should just be brought up in the sprint review and “partnering” with the engineering team. AI etiquette is something we’ll all have to learn in the coming years.

czhu12

我最近碰到了比这更糟糕的情况:AI 生成的工单。基本上就是把“为临床试验数据收集流程写一份详细产品规格说明书”的输出结果一股脑塞进一个 Jira 工单里,然后直接扔给工程团队处理。这跟我们内部的产品设计完全不搭,还增加了很多无关紧要的功能。当我向那位产品经理指出这个问题时,他基本上是说这些错误在冲刺评审里提出来就行,并且要“与工程团队合作”。人工智能礼仪是我们未来几年所有人都必须学的东西。


How I write software with LLMs #

https://news.ycombinator.com/item?id=47397037

One thing I’ve noticed is that different people get wildly different results with LLMs, so I suspect there’s some element of how you’re talking to them that affects the results.

It’s always easier to blame the prompt and convince yourself that you have some sort of talent in how you talk to LLMs that other’s don’t.

In my experience the differences are mostly in how the code produced by the LLM is reviewed. Developers who have experience reviewing code are more likely to find problems immediately and complain they aren’t getting great results without a lot of hand holding. And those who rarely or never reviewed code from other developers are invariably going to miss stuff and rate the output they get higher.

miguelgrinberg

我注意到一件事,就是不同的人使用 LLM 得到的结果差异巨大,所以我怀疑这其中有一个因素是你与它们“沟通”的方式影响了最终结果。

人们总是更容易责怪提示词,然后说服自己认为自己拥有其他人所不具备的某种与 LLM 沟通的天赋。

以我的经验来看,差异主要出在人类如何评审 LLM 生成的代码上。有代码审查经验的开发者往往能一眼看出问题,并抱怨如果不手把手教就得不到高质量的结果。而那些很少或从未审查过其他开发者代码的人,往往会忽略问题,从而给出更高的评价。


Corruption erodes social trust more in democracies… #

https://news.ycombinator.com/item?id=47398352

You have to understand how gears shift from there. Trust is essential for business transactions and specifically for long term investments. You can’t make massive leaps in technology or medicine or many other areas without trust (a lot of money on a leap means if you don’t trust the other side or the government to keep conditions stable, you won’t see a return).

Now if you are in a high trust society, you may have a lot of leveraged businesses or governments who have gotten loans or permission to do something based on past trust history. If the trust degrades systematically Investors may want returns faster, or interest rates go up, or partnerships don’t happen. That’s why low trust places don’t grow as fast - trust is the oil for growth engines and lack of it is sand for the same.

Corruption also does a lot of small-profit-for-the-corrupt that leads to massive damage to the overall society via second and third order effects. (example: someone stealing copper cables that stop electricity to entire cities for a while).

dzink

必须理解那里的齿轮是如何换挡的。信任对于商业交易至关重要,特别是对于长期投资。没有信任,你无法在技术、医学或许多其他领域取得重大突破(在一个飞跃中投入大量资金意味着,如果你不信任另一方或政府能保持环境稳定,你就无法看到回报)。

如果你处于一个高信任社会,你可能会拥有许多高杠杆企业,或者政府基于过去的信用记录获得了贷款或进行某项活动的许可。如果信任系统性地下降,投资者可能会要求更快回本,或者利率上升,亦或合作难以达成。这就是为什么低信任度地区的增长速度较慢——信任是增长引擎的“油”,而缺乏它则是阻碍这一引擎运转的“沙子”。

腐败也会导致腐败者获得微小利益,但这通过二阶和三阶效应给整个社会造成了巨大损失。(例如:有人偷盗铜缆导致整个城市一度停电)。


Polymarket gamblers threaten to kill me over Iran … #

https://news.ycombinator.com/item?id=47398102

I don’t understand how this isn’t an immediate open and shut case for the police, assuming certain facts are verified independently. At the point that you’re making death threats to strangers you should be removed from civil society.

bitmasher9

假设某些事实经独立核实,我不明白为什么这不是警方立即就能处理的铁案。当你开始向陌生人发出死亡威胁时,你就应该被逐出文明社会。


Ask HN: How is AI-assisted coding going for you pr… #

https://news.ycombinator.com/item?id=47390383

It has made my job an awful slog, and my personal projects move faster.

At work, the devs up the chain now do everything with AI – not just coding – then task me with cleaning it up. It is painful and time consuming, the code base is a mess. In one case I had to merge a feature from one team into the main code base, but the feature was AI coded so it did not obey the API design of the main project. It also included a ton of stuff you don’t need in the first pass - a ton of error checking and hand-rolled parsing, etc, that I had to spend over a week unrolling so that I could trim it down and redesign it to work in the main codebase. It was a slog, and it also made me look bad because it took me forever compared to the team who originally churned it out almost instantly. AI tools are not good at this kind of design deconflicting task, so while it’s easy to get the initial concept out the gate almost instantly, you can’t just magically fit it into the bigger codebase without facing the technical debt you’ve generated.

In my personal projects, I get to experience a bit of the fun I think others are having. You can very quickly build out new features, explore new ideas, etc. You have to be thoughtful about the design because the codebase can get messy and hard to build on. Often I design the APIs and then have Claude critique them and implement them.

I think the future is bleak for people in my spot professionally – not junior, but also not leading the team. I think the middle will be hollowed out and replaced with principals who set direction, coordinate, and execute. A privileged few will be hired and developed to become leaders eventually (or strike gold with their own projects), but everyone in between is in trouble.

hdhdhsjsbdh

工作变得像艰难的苦役一样,而个人项目的进展却更快了。 在工作中,上级的开发人员现在全用AI做所有事情——不仅是写代码——然后派我去清理和完善。这既痛苦又耗时,代码库乱得一塌糊涂。有一次,我不得不把一个团队的功能合并到主代码库,但那个功能是AI写的,所以它不遵守主项目的API设计。它还包含了大量一开始就不需要的东西——大量的错误检查和手写的解析逻辑等——我不得不花了一周多的时间进行拆解和整理,才能把它删减并重新设计,使其能适配主代码库。这是一场苦役,而且让我看起来很糟糕,因为相比于原本几乎瞬间就搞定代码的团队,我花了太长的时间。AI工具不擅长这种解决设计冲突的任务,所以虽然很容易瞬间拿出一堆概念,但如果不面对由此产生的技术债,就无法神奇地把它塞进更大的代码库中。 在个人项目中,我可以体验到别人似乎正在享受的那种乐趣。你可以非常快速地构建新功能,探索新想法等。你必须在设计上多加斟酌,因为代码库可能会变得混乱且难以在此基础上继续开发。通常是我先设计API,然后让Claude进行评审并实现它们。 我认为对于像我这样处于这个职位的专业人士来说,未来是黯淡的——既不是初级人员,也不是团队领导。我认为中间层会被掏空,取而代之的是负责设定方向、协调和执行的高级人员。只有极少数有特权的人会被招聘并培养成领导者(或者在个人项目上大获成功),但夹在中间的人都很麻烦。


Corruption erodes social trust more in democracies… #

https://news.ycombinator.com/item?id=47398033

It looks like a tautology to me. Like: “Corruption erodes social trust in places where social trust exist and is key for the political system.”

retep_kram

我看这就像是同义反复。比如:“腐败在存在社会信任的地方侵蚀社会信任,且是政治系统的关键。”


Stop Sloppypasta #

https://news.ycombinator.com/item?id=47392855

I do find it interesting that people don’t mind AI content, as long it’s “their AI.” The moment someone thinks it’s someone else’s AI output, the reaction is visceral.

Isn’t it obvious? If I’d wanted to see AI response to my question, I’d ask it myself (maybe I already did). If I’m asking humans, I want to see human responses. I eat fast-food sometimes, but if I was served a Big Mac at a sit down restaurant I’d be properly upset.

valicord

确实觉得挺有意思,只要那是“他们自己的AI”,人们对AI生成的内容并不反感。一旦有人以为是别人的AI输出,反应就会变得本能且强烈。

这不是很明显吗?如果我想看AI对我问题的回答,我自己就会去问(也许我之前已经问过了)。我既然是问人类,那我就想要看到人类的回答。我有时候也会吃快餐,但如果我在正式餐厅里吃到了巨无霸,我会真的非常生气。


$96 3D-printed rocket that recalculates its mid-ai… #

https://news.ycombinator.com/item?id=47389285

I remember an anecdote our robotics lecturer told our university class in 1995, which was about how in the west we try to make expensive things that are the absolute best of technology and how the other side didn’t have that luxury and relied on ingenuity.

He described a cold war Russian missile they had somehow obtained and were tasked with trying to reverse engineer. Ostensibly, it was thought to be a heat seeking missile, but there seemed to be no control or guidance circuitry at all. There was a single LDR (light dependent resistor) attached to a coil which moved a fin. That was it. Total cost for the guidance system maybe a couple of dollars, compared to hundreds of thousands for the cheapest guidance systems we had at the time.

The key insight was that if you shined a light at it, the fin moved one way and if there was no light the fin moved the opposite way. That still didn’t explain how this was able to guide a missile, but the next realisation was that the other fins were angled so when this was flying (propelled by burning rocket fuel), the missile was inherently unstable - rotating around the axis of thrust and wobbling slightly. With the moveable fin in place, it was enough to straighten it up when it was facing a bright light, and wobble more when there was no bright light. Because it was constantly rotating, you could think of it as defaulting to exploring a cone around its current direction, and when it could see a light it aimed towards the centre of that cone. It was then able to “explore the sky” and latch on to the brightest thing it could see, which would hopefully be the exhaust from a plane, and so it would be able to lock on, and adjust course on a moving target with no “brain” at all.

ralferoo

我记得1995年我们的机器人讲师在大学课堂上讲过一个轶事,内容是关于我们在西方如何试图制造昂贵且顶尖的技术产品,以及另一边并没有这种奢侈的条件,而是依赖独创性。

他描述了一枚冷战时期苏联的导弹,他们不知怎么搞到的,并被要求进行逆向工程。表面上,它原本被认为是一枚热寻的导弹,但似乎完全没有控制或制导电路。上面只有一个连接在某个线圈上的LDR(光敏电阻),用来操纵一个舵面。就是这样。整个制导系统的成本可能只有几美元,而我们当时最便宜的制导系统却要花几十万美元。

关键的认识在于,如果你朝它照光,舵面就会向一个方向移动;如果没有光,舵面则向相反方向移动。这虽然还不能完全解释它如何引导导弹,但另一个认知是,其他的舵面都是倾斜安装的,因此当它飞行(靠燃烧火箭燃料推进)时,导弹本身就存在固有不稳定性——它会绕着推力轴线旋转并轻微晃动。有了这个可移动的舵面,当它面对亮光时,这就足以让导弹恢复平衡;而当没有亮光时,导弹晃动得会更剧烈。

因为导弹在不停地旋转,可以把它想象成默认探索以当前方向为中心的一个圆锥体区域,当它看到光线时,就会瞄准该圆锥体的中心。于是,导弹就能通过“探索天空”来锁定它所能看到的最亮物体(希望能是飞机的喷气流),从而在没有“大脑”的情况下,成功锁定目标并调整航向。


LLMs can be exhausting #

https://news.ycombinator.com/item?id=47393253

I find LLMs so much more exhausting than manual coding. It’s interesting. I think you quickly bump into how much a single human can feasibly keep track of pretty fast with modern LLMs.

I assume until LLMs are 100% better than humans in all cases, as long as I have to be in the loop there will be a pretty hard upper bound on what I can do and it seems like we’ve roughly hit that limit.

Funny enough, I get this feeling with a lot of modern technology. iPhones, all the modern messaging apps, etc make it much too easy to fragment your attention across a million different things. It’s draining. Much more draining than the old days

cglan

我发现 LLM 比手动编码要累人得多。这很有意思。我认为你会很快意识到,利用现代 LLM,一个人类实际上能管理/跟进的事情是多么有限。

我假设,在 LLM 能在所有情况下都全面超越人类之前,只要我还需要参与其中,我的工作能力就会有一个很硬的上限,感觉我们已经差不多触及到了这个极限。

说来有趣,我很多现代科技产品都有这种感觉。iPhone、所有的现代即时通讯应用等,让人太容易将注意力分散在百万件不同的事情上。这很消耗精力。比过去累多了。


Polymarket gamblers threaten to kill me over Iran … #

https://news.ycombinator.com/item?id=47403104

I sense a large number of Polymarket apologists in the comments. Polymarket’s existence is a symptom of the ubiquity of Adam Smith’s libertine, some would even label satanic (“Do what you wilt”), “free” market thinking. We ought to take it to its natural extreme – where Polymarket encourages gambling on when specific celebrities, politicians, or even random individuals might die (there is already a name for this: “death pools”). I am sure if they followed through on this openly there would still be advocates and defenders of the practice and counter-claims “there wasn’t unequivocal evidence that Polymarket influenced their murder” etc.

waffletower

我在评论区察觉到大量 Polymarket 的辩护者。Polymarket 的存在正是亚当·斯密那种自由放任思想无处不在的症状,有些人甚至将其斥为“撒旦式”的(“随心所欲”)的所谓“自由”市场思维。我们应该将其推向其自然的极端——即 Polymarket 鼓励人们赌博具体的名人、政客,甚至是随机个体何时会死(这种现象已经有一个名字,叫做“死亡池”)。我确信如果他们公然这么做,仍然会有对此做法的拥护者和辩护者,并反驳称“并没有确凿证据表明 Polymarket 煽动了他们的谋杀”等等。


Meta’s renewed commitment to jemalloc #

https://news.ycombinator.com/item?id=47404107

We plan to deliver improvements to [..] purging mechanisms

During my time at Facebook, I maintained a bunch of kernel patches to improve jemalloc purging mechanisms. It wasn’t popular in the kernel or the security community, but it was more efficient on benchmarks for sure.

Many programs run multiple threads, allocate in one and free in the other. Jemalloc’s primary mechanism used to be: madvise the page back to the kernel and then have it allocate it in another thread’s pool.

One problem: this involves zero’ing memory, which has an impact on cache locality and over all app performance. It’s completely unnecessary if the page is being recirculated within the same security domain.

The problem was getting everyone to agree on what that security domain is, even if the mechanism was opt-in.

https://marc.info/?l=linux-kernel&m=132691299630179&w=2

adsharma

我们计划对 [..] 的回收机制进行改进。

在 Facebook 工作期间,我维护了一系列改进 jemalloc 回收机制的内核补丁。虽然在内核和安全社区里并不受欢迎,但在基准测试中肯定更高效。

许多程序会运行多个线程,在一个线程中分配,在另一个线程中释放。Jemalloc 以前的主要机制是:使用 madvise 将页面归还给内核,然后让内核在另一个线程的内存池中进行分配。

一个问题是:这涉及到将内存清零,这会影响缓存局部性以及整体应用性能。如果页面在同一安全域内被重新利用,这就完全没有必要。

问题是让大家都同意那个安全域的定义是什么,即使该机制是可选的。

https://marc.info/?l=linux-kernel&m=132691299630179&w=2


Polymarket gamblers threaten to kill me over Iran … #

https://news.ycombinator.com/item?id=47404106

Wild misunderstanding of Smith. He considered it a moral defect, wrote several pieces criticizing gambling, and criticized state run gambling.

“The over-weening conceit which the greater part of men have of their own abilities, is an ancient evil… their absurd presumption in their own good fortune, is even more universal.”

WillPostForFood

对斯密的误读极其严重。他认为这是一种道德缺陷,曾写文章批评赌博,并批评国家经营的赌博。 “大多数人对自身能力的过度自负,是一种古老的恶习……他们对自身好运的荒谬自信,则更为普遍。”


2026 03 16 HackerNews

2026-03-16 07:29:06

2026-03-16 Hacker News Top Stories #

  1. Ageless Linux是一款基于Debian的操作系统,明确拒绝遵守加州《数字年龄保障法案》的年龄验证要求,主张平等对待所有用户且不收集任何年龄数据。
  2. 该项目是一个开源的低成本MANPADS原型,使用96美元的3D打印硬件和5美元传感器,通过ESP32和MPU6050实现空中轨迹实时重构与稳定控制。
  3. 作者批评Spotify的AI DJ功能在处理古典音乐时表现愚蠢,无法正确识别和播放多乐章作品的完整顺序,反映出系统设计对古典音乐缺乏基本理解。
  4. 文章深入剖析了现代游戏反作弊系统必须进入内核模式(Ring 0)的根本原因,介绍了主流方案的三层架构及其与rootkit相似的技术原理。
  5. 作者将闲置的42U服务器机柜改造为"洪水与排水"模式的水培系统,成功种植多批生菜和香草,体现了技术与农业结合的实验精神。
  6. 这是一篇2015年的交互式可视化教程,通过区分纽约和旧金山房屋的实例,直观展示决策树算法的构建过程及过拟合现象。
  7. 作者反对使用LLM修改个人通信,认为这会抹去语言中的细微之处和真实情感,主张保留错误与不完美以建立真实的人际连接。
  8. 文章指出当前AI行业对CLI的追捧存在误解,强调MCP在企业级应用中的标准化、安全性和可观测性优势,认为其仍是组织级AI工程的未来方向。
  9. FCC主席布伦丹·卡恩批评广播媒体传播虚假信息导致公众信任度降至历史最低,并威胁若不纠正将撤销其广播执照。
  10. Anthropic推出限时优惠活动,在2026年3月13日至27日期间,所有非企业版用户在非高峰时段的每日使用额度将自动翻倍。

Ageless Linux——为年龄不确定的人类设计的软件 (Ageless Linux – Software for humans of indeterminate age) #

https://agelesslinux.org/

Ageless Linux 是一个基于 Debian 的操作系统,宣称不关心用户年龄,拒绝遵守加州《数字年龄保障法案》(AB 1043)中的年龄验证要求。该法案要求操作系统提供商在用户注册时收集年龄信息,但 Ageless Linux 明确表示不会获取任何年龄数据。

网页指出,根据加州法律定义,任何控制通用计算设备操作系统软件的个人或组织都属于“操作系统提供商”。安装 Ageless Linux 后,系统文件 /etc/os-release 显示为“Ageless Linux”,因此项目方认为自己已构成操作系统提供商。同时,运行其转换脚本的用户也自动成为操作系统提供商,需承担相应法律责任。

该法案将“用户”定义为儿童,而成年人则被视为“账户持有者”或“基础设施”。Ageless Linux 拒绝这一分类,主张所有用户无论年龄均应被平等对待,且不会主动询问年龄。

网页强调,包括 Debian 仓库、GitHub、个人网站等在内的几乎所有软件分发渠道都属于“受监管的应用商店”,需遵守年龄验证规定。但像 Debian 这类开源志愿项目缺乏中央账户系统和年龄验证机制,无法合规。

文章指出,苹果、谷歌、微软等大公司已有成熟年龄验证体系,合规成本几乎为零。而开源社区、隐私项目(如 Whonix、Kicksecure)以及个人开发者则无法负担合规成本,法案实质上形成了一道“合规壁垒”,将小规模操作系统开发者排除在外。

最终结论:该法案并非真正为了儿童安全,而是通过法律风险(每名受影响儿童最高罚款 7500 美元)迫使小型项目退出市场,保护大型科技公司的垄断地位。Ageless Linux 选择主动非合规,作为对监管过度的抗议。


HN 热度 793 points | 评论 583 comments | 作者:nateb2022 | 1 day ago #

https://news.ycombinator.com/item?id=47381791

  • 年龄验证政策的兴起在美、英、欧几乎同时出现,反映出跨国游说集团的共同利益,其真实目的并非保护儿童,而是扩大数字系统的监控能力。
  • 保护儿童在线安全的问题已有成熟解决方案,如家庭教育和家长控制软件,无需通过强制年龄验证实现。
  • 当前政策框架明显服务于技术官僚的监控扩张,是披着“保护儿童”外衣的反民主工具,其真实意图被刻意模糊。
  • 若此类政策通过,面部识别技术可能成为默认的解决方案,进一步加剧个人隐私的侵蚀。
  • 未来可能实现每个 IP 地址与真实身份和身份证号绑定,形成全面的数字身份监控体系。
  • 有人认为,当前讨论中“显而易见”的结论其实并不普遍成立,不同人对问题的认知存在根本差异,不应以“显然”否定他人观点。
  • 不能忽视文化差异,部分社会对儿童接触成人内容存在严重担忧,不能因自身经历而忽视这种现实问题。
  • 现有政策过于宽泛,要求所有操作系统都实现年龄验证,导致系统碎片化,反而削弱了政策本应达成的统一目标。
  • 真正合理的做法应是仅针对面向未成年人的操作系统制定明确的年龄验证规范,而非“一刀切”。
  • 一些立法者出于保护儿童的善意推动政策,但其结果可能适得其反,带来严重的滥用风险。
  • 企业如 Meta 等利用公众对儿童安全的关切,推动可复制的立法模板,实则服务于自身利益,不应被简单归为“善意”。
  • 将政策反对者污名化为“愚蠢”或“收钱”的人,只会陷入非黑即白的争论,削弱理性讨论空间。
  • 保护儿童的诉求虽真实,但应通过合理、可验证的机制实现,而非牺牲整体数字自由与隐私。

96 美元 3D 打印火箭,搭载 5 美元传感器实现空中轨迹实时重构 ($96 3D-printed rocket that recalculates its mid-air trajectory using a $5 sensor) #

https://github.com/novatic14/MANPADS-System-Launcher-and-Rocket

这是一个关于 MANPADS(便携式防空系统)原型项目的开源工程页面,展示了一个低成本、基于消费级电子元件和 3D 打印技术的火箭发射器与制导火箭系统原型。

项目核心由两大部分组成:可折叠尾翼与鸭舵稳定控制的火箭,以及集成 GPS、电子罗盘和气压传感器的发射装置。火箭搭载 ESP32 飞行控制计算机与 MPU6050 惯性测量单元,实现姿态感知与飞行控制。

整个系统在 Fusion 360 中完成机械设计,使用 OpenRocket 进行气动稳定性仿真,并通过多轮迭代设计、电子集成与实弹发射测试验证。系统具备飞行姿态反馈、导航与遥测功能。

项目总硬件成本约为 96 美元,所有设计文件、固件代码、仿真模型和开发文档均开源,完整资料存放于 Google Drive 链接中,包含机械结构图、电子电路图、测试视频、系统流程图、火箭参数说明、物料清单及成本分析。

项目由多个开发者协作完成,目前已有 211 次分叉、915 颗星标,是一个面向教育、科研与低成本防空系统原型探索的开放平台。


HN 热度 373 points | 评论 333 comments | 作者:ZacnyLos | 13 hours ago #

https://news.ycombinator.com/item?id=47385935

  • 俄罗斯在冷战时期曾研发一种仅用光敏电阻和简单机械结构实现的低成本导弹制导系统,通过导弹自身旋转实现对光源的自动追踪,无需复杂电子设备。
  • 这种原理与早期 AIM-9“响尾蛇”导弹的红外制导机制相似,利用目标热源(如飞机发动机)的亮度差异实现锁定与追踪。
  • 该系统依赖导弹的固有不稳定旋转特性,通过调整舵面来稳定飞行姿态,从而实现对光源的“探索性”锁定。
  • 类似原理也出现在其他武器系统中,如英国“星爆”(Starstreak)导弹,通过控制旋转状态实现飞行方向的改变。
  • 有观点指出,这种设计本质上是一种“随机游走 + 趋光性”的控制机制,与微生物的趋化性行为类似。
  • 该技术在白天或低空飞行时可能误锁定太阳,但因旋转扫描范围有限,实际影响较小。
  • 早期红外制导导弹多为“尾追式”设计,只能攻击尾部朝向发射点的目标,对迎头飞行目标无效。
  • 这种低成本、高创意的工程思维源于资源匮乏环境下的必要性,是全球许多经济条件有限人群的普遍应对策略。
  • 当前消费级电子元件性能已接近军用标准,使得原本昂贵的制导系统可由极低预算实现,推动了技术民主化。
  • 这种技术普及也带来安全隐患,可能被用于制造低成本武器,引发军备扩散担忧。
  • 国防承包商对民间低成本创新往往漠视,因其商业模式依赖高成本项目,而低成本方案构成现实威胁。
  • 民间个人或小团队已能设计出成本极低的导弹原型,但若无官方支持,难以获得重视与推广。

Spotify AI DJ 的荒谬愚蠢 (The Appalling Stupidity of Spotify’s AI DJ) #

https://www.charlespetzold.com/blog/2026/02/The-Appalling-Stupidity-of-Spotifys-AI-DJ.html

作者查尔斯·佩兹尔德在 2026 年 2 月 26 日发表了一篇博客文章,批评 Spotify 新推出的 AI DJ 功能在处理古典音乐时表现出的严重愚蠢与无知。

作者指出,自己偏好西方古典音乐传统,涵盖从塔利斯、巴赫到菲利普·格拉斯等五百多年间的作曲家作品。然而,当前数字音乐系统(包括 Spotify)的元数据设计完全基于流行音乐,将所有音乐都标记为“歌曲”(song),忽视了古典音乐中“作品”或“乐章”等专业术语,也忽略了多乐章作品的完整性和顺序性。

他以贝多芬第七交响曲为例,测试 Spotify AI DJ 的响应能力。无论使用“播放贝多芬第七交响曲”“完整播放”“从头到尾播放”还是“按顺序播放全部四个乐章”,AI DJ 均无法正确识别并播放完整作品。它要么只播放第二乐章(著名的“如歌的快板”),要么打乱乐章顺序,甚至播放其他作曲家的无关作品,如马斯卡尼的《乡村骑士》间奏曲或肖斯塔科维奇的爵士组曲。

作者质疑:一个号称“智能”的 AI,竟连“一部交响曲由多个顺序乐章组成”这一基本音乐常识都无法理解,甚至无法查阅维基百科等公开信息获取基础事实。他指出,这种失败并非偶然,而是系统设计本身对古典音乐缺乏尊重。

文章最后讽刺道,尽管 AI 被宣传能“创作音乐”,但连最基础的音乐结构都理解不了,何谈创作?作者认为,企业更关心利润,而非保护西方古典音乐传统,因此这类问题短期内难以真正解决。


HN 热度 346 points | 评论 287 comments | 作者:ingve | 15 hours ago #

https://news.ycombinator.com/item?id=47385272

  • 该文章作者虽为技术专家,但对 Spotify DJ 功能的批评实为产品设计问题,而非 AI 技术失效,其批评方式存在逻辑混淆。
  • Spotify DJ 本质上是带有语音插播的随机播放功能,其设计初衷并非为古典音乐优化,因此对古典音乐的处理不佳属于产品定位问题。
  • 将 Spotify DJ 功能的缺陷归因于 AI 无用是一种错误归因,AI 并非单一技术,不能因某一功能失败而否定整体能力。
  • 作者在文章中提出“若 AI 无法处理古典音乐,如何能创作音乐”属于逻辑谬误,混淆了音乐播放与音乐创作的范畴。
  • 该文章的语气和论述方式令人困惑,大量引用具体古典音乐作品,削弱了其论点的说服力。
  • 作者 Charles Petzold 是计算机领域的权威人物,其著作《代码》和《图灵的注释》被广泛认为是经典之作。
  • 有人认为《代码》一书是技术传播的杰作,适合初学者与专家共同阅读,内容引人入胜。
  • 《图灵的注释》帮助读者理解计算理论的起源,是许多人的计算机科学启蒙读物。
  • 有人指出,Spotify 的产品管理存在严重问题,桌面与移动端功能不一致,CarPlay 支持功能严重缺失。
  • 有人认为 Spotify DJ 并非基于大语言模型,而是基于简单规则的随机播放加语音提示,自 2023 年上线以来未有实质更新。
  • 有人指出 Spotify DJ 总是推荐近期听过的音乐或 2023 年的内容,说明其推荐逻辑存在明显缺陷。
  • 有人认为该文章的批评具有“愤怒式吸引眼球”(ragebait)的倾向,作者显然清楚逻辑漏洞,却故意为之以引发讨论。
  • 有人强调,对他人音乐品味的评判是无意义的,音乐的好坏应以“听起来好”为标准,而非主观价值判断。
  • 有人认为,对音乐的偏好不应成为自我价值的来源,过度强调艺术欣赏的“高雅”是一种虚伪的优越感。
  • 有人指出,将技术问题归咎于 AI 是逃避责任,实际上现有技术完全有能力实现高质量的音乐推荐与播放。

内核级反作弊系统的工作原理 (How kernel anti-cheats work) #

https://s4dbrd.github.io/posts/how-kernel-anti-cheats-work/

本文深入探讨了现代游戏反作弊系统中内核级反作弊的工作原理,揭示其作为消费级 Windows 系统上最复杂软件之一的技术实现。文章指出,仅依赖用户模式的反作弊机制存在根本性缺陷,因为其运行在 Ring 3 权限下,极易被更高权限的恶意代码(如内核驱动、虚拟机或硬件 DMA)绕过。因此,反作弊系统必须进入内核模式,以获得对系统底层的全面控制与监控能力。

文章分析了当前主流的四大内核级反作弊系统:BattlEye、EasyAntiCheat(EAC)、Vanguard 和 FACEIT AC。它们均采用三层次架构:内核驱动负责核心防护(如回调拦截、内存扫描、系统调用监控),用户模式服务负责网络通信与策略执行,游戏内注入的 DLL 则作为游戏进程的本地检查点。三者通过 IOCTL 机制在用户态与内核态之间安全通信。

作者强调,内核反作弊系统之所以“像木马”(rootkit),是因为其使用的技术与恶意软件高度重合——如注册系统回调、修改内核结构、全局监控。但这并非出于恶意,而是实现有效检测所必需的技术路径。这种“技术相似性”是 Windows 架构的必然结果,而非厂商设计缺陷。

文章还指出,作弊者不断升级攻击手段:从早期的内核驱动,到利用合法驱动漏洞的 BYOVD 攻击,再到虚拟化层的 hypervisor 攻击,直至如今的 PCIe DMA 硬件攻击。这些手段成本高昂,有效过滤了普通作弊者,使反作弊系统在“技术对抗”中形成一定防御壁垒。

最后,文章引用 2024 年 ARES 会议论文《若其形似木马,行为亦似木马》,从根子上解释了为何合法反作弊系统在静态分析下会与恶意软件难以区分,核心在于权限与能力的不可分割性。真正的挑战不在于“是否像木马”,而在于如何在不损害系统安全的前提下,实现有效、可信的反作弊机制。


HN 热度 337 points | 评论 285 comments | 作者:davikr | 23 hours ago #

https://news.ycombinator.com/item?id=47382791

  • 现代作弊手段已转向使用虚拟机或攻破 Hyper-V,而 Hyper-V 自身的保护机制反而为作弊提供了掩护。
  • BIOS 刷写正成为越来越流行的作弊方式,因多数主板不支持启动保护,且可通过芯片组直接刷写 BIOS。
  • DMA 攻击仍是主流,尽管因 Vanguard 等反作弊系统的对抗,高质量 DMA 设备成本持续上升。
  • 反作弊系统升级只会促使作弊技术同步升级,最终攻击者总会找到最薄弱的环节。
  • AI 驱动的反作弊机制在《守望先锋》中已极为有效,仅靠用户态检测即可识别并封禁作弊者,无需内核级防护。
  • 硬件认证技术(如 TPM)正使内核级作弊越来越困难,未来反作弊将更依赖用户态分析与行为检测。
  • 由于作弊门槛提高,许多普通玩家因操作复杂而放弃作弊,这实际上反映了反作弊系统在起作用。
  • 尽管作弊难度上升,仍存在高度投入的作弊者,他们为追求技术挑战或持续沉迷游戏而愿意付出高昂成本。
  • 作弊动机多样,包括为赚钱、沉迷游戏无法自拔、逃避现实、早期误入、自我合理化等,部分人甚至认为“自己开发的工具应可使用”。
  • 《魔兽世界》中 AI 驱动的封禁机制可能误伤勤奋玩家,导致大量无辜用户被封,引发对反作弊公平性的质疑。
  • 《魔兽世界》的“挂机”行为与传统作弊界限模糊,因长时间自动运行角色对其他玩家构成间接优势,但不直接干扰游戏体验。

机柜式水培系统 (Rack-mount hydroponics) #

https://sa.lj.am/rack-mount-hydroponics/

作者在 2026 年初,将一个闲置的 42U 机柜改造为水培系统,用来种植生菜,作为从计算机转向农业的过渡尝试。尽管这一做法在技术上并不理想,但过程充满趣味与实验精神。

系统采用“洪水与排水”(Flood and Drain)模式,将植物种植在岩棉或陶粒等介质中,通过水泵定时向托盘注水,再由可调节高度的排水口排出多余水分。整个系统依赖于一个 72 升的储液箱、38 升的种植托盘、气泵与气石保持水体供氧,并通过定时器控制光照与灌溉周期。

作者使用机柜自带的机架托盘,将储液箱置于底部,种植托盘分层放置。所有管道和电线通过钻孔穿过箱体顶部,并用密封圈减少光线进入,防止藻类滋生。为防止种植盆在注水时漂浮翻倒,作者用消毒石块压重,但认为这本不该发生。

种植过程从种子开始,生菜在岩棉中 24 小时内即可发芽,其他香草如香菜、欧芹等则稍慢。营养液使用一种无说明的粉状肥料,按 20 克/30 升水的比例配制,效果尚可。

最终,系统运行稳定,成功收获多批生菜和香草,仅两次漏水事故。作者坦言这并非推荐的种植方式,但过程充满乐趣,也让他学到了水培知识,还吃上了自己种的沙拉。

整个项目是技术与生活趣味的结合,虽不专业,却充满创意与自嘲精神。


HN 热度 328 points | 评论 94 comments | 作者:cdrnsf | 19 hours ago #

https://news.ycombinator.com/item?id=47384352

  • 使用货架替代服务器机柜进行水培种植更便于规划、采摘和更换灯具,且实际使用中需考虑漏水和石砾掉落等问题。
  • 封闭式机柜可配合风扇实现可控空气循环,同时有助于减少地下室等环境下的热量损失。
  • 关于“超级菠菜”富含维生素 B12 的说法存在科学误区,维生素 B12 来源于细菌而非光照,需通过接种细菌并让其在菠菜内存活才能实现,红光无法穿透叶片为细菌供能。
  • 服务器机柜因已安装门框,移出困难,但可通过拆解门框或用工具撬开后复原的方式实现移动,但复原后外观可能难以保持原样。
  • 对于无法通过门框的家具,可使用电锯将其切割成两部分,搬运后再用金属板和螺丝重新组装,是一种实用的解决方案。
  • 在高温环境下(如根部接近 40°C)仍可成功进行户外气雾栽培,选用“弗吉尼亚黄金”烟草品种表现优异,耐旱且生长周期长。
  • 在英国,个人种植烟草合法,可作为兴趣项目尝试,但需了解叶片的晾晒与发酵处理方法。
  • 气雾栽培的烟草作物可自用或用于研究,但需注意其用途是否涉及工业或有机农药等方向。
  • 室内水培相比土壤种植更清洁、稳定,且不易滋生害虫,适合全年种植。
  • 垂直窗式水培系统美观但根系易侵入管道,维护不便;营养膜技术(NFT)系统材料少、易维护,但长期种植需修剪根系。
  • 深水培(DWC)系统无需基质,仅需水和气泵,但气泵可能产生噪音,需权衡利弊。
  • 采用克雷特法(Kratky 法)的被动水培系统无需电力,使用陶粒作为基质,可重复使用,便于管理,适合中小型种植。
  • 肥料配比可通过标记每瓶按压次数实现粗略控制,结合观察水色进行经验判断,减少精确测量的繁琐。
  • 辣椒、樱桃番茄、黄瓜和小型草莓等作物在水培系统中表现良好,可实现多次收获,适合长期种植。
  • 对于水培系统中使用的塑料材料是否会产生有害析出物存在担忧,尤其在阳光直射或高温环境下。
  • 虽然塑料可能释放化学物质,但实际使用中可通过清洗容器、避免高温强光照射,以及使用陶瓷或石材容器等方式降低风险。

机器学习的视觉导引(2015) (A Visual Introduction to Machine Learning (2015)) #

https://r2d3.us/visual-intro-to-machine-learning-part-1/

本页面是一篇关于机器学习的交互式可视化教程,以区分纽约和旧金山的房屋为例,介绍机器学习的基本概念。

首先,通过房屋的海拔高度和每平方英尺价格两个特征,直观展示如何通过数据特征进行分类。海拔高于 240 英尺的房屋更可能位于旧金山,而价格高于 1776 美元/平方英尺的低海拔房屋更可能位于纽约。

接着引入“决策树”这一机器学习方法,通过一系列“如果-那么”判断(即“分支”)逐步划分数据。每个分支的分割点(split point)决定了数据的走向,目标是使每个分支内的数据尽可能“纯净”——即尽可能属于同一类别。

通过递归地在子数据集中寻找最优分割点,决策树不断加深。随着树的生长,分类准确率从初始的 84% 提升至 96%,甚至可达到 100% 准确,但此时可能已出现过拟合。

过拟合是指模型在训练数据上表现完美,但在新数据上表现不佳,因为它记住了无关细节而非真正规律。因此,模型在未见过的数据(测试数据)上的表现才是关键。

最后总结:机器学习通过统计学习发现数据中的边界,决策树是一种基于规则的分类方法。但需警惕过拟合,模型应能在新数据上保持良好表现。下一期将深入探讨过拟合与机器学习中的核心权衡问题。


HN 热度 301 points | 评论 29 comments | 作者:vismit2000 | 13 hours ago #

https://news.ycombinator.com/item?id=47386116

  • 该可视化文章是机器学习教学的典范,通过滚动驱动的动画清晰展示决策树的构建过程,远胜传统教科书的静态图表。
  • 作者 Tony Hschu 和 Stephanie Jyee 在 2015 年创作的 R2D3 系列文章具有前瞻性,至今仍被广泛引用和推崇。
  • 有读者希望看到更多类似风格的深度可视化内容,尤其是针对 Transformer 注意力机制等高维模型的解释。
  • 建议使用 Excalidraw 等工具先绘制流程草图,再用 xyflow 等库实现交互式数据管道可视化,可有效降低开发门槛。
  • 推荐多个高质量的可视化学习资源,包括 Seeing Theory、MLU Explain、VisXAI、Google PAIR Explorables 等,均为互动性强、视觉惊艳的 S-TIER 学习网站。
  • 该文章的成功在于将复杂概念通过动画叙事自然呈现,使学习者在欣赏中理解,而非仅被视觉吸引而停止思考。
  • 有读者指出,当前许多 AI 解释内容要么过于简略,要么过于冗长,缺乏这种“恰到好处”的视觉化中间形态。
  • 该文章的滚动控制机制实现了自然的播放、暂停、回放操作,是交互设计的典范,值得在其他领域借鉴。
  • 有读者建议开发一个基于 HN 链接的自动化分类系统,按 S-TIER、A-TIER 等标准对技术博客进行智能归类。
  • 2015 年时网页交互性已达到较高水平,但固定宽度限制了部分创意表达,如今技术发展使更自由的响应式设计成为可能。
  • 该文章的“数据点如雨落下”的动画形式极具创意,是独特且高效的视觉隐喻,值得在其他教学场景中推广。

允许我了解你,包括你的错误与不完美 (Allow me to get to know you, mistakes and all) #

https://sebi.io/posts/2026-03-14-allow-me-to-get-to-know-you-mistakes-and-all/

作者 Sebastian Aigner 在一篇博客文章中表达了对使用大型语言模型(LLM)修改个人通信内容的强烈反感。他认为,当消息经过 LLM“优化”后,原本作者有意选择的用词、语气、强调或省略等细微之处会被抹去,导致信息失真。

更关键的是,这种“净化”过程破坏了人与人之间通过长期互动建立的隐性理解机制。每个人的语言风格和表达习惯都承载着独特的情感与背景,读者正是通过这些细节来理解对方的真实意图。一旦文本被标准化处理,这种基于熟悉感的沟通默契就被打断。

作者强调,允许对方犯错、使用不完美的表达、甚至过于直白或华丽的措辞,反而是一种尊重——它给予他人理解自己真实面貌的机会。真正的沟通不在于语言的“完美”,而在于保持彼此之间真实、可感知的连接。

最后,作者呼吁人们在交流中保留原始表达,让对方有机会真正“认识”自己,而不是被一个经过算法过滤的“理想化”版本所取代。


HN 热度 299 points | 评论 150 comments | 作者:sebi_io | 1 day ago #

https://news.ycombinator.com/item?id=47381736

  • AI 对于克服“空白页面”写作障碍非常有用,尤其对 ADHD 患者而言,编辑已有的内容比从零开始写作更容易,因此将 AI 作为启动写作的工具是高效且合理的方式。
  • 写作中的意外发现和灵感往往来自反复推敲的迭代过程,单纯依赖 AI 提供初稿并编辑,可能错失这种创造性体验。
  • 使用 AI 并非完全替代写作,而是通过提供初始文本作为“响应对象”,帮助打破决策瘫痪,从而激发真正属于自己的表达。
  • 高度定制化的 AI 工具(如“语言协处理器”)可以成为写作伙伴,通过指令系统引导 AI 挑战用户思维,而非迎合用户,从而提升写作质量。
  • 尽管 AI 可能带来思维锚定的风险,但通过精心设计的交互方式,仍可避免其负面影响,实现深度协作。
  • 对 ADHD 人群而言,与其强迫自己“练习”写作的初始阶段,不如善用工具释放有限的精力,专注于真正重要的产出,这是更可持续的策略。
  • 写作的真正核心在于后期的修改与打磨,初稿只是为后续工作铺路,因此初稿质量并非决定性因素。
  • 将 AI 视为“智能同传”或“写作观察员”,在保持自己主导权的同时,利用其辅助优化表达和词汇选择,是一种高效协作模式。
  • 与其对抗大脑的运作方式,不如顺应其特点,借助工具弥补短板,从而实现更高效率和更低心理负担的创作。

MCP 已死;MCP 万岁 (MCP is dead; long live MCP) #

https://chrlschn.dev/blog/2026/03/mcp-is-dead-long-live-mcp/

文章指出,当前 AI 行业对 CLI(命令行界面)的追捧正在取代此前对 MCP(Model Context Protocol)的热衷,但这种趋势存在误解。作者认为,MCP 并非全无价值,尤其在企业级应用中,其在标准化、安全、可观测性和团队协作方面具有不可替代的优势。

尽管 CLI 在某些场景下能带来显著的 token 节省,例如使用模型训练数据中已广泛出现的工具(如 curl、jq、git 等),但这种优势仅限于通用工具。对于自定义 CLI 或 REST API,仍需提供详细说明,否则 LLM 难以正确调用,反而可能因频繁修正而增加上下文负担。

文章强调,MCP 的核心价值不在于 API 封装,而在于其作为组织级工具的结构化能力:统一管理提示词、资源、权限与使用数据。MCP 支持企业级的可观测性、安全认证和工具使用分析,这是个人开发者使用 CLI 难以实现的。

作者批评当前行业受“影响者驱动”的 hype 循环影响,过度推崇 CLI 而贬低 MCP,忽略了组织级 AI 工程与个人实验之间的本质差异。真正的挑战不是接口形式,而是如何在团队协作中实现可维护、可审计、可扩展的 AI 代理系统。

结论是:MCP 并未死亡,而是被误解。在企业与组织层面,MCP 仍是实现高效、安全、可管理 AI 工程的未来方向。开发者应超越短期流行趋势,关注长期工程价值。


HN 热度 253 points | 评论 191 comments | 作者:CharlieDigital | 1 day ago #

https://news.ycombinator.com/item?id=47380270

  • 当前 AI 集成普遍存在设计不足的问题,许多开发者对 AI 工具的构建缺乏深入思考,导致生成内容质量低下,缺乏真正的标准化。
  • 命令行帮助文档的标准化程度极低,不同工具对-h、–help 等参数的定义不统一,导致用户困惑,而现代文档多依赖 LLM 生成的“垃圾文档”。
  • AI 相关技术标准的演进模式重复且无效,从“现代标准”到“标准”再到“无标准”,最终沦为过时概念,根本原因在于文本驱动的 AI 难以应对复杂网络协议的内在复杂性。
  • LLM 基于文本的抽象方式会过度设计简单功能,而传统二进制协议(如 ICMP ping)在效率上远胜,文本抽象本质上是低效的“沙上城堡”。
  • 最佳 AI 工具设计应引入确定性边界,让 AI 负责创造性决策,而具体操作通过可验证、可审计的确定性接口执行,提升系统可靠性。
  • 通过服务网格和策略引擎(如 OPA)集中管理 AI 代理的权限与行为,实现统一策略控制、安全监控和 CLI 自动化生成,提升可维护性。
  • 在 AI 操作层引入加密授权机制,确保任务级权限可验证、可追溯,防止代理被攻破后滥用权限,提升系统安全性。
  • 代理系统应像管理人类用户一样管理权限,包括认证、授权与撤销,避免开放系统接口导致安全风险。
  • MCP 协议作为 AI 应用间通信的标准化协议,借鉴 HTTP 等经典协议的设计理念,提供应用无关的通用通信语言,是实现 AI 互操作性的必要基础。
  • 当前 AI 代理无法直接运行任意 CLI 命令,因此需要 MCP 这类协议作为桥梁,但一旦代理具备执行命令能力,MCP 的必要性将下降。
  • 未来 AI 系统可能演变为“专家系统”的反向形态:由智能体组合一系列确定性、专业化工具,形成更强大、更可预测的复合能力。
  • 从统计物理中的轨迹视角理解 AI 代理,强调路径依赖、非平衡态演化和资源动态利用,为 AI 行为建模提供新范式。
  • 机器学习的成功可从统计物理的前沿理论(如 Paris、Wolpert 等人的工作)中获得启发,特别是非平衡热力学与计算的交叉视角。
  • 当前 AI 系统在安全与控制方面投入大量精力构建“护栏”,可能导致系统复杂度与成本上升,接近传统专家系统的水平,但效率更低。

FCC 主席威胁撤销广播执照,因报道伊朗战争引发批评 (Head of FCC threatens broadcaster licenses over critical coverage of Iran war) #

https://twitter.com/BrendanCarrFCC/status/2032855414233047172

美国联邦通信委员会(FCC)委员布伦丹·卡恩(Brendan Carr)在 X 平台发表言论,批评广播媒体传播虚假新闻和误导性信息,称其行为构成“新闻骗局”。他指出,广播公司必须以公众利益为宗旨,否则将面临执照被撤销的风险。当前,公众对传统媒体的信任度已降至历史最低点,仅为 9%,导致收视率大幅下滑,这不仅影响媒体声誉,也损害其商业利益。

卡恩强调,美国民众通过免费使用国家广播频谱的方式,已向广播媒体投入了数十亿美元的公共资源。因此,媒体有责任重建公众信任,纠正当前“虚假新闻”的标签。他警告,当政治候选人能在虚假信息泛滥的环境下赢得压倒性胜利时,说明公众对媒体已失去信心,这是整个社会需要警惕的问题。

他呼吁广播行业立即改变方向,主动纠正错误,否则将面临严重后果。卡恩认为,改革不仅是法律要求,更是媒体自身生存和发展的必要之举。


HN 热度 248 points | 评论 116 comments | 作者:theahura | 1 day ago #

https://news.ycombinator.com/item?id=47380294

  • 如果总统或内阁成员不喜欢媒体批评自己,不如提升自身表现,而非威胁媒体。
  • 当前主流电视新闻频道多为立场鲜明的评论节目,而非客观报道,已沦为政治宣传工具。
  • Fox News 等右翼媒体长期存在严重事实错误,其内容更接近“评论”而非“新闻”。
  • 无法通过单一标准判断新闻报道是否“错误”,因为媒体普遍避免直接称领导人“说谎”。
  • 媒体对政治人物的批评往往基于事实,但公众对媒体的信任度因立场而异。
  • 将娱乐化内容包装成新闻却不受法律约束,属于虚假广告,应受法律制裁。
  • 一些人认为媒体自由是民主的基石,但现实中媒体受资本、政治和意识形态多重控制。
  • 所谓“私营媒体”与“政府媒体”本质区别不大,关键在于是否能独立影响公众舆论。
  • 民主国家的媒体虽有多个,但各自带有强烈立场,导致公众难以获得客观信息。
  • 政治极化下,媒体成为不同利益集团的发声工具,信息传播趋于极端化。
  • 用“政府干预言论”来指责对手,是典型的“镜像指控”策略,旨在转移焦点。
  • 这种策略让反对派陷入被动,制造混乱,为自身不当行为提供借口。
  • 选举舞弊指控的频繁使用,可能预示着未来选举中类似行为的出现。
  • 伊朗可能被用作借口,为总统在选举期间采取越权行动提供合法性。

Claude 2026 年 3 月使用推广活动 (Claude March 2026 usage promotion) #

https://support.claude.com/en/articles/14063676-claude-march-2026-usage-promotion

本次推广活动旨在为使用 Claude 服务的用户提供限时使用额度翻倍的优惠,活动时间为 2026 年 3 月 13 日至 3 月 27 日。 该优惠适用于除企业版(Enterprise)外的所有计划,包括免费版、Pro 版、Max 版及团队版(Team)。

在非高峰时段(工作日的早上 8 点至下午 2 点 ET/早上 5 点至上午 11 点 PT 以外的时间),用户的每日五小时使用额度将被翻倍。 高峰时段的使用限制保持不变,不会受到影响。

该优惠自动生效,无需用户手动操作,使用额度的提升会实时反映在账户中。 额外获得的使用量不计入每周使用上限,不会影响原有计划的使用规则。

推广结束后,所有使用额度将恢复至正常水平,账户和计费方式均无变化。

此优惠适用于以下所有 Claude 产品和服务:

  • Claude 网页端、桌面端和移动端
  • Cowork
  • Claude Code
  • Claude for Excel
  • Claude for PowerPoint

活动不与其他优惠叠加,无现金价值,不可转让。


HN 热度 241 points | 评论 144 comments | 作者:weldu | 1 day ago #

https://news.ycombinator.com/item?id=47380647

  • 希望推出 5-10 美元/月的低峰时段使用计划,适合业余开发者在下班后进行小项目。
  • GPU 算力在非推理时段可能被用于训练,因此短期内难以看到按时间计费的模式。
  • 当前公告实际上是一种间接的时间计费模式,可能预示未来将推出按时间计费服务。
  • 建议直接为开源开发者提供免费使用权限,以支持其兴趣项目。
  • 验证用户是否为开源开发者存在实际操作困难,目前需通过申请渠道提交。
  • 企业级计划用户表示其个人使用量巨大,每月消耗高达 3000 美元,难以承受低价计划。
  • 有用户认为 20 美元/月的 Pro 计划性价比高,即使每天仅使用 2-3 小时也值得。
  • 与 Copilot 相比,Claude 在价格和模型能力上缺乏优势,难以说服用户付费。
  • Copilot 不仅限于 VS Code,还支持 Notepad、Edge、Office 等多平台,且可选择不同模型。
  • 低峰时段使用可能与能源成本挂钩,利用非高峰电价降低运营成本。
  • 低峰时段使用主要集中在美东时间晚上 11 点至凌晨 5 点,对其他时区用户意义有限。
  • 有用户观察到在特定时段(如下午 3-4 点 CEST)模型性能下降,推测与美国用户活跃度有关。
  • 希望 Anthropic 更明确地公布各时段的使用额度和时间窗口,提升透明度。
  • 低峰时段的算力利用是企业合理化资源调度的策略,可考虑主动引导用户错峰使用。
  • 使用本地时区而非 UTC 对全球服务是不合理做法,尤其涉及夏令时切换时易出错。
  • 低峰时段推广可能是为了吸引更多澳大利亚用户,带有地域营销意图。

Hacker News 精彩评论及翻译 #

Ageless Linux – Software for humans of indetermina… #

https://news.ycombinator.com/item?id=47382416

Something remarkable and unsettling is how the age verification debate has popped up almost simultaneously in the US, UK, and EU.

With the same logical fallacies. Pretty telling about how transnational lobbies and their interests work.

Controlling what children do online is a solved problem: Parenting and parental control applications.

nextos

令人感到不安且值得注意的是,年龄验证的争论几乎同时在美国、英国和欧盟出现。 带着同样的逻辑谬误。这很能说明跨国游说团体及其利益运作的方式。 控制孩子在网上的行为是一个已解决的问题:家长教育和家长控制软件。


The Appalling Stupidity of Spotify’s AI DJ #

https://news.ycombinator.com/item?id=47386101

What a strange article, from somebody who should understand the underlying technology (click on the “books” tab - the author is a technologist).

This is not about AI, the author is mostly just pointing out that Spotify was not designed for classical music.

This is a product issue. Spotify DJ is essentially “shuffle with some voice interludes”. There’s probably some non-AI code in there to explicitly prevent it from playing an album end to end.

Besides, AI is not one thing. It’s weird to generalise “This beta spotify feature doesn’t serve me, hence AI is useless”. For example, when the author says “if it can’t do this, how could it compose music?”, that’s a category error.

Honestly the whole post and tone are just baffling. It’s mixing up all sorts of opinions and trying to put them under one umbrella, and about 50% of the text is just name dropping specific classical pieces.

I happen to agree that the Spotify DJ feature is terrible, but I think this is a very ineffective way of presenting the argument.

sd9

这篇文章写得真是奇怪,作者是技术人员(点击一下“书籍”标签就能看到——本该懂得底层技术)。

这并不是关于 AI 的话题,作者主要只是在指出 Spotify 并不是为古典音乐设计的。

这是一个产品问题。Spotify DJ 本质上就是“带有语音插曲的随机播放”。里面可能包含一些非 AI 代码,明确禁止它从头到尾播放整张专辑。

此外,AI 并不是一回事。把“这个 Spotify Beta 功能不适合我,所以 AI 毫无用处”这种观点泛化是很奇怪的。例如,当作者说“如果连这个都做不到,它怎么能创作音乐呢?”,这就是一个范畴错误。

老实说,整篇文章和语气真是令人费解。它混淆了各种观点,试图将它们归纳在一起,而且大约 50% 的篇幅只是罗列具体的古典曲目。

我恰好也同意 Spotify DJ 功能很糟糕,但我觉得这是一种非常无效的论证方式。


The 100 hour gap between a vibecoded prototype and… #

https://news.ycombinator.com/item?id=47387423

I work as a DevOps/SRE and have been doing it FinTech (bank, hedge funds, startups) and Crypto (L1 chain) for almost 20 years.

My thoughts on vibe coding vs production code:

  • vibe coding can 100% get you to a PoC/MVP probably 10x faster than pre LLMs

  • This is partly b/c it is good at things I’m not good at (e.g. front end design)

  • But then I need to go in and double check performance, correctness, information flow, security etc

  • The LLM makes this easier but the improvement drops to about 2-3x b/c there is a lot of back and forth + me reading the code to confirm etc (yes, another LLM could do some of this but then that needs to get setup correctly etc)

  • The back and forth part can be faster if e.g. you have scripts/programs that deterministically check outputs

  • Testing workloads that take hours to run still take hours to run with either a human or LLM testing them out (aka that is still the bottleneck)

So overall, this is why I think we’re getting wildly different reports on how effective vibe coding is. If you’ve never built a data pipeline and a LLM can spin one up in a few minutes, you think it’s magic. But if you’ve spent years debugging complicated trading or compliance data pipelines you realize that the LLM is saving you some time but not 10x time.

alexpotato

我是一名 DevOps/SRE,在 FinTech(银行、对冲基金、初创公司)和 Crypto(L1 链)行业工作了近 20 年。

关于 vibe coding 与生产环境的代码的看法:

  • vibe coding 绝对能让你更快地达到 PoC/MVP(概念验证/最小可行性产品),速度可能比 LLM 出现之前快 10 倍。

  • 这部分是因为它擅长我不擅长的事情(例如前端设计)。

  • 但随后我还需要手动进入代码中进行复查,检查性能、正确性、数据流向、安全性等。

  • LLM 确实让这个过程更容易了,但效率提升大约下降到了 2-3 倍,因为有很多反复的交互迭代 + 我需要审阅代码来确认细节(是的,可以用另一个 LLM 来处理一些,但这同样需要正确配置等)。

  • 如果你有能够确定性检查输出结果的脚本/程序,这部分反复过程就会更快。

  • 无论是由人类还是 LLM 来执行测试,那些需要运行数小时的负载任务,依然需要花费数小时(这意味着这依然是瓶颈)。

因此,总的来说,这就是为什么我们对 vibe coding 的有效性会有截然不同的评价的原因。如果你从未构建过数据管道,而 LLM 能在几分钟内就搭建好一个,你会觉得这简直像魔法一样。但如果你已经花费多年时间调试复杂的交易或合规数据管道,你就会意识到,LLM 确实为你节省了一些时间,但没有节省 10 倍的时间。


Hollywood Enters Oscars Weekend in Existential Cri… #

https://news.ycombinator.com/item?id=47389760

My fiance mentioned we haven’t gone to see a movie in theaters in years and it would be fun to go.

I checked what was playing and:

2 tickets, 2 sodas, 1 popcorn.

$86 dollars.

Don’t know if I’ll ever go to a conventional movie theater again.

WarmWash

未婚夫提到我们好几年没去影院看电影了,说是去一趟肯定会很有意思。

我查了一下正在上映什么: 2 张票,2 杯苏打水,1 包爆米花。 86 美元。 真不知道以后还会不会再去这种传统的电影院了。


The Appalling Stupidity of Spotify’s AI DJ #

https://news.ycombinator.com/item?id=47386197

click on the “books” tab - the author is a technologist

That’s rather underselling him. Charles Petzold wrote the canonical reference works for programming Win32 and MFC.

It’s like calling Donald Knuth a lecturer.

timthorn

点击“书籍”标签——作者是一位技术专家。 这简直是在严重低估他。查尔斯·佩佐德编写了 Win32 和 MFC 编程的权威参考书。 这就好比说 Donald Knuth 只是个讲师。


Life as an OnlyFans ‘chatter’ #

https://news.ycombinator.com/item?id=47379872

It is fraud. However, one thing has become crystal clear lately is that laws are only as good as we have systems in place that are willing and able to enforce them.

And further, scamming people in the context of sex has always been easy because of the shame in admitting you fell for it.

Imagine filing a report that you spent thousands of dollars chatting with some random person, having the chat logs submitted as evidence, etc. it’s similar to why all types of sexual assault are rarely reported

mingus88

这是诈骗。然而,最近有一件事已经变得非常清楚,那就是法律的有效性完全取决于我们是否有意愿和能力去执行它们的相关制度。

此外,在涉性诈骗中一直很容易,因为承认自己被骗会感到羞耻。

试想一下,你要去报案说自己花了几千块钱跟一个陌生人聊天,还得提交聊天记录作为证据,诸如此类。 这就跟为什么各种性侵案件鲜少被报案一样。


Pentagon expands oversight of Stars and Stripes, l… #

https://news.ycombinator.com/item?id=47387177

“The Pentagon has released a modernization plan for Stars and Stripes that affirms the publication’s independence while expanding Defense Department oversight, introducing new restrictions on content”

Seems like this sentence contains contradictory statements.

Eddy_Viscosity2

五角大楼发布了一份《星条旗报》现代化计划,该计划在确认该刊物独立性的同时,扩大了国防部对该报的监管,并引入了关于内容的新限制。


Elon Musk pushes out more xAI founders as AI codin… #

https://news.ycombinator.com/item?id=47371458

Definitely one approach to the circumstances. I tried some variation of this and it blew up in my face (as I expected ).

Towards the end of my time there, a “fixer” was brought in to shore up the team that I was working on. The “fixer” also became my manager when they were brought on.

The “fixer” proceeded to fire 70+% of the team over the course of 6-8 months and install a bunch of yes people, in addition to wasting about $2,000,000 on a subscription to rebuild our core product with a framework product no one on the team knew. I was told to deploy said framework product on top of Kubernetes (which not a single person on my team had any experience with) while delivering on other in-flight projects. I ignored the whole thing.

I ended up deciding I was done with Tesla and went into a regularly scheduled 1:1 with my manager (the “fixer”) with a written two-weeks notice in hand, only to be fired (with 6-weeks severance, thankfully) before I was able to say anything about giving notice.

One of the best ways to get fired in my opinion.

jarrettcoggin

这确实是一种应对这种情况的方法。我尝试过类似的变体,结果适得其反(正如我所料)。

在我在那里工作的后期,公司请进来一位“救火队员”来挽救我们所工作的团队。当这位“救火队员”加入时,他们同时也成了我的经理。

在接下来的6到8个月里,这位“救火队员”解雇了团队70%以上的人,并安插了一堆只会唯唯诺诺的人,同时还浪费了大约200万美元的订阅费,试图用团队里没人会用的框架产品来重构我们的核心产品。我被要求在部署那个所谓的框架产品(而团队里没有任何人使用过Kubernetes)的同时,继续交付其他进行中的项目。我完全无视了这件事。

我最终决定受够了特斯拉,于是带着手写好的两周通知,走进了与经理(那位“救火队员”)的定期1对1面谈中,结果还没来得及说出要辞职的事,我就被解雇了(万幸的是,拿到了6周的经济补偿)。

依我看,这是被裁的最好方式之一。


Life as an OnlyFans ‘chatter’ #

https://news.ycombinator.com/item?id=47379585

How is this not fraud, or at least false advertising? If I’m paying money to chat with a specific sex worker how is it even legal to let some random dude in a third world country pretend to be the person I’m supposed to be talking to? I’ve never personally engaged in these types of systems, but I don’t think there’s a problem with them as long as they are run honestly. It sounds like Onlyfans is exploiting workers and their own customers.

autoexec

这怎么能不算欺诈,或者至少是虚假宣传?如果我花钱是为了和一个特定的性工作者聊天,怎么能允许一个来自第三世界国家的随便一个家伙假装成我要找的那个人?这怎么能合法?我个人从未接触过这类系统,但如果它们运营诚实的话,我认为没问题。看来Onlyfans是在剥削工作者以及自己的客户。


What happens when US economic data becomes unrelia… #

https://news.ycombinator.com/item?id=47379141

The phrase “when US data becomes unreliable” is misleading in one sense: for many years political manipulation of economic data has screwed things up.

Calculation of unemployment and real debt has seldom matched the norms of most other western countries. Add military (often black budgets) spending without much oversight or accurate accounting.

The wealthiest people in the USA are now in the mode of grabbing what they can while the ‘grabbing is still good.’ Without this immoral looting, our government could do a better job of protecting US citizens as our empire collapses.

mark_l_watson

“当美国数据变得不可靠”这个说法在某种程度上具有误导性:多年来对经济数据的政治操弄已经彻底搞砸了一切。在计算失业率和真实债务方面,美国很少符合大多数其他西方国家的标准。再加上没有足够监管或精确核算的军事开支(往往涉及“黑预算”)。美国最富有的人目前正处于“还能捞就捞”的疯狂敛财模式中。如果没有这种不道德的掠夺行为,我们的政府在帝国瓦解之际本可以更好地保护美国公民。


Changes to OpenTTD Distribution on Steam #

https://news.ycombinator.com/item?id=47382234

This doesn’t feel right for me. OpenTTD is so much superior in every way compared to the original TTD, that noone in their right mind would ever play the original. So Atari now, while spending zero effort compared to the years of work that OpenTTD devs put in, will basically sell OpenTTD as if was their own creation. People who buy the new TTD will simply play OpenTTD anyway, since it’s so much better.

I might be wrong, but it feels like Atari are like parasites in this situation feeding off the hard work of OpenTTD devs.

TuxMark5

这事对我来说感觉很不对劲。OpenTTD 在各个方面都比原版 TTD 强太多了,理智的人根本不会去玩原版。那么 Atari 现在呢,与 OpenTTD 开发者投入的数年心血相比,他们几乎零投入,却把 OpenTTD 包装成自己的作品来售卖。买新版 TTD 的人反正只会去玩 OpenTTD,因为后者强太多。我也许搞错了,但感觉 Atari 就像寄生虫一样,在坐享 OpenTTD 开发者的劳动成果。


XML is a cheap DSL #

https://news.ycombinator.com/item?id=47376221

XML is notoriously expensive to properly parse in many languages. Basically, the entire world centers around 3 open source implementations (libxml2, expat and Xerces), if you want to get anywhere close to actual compliance. Even with them, you might hit challenges (libxml2 was largely unmaintained recently, yet it is the basis for many bindings in other languages).

The main property of SGML-derived languages is that they make “list” a first class object, and nesting second class (by requiring “end” tags), and have two axes for adding metadata: one being the tag name, another being attributes.

So while it is a suitable DSL for many things (it is also seeing new life in web components definition), we are mostly only talking about XML-lookalike language, and not XML proper. If you go XML proper, you need to throw “cheap” out the window.

Another comment to make here is that you can have an imperative looking DSL that is interpreted as a declarative one: nothing really stops you from saying that

totalOwed = totalTax - totalPayments totalTax = tentativeTaxNetNonRefundableCredits + totalOtherTaxes totalPayments = totalEstimatedTaxesPaid + totalTaxesPaidOnSocialSecurityIncome + totalRefundableCredits means exactly the same as the XML-alike DSL you’ve got.

One declarative language looking like an imperative language but really using “equations” which I know about is METAFONT. See eg. https://en.wikipedia.org/wiki/Metafont#Example (the example might not demonstrate it well, but you can reorder all equations and it should produce exactly the same result).

necovek

在许多语言中,正确解析 XML 是出了名的困难且代价高昂。基本上,如果你想接近实际的合规性,整个世界都围绕着 3 个开源实现(libxml2、expat 和 Xerces)展开。即使有这些,你也可能会遇到挑战(libxml2 最近基本处于缺乏维护的状态,但它仍是许多其他语言绑定的基础)。

基于 SGML 的语言的主要特性在于,它们将“列表”视为一等公民,将嵌套视为二等公民(通过要求“结束”标签来实现),并提供了两个用于添加元数据的维度:一个是标签名,另一个是属性。

因此,虽然它适用于许多用途(它也在 Web 组件定义中重获新生),但我们通常谈到的只是类 XML 语言,而不是纯粹的 XML。如果涉及纯粹的 XML,你就得把“简易/廉价”抛诸脑后。

这里还要补充的一点是,你可以拥有一个看起来像命令式的 DSL,但被解释为声明式 DSL:没有什么能真正阻止你写下这样的代码:

totalOwed = totalTax - totalPayments totalTax = tentativeTaxNetNonRefundableCredits + totalOtherTaxes totalPayments = totalEstimatedTaxesPaid + totalTaxesPaidOnSocialSecurityIncome + totalRefundableCredits

这与你得到的类 XML DSL 意思完全相同。

我所知道的有一门看起来像命令式语言但实则使用“等式”的声明式语言,那就是 METAFONT。例如参见 https://en.wikipedia.org/wiki/Metafont#Example(该例子可能演示得不够好,但你可以重新排列所有等式,它应该产生完全相同的结果)。


Ageless Linux – Software for humans of indetermina… #

https://news.ycombinator.com/item?id=47385184

I’m completely baffled why anyone still engages with the “official” framing around this. Obviously, it’s not for protecting children. Obviously, it’s a technocratic trojan horse for increasing surveillance capabilities on digital systems. This is so cynically anti-democratic that they obfuscate the real purpose, don’t even bother to make it plausible, and everyone is left talking about how “awful it is” that it’s already legislated.

I swear to God, if someone replies to this talking about how we need to protect the children I’m going to start requiring “age verification” from commenters, and I’ll do a little background check to find out w̵h̵e̵r̵e̵ ̵t̵h̵e̵y̵ ̵l̵i̵v̵e̵ if they’re over 18.

prohobo

我完全搞不懂为什么还有人还在参与这种事所谓的“官方”叙事。显然,这并不是为了保护儿童。显然,这其实是一个为了增加数字系统监视能力的技术官僚“特洛伊木马”。这种做法太愤世嫉俗、太反民主了,他们故意混淆真实目的,甚至懒得让谎言听起来有说服力,结果现在所有人都只能讨论法律已经通过了这件事有多糟糕。我发誓,如果有人回帖说我们要保护孩子,我就开始要求评论者进行“年龄验证”,如果他们年满18岁,我就去做个小背景调查,找出他们住哪儿。


Ageless Linux – Software for humans of indetermina… #

https://news.ycombinator.com/item?id=47382336

Now this is what open source development should look like. I cannot believe a few days ago I was thumbing through an email thread on freedesktop.org about how they could implement the mandatory government API in dbus. Can they not read their own domain name?

akersten

这才是开源开发该有的样子。我简直不敢相信,几天前我还在 freedesktop.org 的邮件讨论组里翻阅,看他们怎么在 dbus 里实施强制性的政府 API。难道他们看不懂自己的域名吗?


Head of FCC threatens broadcaster licenses over cr… #

https://news.ycombinator.com/item?id=47380552

Maybe if we’re going to name the department of defense the department of war we can go all the way and rename the FCC to the ‘ministry of propaganda’?

A free press is worth its weight in gold. If you let go of that you’re going to lose more than you bargain for. All those free speech advocates are a bit quiet on this, wonder what happened to them.

jacquesm

也许如果我们真要把国防部改成战争部,那索性一不做二不休,把FCC也改成“宣传部”?

自由媒体是无价之宝。如果你失去了它,失去的东西将远超预期。所有那些倡导言论自由的人在这件事上却很沉默,挺想知道他们怎么了。


I beg you to follow Crocker’s Rules, even if you w… #

https://news.ycombinator.com/item?id=47373876

This post is a poor exposition of Crocker’s Rules.

Crocker’s Rules were a reaction to the avoidance of direct discussion of topics where some people treat the mere act of discussion in any capacity as offensive. Sacred cows and taboos for which there are social consequences even when asking honest questions. Crocker’s Rules, practically speaking, were a declaration that no good faith discussion was intrinsically offensive ipso facto for the person making the declaration. All taboos were open to good faith arguments and attempts at rigorous intellectual inquiry.

This article is focused too much on communication style and not enough on the subject of communication. The latter was the crux of it. Crocker’s Rules were about being able to rigorously discuss topics that society has deemed to be beyond discussion without taking offense at the fact it is being discussed.

I was present when Crocker’s Rules were “invented”. I see a couple other handles here that may have been as well.

jandrewrogers

这篇文章对克罗克法则的阐述十分拙劣。

克罗克法则是对一种回避直接讨论话题现象的反应,即在某些语境下,人们仅仅参与任何形式的讨论这一行为本身就被视为冒犯。这包括那些即使提出真诚问题也会产生社会后果的“神圣不可侵犯之物”和禁忌。

从实践上看,克罗克法则是一种声明,声明者并不是必然地认为任何善意的讨论在本质上是冒犯的。所有的禁忌都应当接受善意的论证,并开放给严谨的智力探究尝试。

这篇文章过于关注沟通风格,而对沟通的主题关注不够。后者才是关键所在。克罗克法则的真正意义在于,能够严格讨论那些社会视为不可讨论的话题,且不因话题正在被讨论而感到冒犯。

当克罗克法则被“发明”时,我在场。我在这看见几个别的用户名,其作者可能也在场。


Ageless Linux – Software for humans of indetermina… #

https://news.ycombinator.com/item?id=47382542

It’s not if you’ve paid attention to political trends for the last 15 years.

Everything is happening at the same time in every country. It’s clearly being coordinated.

brightball

如果你关注了过去15年的政治趋势,就会发现。每个国家都在同一时间发生着同样的事情。这显然是经过协调的。


RAM kits are now sold with one fake RAM stick alon… #

https://news.ycombinator.com/item?id=47376926

I miss the days when most people had a vanilla looking computer. You wouldn’t have felt out of place at the LAN party lugging in your dad’s old Packard Bell tower that you used for your gaming rig.

We still appreciated visually stunning PCs. Not just for the works of art that they were, but also for the DIY skill and ethic you were actually required to demonstrate to build and mod them.

Nowadays, it’s all just “RGB by default”. By my angry old man standards, it looks gauche. Then again, I suppose it’s the new vanilla?

skibz

我怀念大多数人都用外观朴素电脑的时候。在局域网派对上,只要你拖着爸爸那台你原本用来装游戏主机的旧普莱特贝尔塔式机,绝不会感到格格不入。

我们依然欣赏那些外观惊艳的电脑。不仅是因为它们像艺术品一样,更因为在组装和改装它们时,你必须具备并展示出的那种动手能力和自制精神。

如今,全都是“默认RGB”。以我这个暴躁老头的标准来看,这太俗气了。不过话又说回来,我想这大概就是新时代的“朴素”了吧?


Office.eu launches as Europe’s sovereign office pl… #

https://news.ycombinator.com/item?id=47391142

This is just a Nextcloud rebrand with a confusing domain name. It claims “Core is [100%] Open Source” but no source code is provided beyond what’s already available in the upstream projects, and it’s unlikely that there will be (as this happens a lot). It’s a one-man project without a track record or certifications based out of a shared office space [1].

And don’t get me wrong: there’s nothing wrong with starting a business rebranding Nextcloud and keeping your development closed source, as long as you’re honest about that, which this initiative is not.

If you’re looking for a Nextcloud hoster, there’s a long list of partners here [2] that have contractually obligated themselves to contribute back to Nextcloud for every user they onboard.

[1] https://blog.tomaszdunia.pl/officeeu-eng/

[2] https://nextcloud.com/partners/

Confiks

这不过是个 Nextcloud 的换壳项目,而且域名起得让人看不懂。它声称“核心[100%]开源”,但实际上并未提供除上游项目现有代码之外的任何源码,而且看来也不会有(这种事屡见不鲜)。这只是一个单人项目,没有任何过往业绩或资质认证,办公地点在共享办公空间里 [1]。

请不要误会:如果开公司把 Nextcloud 换个牌子并将开发闭源,这本身并没有错,只要你能对此坦诚相待,而这个项目显然没有。

如果你正在寻找 Nextcloud 的托管商,这里有一份很长的合作伙伴名单 [2],他们与客户签订合同,承诺每接纳一位用户都会向 Nextcloud 贡献代码。

[1] https://blog.tomaszdunia.pl/officeeu-eng/ [2] https://nextcloud.com/partners/