MoreRSS

site iconHackerNews AI 摘要修改

使用 RPA 方案,每天自动获取 Top Stories ,使用 GPT 方式自动摘要,同时会一并摘要 HackerNews 网友的评论。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

HackerNews AI 摘要的 RSS 预览

2026 04 20 HackerNews

2026-04-20 07:58:10

2026-04-20 Hacker News Top Stories #

  1. 康奈尔德语教师用手动打字机要求学生完成写作以远离AI与线上工具、重拾专注与交流,呼应高校回归纸笔/口试防作弊并引发“考试制 vs 持续考核”的争议。
  2. Vercel 因第三方 Context.ai 的 Google Workspace OAuth 被攻破而泄露标为“非敏感”的未加密环境变量,黑客自称售卖数据要价200万美元,暴露第三方AI依赖的安全薄弱环节。
  3. NIST 通过在硅片上三维集成多材料实现芯片级多波长可调谐激光器,显著缩小体积与成本、提升变频与开关效率,助力量子计算、原子钟、生医与通信应用。
  4. Vercel 披露内部系统遭入侵影响“有限子集客户”,起因为第三方AI工具的 OAuth 泄露并建议客户审计日志与轮换环境变量,凸显对外部服务依赖带来的系统性风险。
  5. 作者批评 Figma 设计系统过度复杂、真理源回归代码,认为如 Claude Design 的 HTML/JS 工具可降设工摩擦但仍稚嫩,生态或分化为延续Figma与探索型创作两路。
  6. 美以对伊朗冲突期间预测市场与油期货出现超10亿美元、与事件节点高度同步的押注,疑涉内幕信息且监管滞后,引发对预测市场伦理与腐败风险的争议。
  7. Notion 被曝公开页面可无认证枚举所有编辑者姓名与邮箱且自2022年来未修复,官方仅考虑移除或代理个人信息,暴露遗留依赖导致的隐私设计缺陷。
  8. 文章提出 ALGOL、Lisp、ML、Self、Forth、APL、Prolog 七大“原语言”,主张先掌握其范式与核心抽象以加速跨语言迁移并深化对类型、对象、堆栈、向量化与逻辑推理的理解。
  9. 迪拜一航空公司员工因在私人WhatsApp群组分享爆炸照片被捕,折射阿联酋对通信的深度监控与诱捕执法,引发对隐私和言论自由的担忧。
  10. 为延长旅行者1号寿命,NASA 关闭低能带电粒子实验以应对RTG电力衰减,优先保留等离子波与磁强计继续获取星际介质数据。

1. 大学教师转向使用打字机以遏制人工智能写作作业 (College instructor turns to typewriters to curb AI-written work) #

https://sentinelcolorado.com/uncategorized/a-college-instructor-turns-to-typewriters-to-curb-ai-written-work-and-teach-life-lessons/

这篇文章报道了康奈尔大学一位德语教师格里特·马蒂亚斯·费尔普斯(Grit Matthias Phelps)采用老式手动打字机进行教学的创新做法。每学期一次,她让学生们使用没有屏幕、没有拼写检查和在线翻译辅助的手动打字机完成德语写作作业,旨在让学生体验数字化之前的写作过程,培养他们独立思考和动手能力。

费尔普斯教授表示,这一做法源于她对学生普遍依赖生成式人工智能和在线翻译工具完成作业的担忧。她希望学生能真正理解写作的意义,而不是简单复制机器生成的内容。她从二手市场收集了几十台手动打字机,设计了“模拟”作业,让学生们远离数字设备,专注于写作本身。

学生们初次接触打字机时感到困惑,发现操作并不简单,需要手动装纸、用力敲击键盘、听打字机的铃声提示换行等。费尔普斯教授强调,这种慢节奏的写作方式让学生们体验到“一次只做一件事”的乐趣和专注感。

此外,学生们发现没有屏幕和通知的干扰,他们更容易集中注意力,写作过程中也更多地与同学交流和讨论,增强了社交互动。这种教学方法不仅是对抗人工智能写作的手段,更是一种让学生重新连接写作本质和课堂体验的尝试。

文章还指出,虽然手动打字机的使用尚未在其他学校广泛推广,但这种回归传统的教学趋势反映了教育界对人工智能带来的挑战的回应,包括更多采用纸笔考试和口头测试等方式防止学生依赖 AI 完成作业。


HN 热度 457 points | 评论 410 comments | 作者:gnabgib | 1 day ago #

https://news.ycombinator.com/item?id=47818485

  • 传统的考试模式(期中、期末笔试)被认为更能防止作弊,且通过考试成绩决定最终成绩,作业和项目占比小。
  • 西班牙等地的大学改革引入了持续考核和课程作业,虽然促进了学生持续学习,但对兼职学生不友好,且作弊变得更容易。
  • 持续考核模式有助于学生长期记忆和分散学习压力,避免临考前突击复习。
  • 过度依赖考试可能导致学生临时抱佛脚,难以保持长期知识掌握。
  • 有观点认为持续考核更有利于女生表现,减少性别差异,但真实性存疑。
  • 教育改革有时基于缺乏充分证据的假设,甚至存在伪科学影响教学方法。
  • 英国和德国等地的部分课程仍以期末考试为主,作业更多作为考试资格门槛。
  • 教育研究领域较软,受主观影响大,AI 的引入可能改善实验重复性和客观性。
  • 博洛尼亚进程被部分人认为降低了学位的含金量,改革效果存在争议。

2. Vercel 2026 年 4 月安全事件 (Vercel April 2026 security incident) #

https://www.bleepingcomputer.com/news/security/vercel-confirms-breach-as-hackers-claim-to-be-selling-stolen-data/

云开发平台 Vercel 近日确认遭遇安全事件,黑客声称已入侵其系统并试图出售被盗数据。Vercel 专注于为开发者提供 JavaScript 框架的托管和部署服务,尤其以 Next.js 框架闻名。此次安全事件影响了部分客户,Vercel 表示其服务未受影响,正在积极调查并与受影响客户合作,同时已通知执法部门。

调查显示,入侵源于第三方 AI 工具 Context.ai 的 Google Workspace OAuth 应用被攻破,攻击者通过一名 Vercel 员工的 Google 账户获得初始访问权限,随后进一步访问了未标记为敏感的环境变量,这些变量未加密存储,导致更多数据泄露。Vercel 强调其所有环境变量均采用加密存储,但存在将部分变量标记为“非敏感”的功能,攻击者利用这一点扩大了访问范围。

Vercel 已更新仪表盘,增强环境变量管理功能,建议客户审查环境变量并启用敏感变量加密。公司确认其开源项目如 Next.js 和 Turbopack 未受影响。

黑客自称“ShinyHunters”在黑客论坛发布消息,称出售包括访问密钥、源代码、数据库数据及内部部署访问权限等信息。该黑客还分享了包含 580 条 Vercel 员工信息的文件及内部仪表盘截图,但真实性尚未独立验证。黑客声称与 Vercel 有联系,并提出 200 万美元的赎金要求。

Vercel CEO Guillermo Rauch 在社交媒体上补充说明了事件细节,强调公司采取多层防护措施保护客户数据,并呼吁客户加强安全防护。事件仍在调查中,相关更新将持续发布。


HN 热度 457 points | 评论 281 comments | 作者:colesantiago | 10 hours ago #

https://news.ycombinator.com/item?id=47824463

  • 事件起因是第三方 AI 工具 Context.ai 的 Google Workspace OAuth 应用被攻破,导致 Vercel 员工账户被入侵,攻击者利用此获得了 Vercel 环境的进一步访问权限。
  • 攻击者技术高超,利用 AI 加速攻击过程,行动迅速且对 Vercel 系统理解深入。
  • 该 OAuth 应用已被删除,无法直接查询,官方未明确公开具体应用名称,可能因法律或公关考虑。
  • 依赖第三方 AI 工具带来安全风险,整个生态中“最薄弱环节”决定安全水平,过度依赖外部服务增加攻击面。
  • 现代网络开发趋向于大量集成第三方服务,导致系统复杂度和潜在风险增加,需反思是否应调整发展方向。
  • 有观点认为这是 Unix 哲学“写专注做一件事的程序并互联”的极端应用,导致安全问题,呼吁改变托管和开发模式。
  • 也有人认为无论是自托管还是使用托管服务,代码质量和安全性才是关键,不能简单归因于 AI 或托管方式。
  • 对 AI 工具和传统软件安全性的比较存在争议,AI 生成代码缺乏“意图”,但传统软件同样存在大量漏洞。
  • AI 极端支持者认为通过 AI 循环改进代码和安全审查是未来趋势,尽管目前仍有失败案例。
  • 有人批评部分观点基于地域或时间的偏见,认为这类论调缺乏说服力。
  • 对 Unix 哲学的误解较多,实际设计理念与简单的“多小工具组合”不同,不能简单套用到 AI 工具安全讨论中。

3. NIST 科学家创造“任意波长”激光器 (NIST scientists create ‘any wavelength’ lasers) #

https://www.nist.gov/news-events/news/2026/04/any-color-you-nist-scientists-create-any-wavelength-lasers-tiny-circuits

美国国家标准与技术研究院(NIST)科学家开发出了一种新方法,通过在硅晶片上叠加特殊材料,制造出能够处理光子的集成光子芯片。这些芯片尺寸如指甲大小,能够产生多种颜色的激光,标志着将现有庞大且昂贵的激光系统微型化的重要进展。

这种集成光子芯片利用激光、波导、滤波器和开关等光学器件在芯片内部传输和处理信息,有望推动量子计算机、光学原子钟等新兴技术从实验室走向实际应用,影响生物医学、导航和通信等领域。

研究团队采用多层叠加结构,首先在硅晶片上覆盖二氧化硅和锂铌酸盐(能改变光颜色的非线性材料),再加入金属电极以电控光的转换和开关功能。随后叠加了第二种非线性材料五氧化二钽(tantala),能够将单一激光颜色转换成可见光彩虹及多种红外波长,实现多色激光输出。

通过这种三维叠层工艺,研究人员成功将不同材料的优势结合,实现高效的光路控制和颜色转换。每个芯片包含约一万个光子电路,能够输出独特颜色的激光光束。

这一技术突破有望解决目前激光器波长单一、体积大、成本高的问题,使量子技术更便携、更经济,从而加速其在人工智能、量子计算和精密计时等领域的应用发展。


HN 热度 406 points | 评论 185 comments | 作者:rbanffy | 1 day ago #

https://news.ycombinator.com/item?id=47819453

  • 芯片上彩虹色的图像是光的衍射现象,与激光发射的颜色无关,仅为视觉效果误导。
  • 可调谐波长激光器确实利用了衍射光栅技术。
  • 光在信息传输中速度远快于电子,但电子传输信息的速度接近光速,性能提升主要来自带宽而非延迟。
  • 电子信息传输速度是介质中的光速,如 Cat6 网线和光纤中速度约为 0.6 倍光速。
  • 空心光纤传输速度更快,但尚未广泛应用,仍处于实验室阶段。
  • 电路中信息通过电场传递,速度受介质影响,通常为光速的 0.6-0.7 倍。
  • 电信号稳定传输需要时间,但现代技术通过阻抗匹配解决了这一问题,光互连技术有望显著提升芯片间通信效率。
  • 颜色的主观体验因人而异,但大多数人对颜色的认知和关联具有共性。
  • 语言和认知理解存在个体差异,但通过共同的语境和经验可以实现有效沟通。
  • 个人的感知体验(如颜色、空间)可能完全不同,但只要映射关系一致,交流仍然可行。
  • 人类对光的感知是视网膜和大脑对光刺激的处理结果,而非光本身的直接感知。

4. Vercel 称内部系统遭遇安全入侵 (Vercel says internal systems hit in breach) #

https://decipher.sc/2026/04/19/vercel-says-internal-systems-hit-in-breach/

Vercel 是一家广泛使用的云平台,专注于应用开发和部署。该公司近日披露其内部系统遭遇安全入侵,影响了“有限子集的客户”。此次事件于周日曝光,Vercel 已聘请事故响应专家进行调查,并通知了执法部门。

调查显示,入侵源于一个第三方 AI 工具,该工具的 Google Workspace OAuth 应用遭到广泛攻击,可能影响了数百个组织的用户。Vercel 未透露具体受影响的系统和客户数量,但建议客户检查活动日志,注意异常行为,并更换环境变量。同时,建议客户使用其敏感环境变量功能,将 API 密钥等信息标记为敏感,从而以不可读格式存储。

由于入侵源自第三方应用,未来可能会有更多相关安全事件被发现。Vercel 正与受影响客户直接沟通,积极采取措施修复漏洞。该公司提供多种开发和企业服务,部分产品专注于智能代理 AI 工作负载。

文章作者 Dennis Fisher 是一位资深网络安全记者,报道了此次事件的最新进展。


HN 热度 376 points | 评论 2 comments | 作者:whiteyford | 8 hours ago #

https://news.ycombinator.com/item?id=47824976

  • Vercel 的安全事件源自一个第三方 AI 工具的 Google Workspace OAuth 应用被攻击,可能影响了数百名用户。
  • 该事件的调查结果揭示,攻击者通过被侵入的员工账户获得了进一步的访问权限。
  • 许多人对 Vercel 没有及时通过电子邮件告知用户表示担忧,尤其是在周末期间。
  • 讨论认为,依赖第三方工具会带来安全风险,反映出当前网页开发的脆弱性。
  • 网友提到,我们是否应该继续追求这样复杂的解决方案,并对未来的开发方向提出质疑。
  • 有指出,Unix 哲学与当前大量使用依赖和第三方服务的做法并不相同。
  • 有用户表达了对自我托管和自我开发代码的偏好,以提高安全性和信任感。
  • 讨论中有人提到,AI 生成的代码与传统编写的代码之间存在重要差异。
  • 用户分享了他们使用不同编程语言(如 Rust、Python、Go)进行 “vibe coding” 的经历。
  • 最后,网友们呼吁在使用 AI 工具时,开发者需要保持批判性思维,避免让 AI 决定开发方向。

5. 关于 Claude Design 的思考与感受 (Thoughts and feelings around Claude Design) #

https://samhenri.gold/blog/20260418-claude-design/

本文作者分享了对 Claude Design 工具的使用体验及其对设计工具未来发展的看法。随着产品团队规模扩大,设计为了在工程组织中证明自身价值,被推动向系统化发展,Figma 通过引入组件、样式、变量等原语实现这一目标,但其复杂性导致设计系统管理变得繁琐,甚至需要专门角色来维护。

Figma 与代码之间关于“真理源”的争论由来已久。Figma 凭借其封闭且难以程序化处理的格式,虽然赢得了市场,但也因此未能被大语言模型有效学习,未来随着代码对设计的支持增强,设计的“真理源”将逐渐回归代码层面,Figma 复杂的系统将显得过于繁琐和不合理。

作者指出,Figma 自身的设计系统文件极其复杂,变量和组件层层嵌套,调试困难,令人崩溃。未来设计工具将分化为两种形态:一种是像 Figma Make,继续以设计文件为核心,适合已经深度使用 Figma 体系的人;另一种则是像 Claude Design,基于 HTML 和 JavaScript,强调“材料的真实”,设计与代码无缝连接,减少摩擦。

此外,作者预测另一类工具将专注于纯探索和自由创作,不受系统限制,可能是支持手写笔的 iPad 应用或高保真合成工具,突破现有 CSS 效果的限制。

最后,作者对 Figma 和 Sketch 团队提出了建议,鼓励 Figma 吸纳更多人才,Sketch 则应大胆创新,增加更多高级视觉效果,提升竞争力。整体来看,Figma 正面临类似 Sketch 曾经经历的转折点,设计工具的未来将更加多样和开放。


HN 热度 360 points | 评论 234 comments | 作者:cdrnsf | 1 day ago #

https://news.ycombinator.com/item?id=47818700

  • Claude Design 目前更像是一个玩具,使用限制较大,实际应用受限。
  • AI 设计工具输出的设计往往同质化严重,导致设计风格趋于雷同。
  • 设计同质化有利于用户界面的可预测性和一致性。
  • 现代设计缺乏个性,用户体验变得杂乱无章。
  • 设计师不再严格遵循平台指南,更多追求品牌识别。
  • 过去软件界面一致性更多是因为技术限制,而非设计师的自觉。
  • 过去的软件界面虽然有个性,但按钮等交互元素识别更清晰。
  • 品牌频繁更换包装设计反而让消费者难以识别和找到熟悉产品。
  • 品牌和产品经理推动设计变化,用户体验设计师通常对此持保留态度。
  • 视觉美观常常胜过实用性,导致“看起来漂亮”优先于“易用”。
  • 同质化设计在大型公司产品中不适用,缺乏辨识度会带来问题。
  • 好设计应当具有辨识度,避免所有产品看起来千篇一律。
  • 艺术品需要多样性,工具和软件界面则更需要一致性和功能性。
  • 好设计应以功能为先,而非单纯追求独特外观。
  • 品牌通过独特设计获得市场识别和营销优势。
  • 如果同质化意味着减少品牌过度追求,部分用户愿意接受。
  • 好设计应直观易用,能让用户自然学习和适应。
  • 设计应兼顾用户的不同背景和需求,注重可发现性和易用性。
  • 希望界面在保持一致性的同时,偶尔能有创新设计出现。

6. 交易者在伊朗战争中精准押注,下注金额超过 10 亿美元 (Traders placed over $1B in perfectly timed bets on the Iran war) #

https://www.theguardian.com/world/2026/apr/18/iran-war-bets-ethics-concerns

本文报道了在美以对伊朗战争期间,在线博彩市场如 Polymarket 和 Kalshi 出现了大量精准押注,涉及战争重大事件的时间点,导致巨额盈利,引发立法者和专家对内幕交易的担忧。文章指出,这些在线博彩市场已从传统体育赛事扩展到新闻事件,甚至商品期货交易,使得利用内幕信息获利的风险大大增加。

具体案例包括:2 月 27 日美以空袭伊朗前夜,约 150 个账户在 Polymarket 上押注空袭发生,累计投注达 85.5 万美元,其中 16 个账户各获利超过 10 万美元;随后一名匿名用户“Magamyman”在伊朗最高领袖哈梅内伊被以色列空袭刺杀前下注其将被“移除”,获利超过 55 万美元;4 月 7 日特朗普宣布临时停火前,至少 50 个账户押注停火,紧接着油价下跌,相关交易额高达 9.5 亿美元。

此外,油期货市场也出现类似异常交易,3 月 23 日和 4 月 7 日,交易者在特朗普发布与伊朗谈判进展消息前 15 分钟内大量买入,随后油价大幅下跌,带来丰厚回报。专家认为这些交易时间和金额异常,极可能涉及内幕信息。

监管方面,美国商品期货交易委员会(CFTC)正面临执法能力和立法缺失的挑战。CFTC 目前仅有一名委员,且其对预测市场持友好态度。各州政府对在线博彩市场的监管权存在争议,部分州对 Kalshi 提起诉讼,指控其无牌经营。CFTC 已秘密调查部分涉嫌内幕交易的油期货交易,但尚未公开确认。

总体来看,在线预测市场正处于“西部荒野”阶段,监管滞后,内幕交易风险突出,相关机构和立法者正寻求加强监管和执法力度,以防止市场被操纵。


HN 热度 340 points | 评论 230 comments | 作者:trocado | 1 day ago #

https://news.ycombinator.com/item?id=47818305

  • 预测市场虽然能提供信息,但让权力接近者利用内部信息获利,可能带来社会危害,削弱普通劳动者的积极性。
  • 非内部人士参与预测市场风险大,容易被“宰”,类似赌博,可能导致赌博成瘾问题。
  • 预测市场中的内部交易被视为不道德,破坏了市场的公平性,使非内部人士处于劣势。
  • 预测市场的价值在于能够反映最准确的信息,内部人士的参与有助于信息的传递和市场的准确性。
  • 禁止内部人士参与预测市场可能导致信息不对称,降低市场的预测效果。
  • 预测市场与金融市场不同,金融市场禁止内部交易是为了保护资本参与,而预测市场允许内部交易是为了获得更准确信息。
  • 预测市场可能成为腐败的工具,尤其当政策制定者利用其进行投机时,需对参与者设限。
  • 预测市场不仅用于预测未来,也可用于对冲风险,参与者可能基于风险管理而非单纯预测下注。
  • 预测市场公开化使得原本私下的信息不对称变得透明,有助于社会整体获取信息。
  • 预测市场的准确性在某些重大事件和选举预测中优于专家和评论员,具有一定参考价值。

7. Notion 泄露任何公共页面所有编辑者的电子邮件地址 (Notion leaks email addresses of all editors of any public page) #

https://twitter.com/weezerOSINT/status/2045849358462222720

一位用户在社交平台 X(前身为 Twitter)上发布了关于 Notion 的严重安全漏洞的警告。他指出,所有公共的 Notion 页面都在泄露每位编辑者的电子邮件地址,且这一过程没有任何身份验证、Cookies 或令牌。用户只需发送一个 POST 请求,就能获取页面上每位编辑者的全名、电子邮件和个人资料照片。

该用户提醒,如果某公司的维基页面是公开的,那么该公司的每位员工的电子邮件都有可能被曝光。他提到这一问题早在 2022 年就已被报告,但到 2026 年仍然存在,表明 Notion 在处理这一安全隐患方面没有取得进展。这引发了他对在线安全和数据保护的质疑。


HN 热度 309 points | 评论 106 comments | 作者:Tiberium | 8 hours ago #

https://news.ycombinator.com/item?id=47824945

  • Notion 公开页面会泄露所有编辑者的邮箱地址,且官方文档中已有说明,但警告不够明确。
  • 该问题被认为非常严重且不合理,泄露个人信息的设计令人难以接受。
  • 修复该问题并非简单操作,可能涉及遗留代码和功能依赖,避免破坏其他功能是难点。
  • 有观点认为这是渲染时的元数据问题,理论上可以通过判断公开状态来过滤个人信息。
  • Notion 官方表示正在考虑通过移除个人信息或使用邮箱代理等方式解决该问题。
  • 目前的用户警告措辞含糊,未能明确告知编辑者邮箱会被公开。
  • 该问题已被报告多年,用户对未及时修复表示失望和质疑。
  • 有人指出类似 CMS 系统的 RSS 订阅也存在类似信息泄露问题。
  • Notion 的性能问题(如 Firefox 浏览器上的速度慢)也被用户提及。
  • 有评论认为 Notion 的学习曲线较长,虽然对部分用户有帮助,但对团队整体效率提升有限。

8. 七大编程原语言(2022) (The seven programming ur-languages (2022)) #

https://madhadron.com/programming/seven_ur_languages.html

这篇文章讨论了编程语言的根本分类,称之为“七大编程原语言(ur-languages)”,并指出学习编程语言时理解这些根本语言的基本模式比纠结具体语言更重要。作者列出了七种原语言:ALGOL、Lisp、ML、Self、Forth、APL 和 Prolog。

ALGOL 类语言以顺序执行的赋值、条件和循环为特点,许多主流语言如 C、Java、Python 等都源自此类。它是最古老的原语言,起源于早期计算机编程历史。

Lisp 语言以前缀表达式和列表结构为核心,支持宏系统,允许程序员重新定义语言语义。它起源于数学表达式的自我求值问题,是第二古老的语言,曾在人工智能领域广泛使用。

ML 类语言强调函数作为第一类值,采用 Hindley-Milner 类型系统,所有迭代通过递归实现。该类语言包括 Standard ML、OCaml、Haskell 等,起源于定理证明工具的元语言。

Self 语言是一种面向对象语言,程序由对象组成,通过消息传递实现行为,条件和循环通过对象消息机制实现,体现了纯粹的对象模型。

文章还提到其他原语言,但内容未完全展开。总体来看,作者强调理解这些原语言的基本模式和思维方式,有助于更容易地学习和掌握各种具体编程语言。


HN 热度 267 points | 评论 101 comments | 作者:helloplanets | 16 hours ago #

https://news.ycombinator.com/item?id=47822486

  • 在图灵奖课程中曾实现过前四种编程范式的简化版本,Prolog 部分被删减但代码仍可在 GitHub 找到。
  • 不同语言在并行计算性能测试中表现接近,F#因其.NET Core 的成熟并行支持表现最好,C++ 和 Rust 也表现优异,但跨语言性能比较因并行策略差异较难直接对比。
  • Ruby 是纯面向对象语言,灵感来自 Smalltalk,所有内容都是对象,方法调用即消息传递,区别于 Algol 系语言如 Python。
  • Python 自引入新式类后也成为纯面向对象语言,所有基本类型均为对象,支持面向对象特性。
  • 面向对象的定义存在模糊,有人认为仅有方法并不构成面向对象,OOP 应包含工厂、继承等抽象机制,且可以用非面向对象风格编写 Python 代码。
  • 指出 Python 虽底层是面向对象,但用户可选择不使用 OOP 风格,且有些人误以为 Python 不是面向对象语言。
  • 面向对象是一种编程风格,不应简单以语言特性划分语言类别,类似于观察两个地方气候相似但本质不同。
  • 语言比较中还应考虑表达证明的语言类别,这类语言用于形式化证明表达。

9. 航空公司员工因在 WhatsApp 群组分享炸弹爆炸照片被逮捕 (Airline worker arrested after sharing photos of bomb damage in WhatsApp group) #

https://www.lbc.co.uk/article/dubai-police-spied-private-whatsapp-5HjdXwr_2/

该网页报道了一名航空公司员工因在私人 WhatsApp 群组中分享中东冲突引发的炸弹爆炸照片,被迪拜警方逮捕的事件。警方通过电子监控手段进入该私人群聊,获取证据后诱导该员工赴会面地点并实施逮捕。该员工面临包括发布被视为危害国家利益信息的指控,最高刑期为两年,目前仍被拘留。

报道指出,迪拜警方确认他们具备监控私人 WhatsApp 消息的能力,利用电子监控技术追踪、识别并逮捕用户,即使这些信息只在私密群组内交换。伦敦维权组织“被拘留在迪拜”首席执行官 Radha Stirling 呼吁 WhatsApp 等公司对用户隐私保护进行回应,强调如果私密通讯被政府监控并作为逮捕依据,全球用户需了解其数据如何被访问。

文章还提到,阿联酋政府控股的电信公司 Etisalat 和 Du 使安全部门能够监控其网络上的所有通讯。此外,阿联酋还使用以色列开发的 Pegasus 间谍软件,该软件能在用户未主动操作的情况下感染设备,监听通话并读取加密消息。多名游客、航空员工和居民曾因发送、接收或保存相关内容而被拘留。

整体报道揭示了迪拜在国家安全名义下对私人通讯的严密监控及其对个人自由的影响,引发了对隐私权和言论自由的担忧。


HN 热度 235 points | 评论 153 comments | 作者:aa_is_op | 11 hours ago #

https://news.ycombinator.com/item?id=47824068

  • 公开分享炸弹损毁照片在很多国家被视为公共利益,有助于安全改进,但在阿联酋被视为危害国家利益而被逮捕。
  • 阿联酋缺乏自我进步的文化,依赖外部知识,缺少内部对话和改进机制。
  • 在战争或冲突状态下,限制言论和信息传播是常见做法,目的是防止敌方获取情报和避免资本外逃。
  • 乌克兰和阿联酋的审查制度都具有双重目的:防止敌方评估打击效果,同时避免国内外投资者和公众恐慌。
  • 乌克兰希望通过信息控制获得更多国际支持,而阿联酋则希望保持经济和旅游业的稳定。
  • 许多无人机配备摄像头,敌方通常能够掌握打击位置,因此信息封锁更多是为了控制公众舆论和投资者信心。
  • 欧洲大国支持乌克兰主要是为了防止俄罗斯进一步扩张,维护欧洲安全,而不完全关心乌克兰的胜负。
  • 信息封锁不仅是避免尴尬,更是防止公众恐慌和维护国家安全的手段。
  • 历史上战争时期的信息管控(如“Loose Lips Sink Ships”)是为了防止敌方获取战场情报和控制国内舆论,避免公众恐慌。

10. NASA 关闭旅行者 1 号仪器以延长航天器运行寿命 (NASA Shuts Off Instrument on Voyager 1 to Keep Spacecraft Operating) #

https://science.nasa.gov/blogs/voyager/2026/04/17/nasa-shuts-off-instrument-on-voyager-1-to-keep-spacecraft-operating/

这篇文章报道了 2026 年 4 月 17 日,美国宇航局(NASA)喷气推进实验室(JPL)工程师远程关闭了“旅行者 1 号”探测器上的低能带电粒子实验仪(LECP),以延长这艘核动力航天器的运行寿命。LECP 自 1977 年旅行者 1 号发射以来几乎持续工作了近 49 年,主要用于测量来自太阳系和银河系的低能带电粒子,包括离子、电子和宇宙射线,提供了关于星际介质结构的重要数据。

由于旅行者 1 号依靠放射性同位素热电发生器供电,每年电力输出减少约 4 瓦,随着时间推移,电力储备变得非常紧张。为了避免探测器因电力不足而自动关闭保护系统,工程师们不得不关闭部分仪器以节省能量,同时确保探测器不会因温度过低导致燃料管线冻结。

此次关闭 LECP 是权衡后的最佳选择,旅行者 1 号仍有两个科学仪器在运行,分别用于监听等离子波和测量磁场,继续从人类从未涉足的星际空间区域传回数据。NASA 团队将继续努力,尽可能延长旅行者探测器的工作时间,保持对星际空间的探索。


HN 热度 221 points | 评论 107 comments | 作者:sohkamyung | 24 hours ago #

https://news.ycombinator.com/item?id=47820531

  • 亲历者分享了亲自听取 Voyager 项目科学家 Ed Stone 讲述 Voyager 2 进入星际空间的激动时刻,体现了项目近 50 年的热情和意义。
  • 有观点认为 Voyager 进入星际空间的消息被过度炒作,媒体频繁发布类似报道但解释不足。
  • 过去科学界对 Voyager 是否真正离开太阳系曾多次反复,导致公众产生“狼来了”的感觉。
  • 目前除了 New Horizons 外,没有其他深空探测器在运行,近 50 年只有一个新深空探测器发射,显得进展缓慢。
  • New Horizons 飞越冥王星的时间跨度长,且发射时间距今已久,反映出深空探测任务的时间尺度巨大。
  • 由于距离和速度限制,深空探测器很难在有生之年达到更多有趣目标,飞越冥王星已属不易。
  • 利用太阳作为引力透镜进行系外行星观测的设想需要探测器达到约 550 天文单位,目前技术尚难实现。
  • Voyager 探测器距离不到 200 天文单位且逐渐失效,制造能长期运行到 550 天文单位的探测器需重大技术突破。
  • 观测日球层不同位置的边界(如尾部)仍有科学价值,目前 Voyager 和 New Horizons 都主要朝向日球层前缘。
  • 现在发射深空探测器的条件不如当年 Voyager 发射时理想,错过了罕见的行星排列窗口。
  • 依赖行星排列发射任务会导致任务周期过长,应该尝试开发新型推进技术如光帆和核推进。
  • 重返月球的计划被质疑是重复过去的成就,缺乏新发现和创新意义。
  • 实际上月球上发现了大量水资源和地下熔岩管等新目标,月球探索仍有丰富科学和应用价值。
  • 阿尔忒弥斯计划是新一代航天器的测试和准备阶段,旨在为未来更大规模任务积累经验。

Hacker News 精彩评论及翻译 #

College instructor turns to typewriters to curb AI… #

https://news.ycombinator.com/item?id=47819796

When I did my Computer Science degree the vast majority of courses were 50% final, 30% midterm - even programming exams were hand written, proctored by TAs in class or in the gymnasium - assignments/labs/projects were a small part of your grade but if you didn’t do them the likelihood you’d pass the term exams was pretty darn low.

We already had AI proof education.

throwatdem12311

当我读计算机科学学位时,大多数课程的成绩构成是期末占50%,期中占30%——即使是编程考试也是手写的,由助教在课堂或体育馆监督——作业、实验和项目只占成绩的一小部分,但如果你不做它们,通过学期考试的可能性非常低。

我们已经拥有了防AI的教育。


Game devs explain the tricks involved with letting… #

https://news.ycombinator.com/item?id=47824861

One of the fun features that I developed for Warcraft (the RTS) was to fade the screen to grayscale when the game is paused.

Since the game uses a 256 color palette, it was only necessary to update a few bytes of data (3x256) instead of redrawing the whole screen, so the effect was quick.

I also used this trick when the game stalled due to missing network packets from other players. Initially the game would still be responsive when no messages were received so that you could still interact and send commands. After a few seconds the game would go into paused state with grayscale screen to signify the player that things were stuck. Then several seconds after that a dialog box would show allowing a player to quit the game.

This was much less disruptive than displaying a dialog box immediately on network stall.

netcoyote

我为魔兽争霸(即时战略游戏)开发的一个有趣功能是当游戏暂停时,将屏幕变成灰度。

由于游戏使用的是256色调色板,只需更新少量字节的数据(3x256),而不必重绘整个屏幕,因此这种效果非常快。

当由于其他玩家丢失网络数据包导致游戏卡顿时,我也使用了这个技巧。刚开始当没有收到消息时,游戏仍然是响应的,你仍然可以互动和发出指令。几秒钟后,游戏进入暂停状态,屏幕变成灰度,提示玩家游戏卡住了。然后几秒钟后会弹出一个对话框,允许玩家退出游戏。

这样比在网络卡顿时立即弹出对话框要不那么令人不快。


Vercel April 2026 security incident #

https://news.ycombinator.com/item?id=47825592

I’ve been part of a response team on a security incident and I really feel for them. However, this initial communication is terrible.

Something happened, we won’t say what, but it was severe enough to notify law enforcement. What floors me is the only actionable advice is to “review environment variables”. What should a customer even do with that advice? Make sure the variable are still there? How would you know if any of them were exposed or leaked?

The advice should be to IMMEDIATELY rotate all passwords, access tokens, and any sensitive information shared with Vercel. And then begin to audit access logs, customer data, etc, for unusual activity.

The only reason to dramatically overpay for the hosting resources they provide is because you expect them to expertly manage security and stability.

I know there is a huge fog of uncertainly in the early stages of an incident, but it spooks me how intentionally vague they seem to be here about what happened and who has been impacted.

toddmorey

我曾参与过一次安全事件响应团队工作,真的很能理解他们的感受。然而,这次的初步通报非常糟糕。

事情发生了,但他们不说具体是什么,只说严重到需要通知执法部门。让我非常震惊的是,唯一可操作的建议竟然是“检查环境变量”。客户到底该怎么根据这个建议行动?确认环境变量还在?怎么判断有没有被泄露或曝光?

正确的建议应该是立即更换所有密码、访问令牌以及任何与Vercel共享的敏感信息。然后开始审计访问日志、客户数据等,查找异常活动。

客户之所以愿意高价支付他们的托管服务,就是因为期望他们能够专业地管理安全和稳定。

我知道事件早期阶段会有很多不确定因素,但他们在这里对发生了什么以及谁受影响的问题如此含糊其辞,反而让我感到不安。


Traders placed over $1B in perfectly timed bets on… #

https://news.ycombinator.com/item?id=47820129

Say whatever you want about the merits of prediction markets. But I just don’t see a way those benefits outweigh the societal dangers of these constant reminders that people in or close to power can freely profit from their positions in the ways the rest of the population can’t. There’s always talk about the dangers of disincentivizing job creators, but what happens when a society routinely disincentives job havers in this way? We’re just getting a constant barrage of information telling us that if we show up to our job and simply work as we’re expected that we’re stooges who won’t get ahead. You’ll need to look for your own individual scheme, ethics be damned, if you just want to keep up with the rest of the population. That’s not healthy on an individual level or cumulatively at a societal level.

slg

无论你怎么说预测市场的优点,我就是看不出这些好处能超过它带来的社会危险。因为这种不断提醒人们,处于权力中心或接近权力的人可以自由地利用他们的位置获利,而普通大众却做不到。这总是被拿来谈论的——担心会削弱“创造就业者”的积极性,但当一个社会经常以这种方式削弱“有工作者”的积极性时,会发生什么呢?我们不断被告知,如果你按要求去上班、按部就班地工作,你就是被利用的傀儡,无法取得进步。为了跟上别人,你必须另辟蹊径,甚至不顾道德。这对个人来说不健康,对整个社会来说累计起来也很有害。


NIST scientists create ‘any wavelength’ lasers #

https://news.ycombinator.com/item?id=47820262

Everyone talking about magenta and brown, but you can see an illusory color right now even without lasers! https://dynomight.net/colors/ behold, some kind of hyper-turquoise

adzm

大家都在讨论品红色和棕色,但即使没有激光,你现在也能看到一种错觉色!https://dynomight.net/colors/ 看啊,某种超级蓝绿色。


Why Japan has such good railways #

https://news.ycombinator.com/item?id=47816375

“Japan’s liberal land use regulation makes it straightforward to build new neighborhoods next to railway lines, giving commuters easy access to city centers. It also enables the densification of these centers, which means that commuters have more places they want to go.”

This is the most important paragraph in the article. It can’t be overstated how ingenious Japan’s system of zoning is and how much this has benefitted their society in ways we can only dream about here in the West.

ttul

“日本宽松的土地使用管制使得在铁路沿线建设新社区变得简便,为通勤者提供了便捷通达市中心的条件。它也促进了这些市中心的高密度发展,这意味着通勤者有更多想去的地方。”

这是文章中最重要的一段。日本的分区制度有多么巧妙,以及这对他们社会带来的益处,我们在西方只能梦想,绝不能被低估。


Game devs explain the tricks involved with letting… #

https://news.ycombinator.com/item?id=47822491

One of the things that impressed me in Quake (the first one) was the demo recording system. The system was deterministic enough that it could record your inputs/the game state and just play them back to get a gameplay video. Especially given that Quake had state of the art graphics at the time, and video playback on computers otherwise was a low-res, resource intensive affair at the time, it was way cool.

It always surprised me how few games had that feature - though a few important ones, like StarCraft, did - and it only became rarer over the years.

vintermann

《雷神之锤》(第一作)中让我印象深刻的一点是演示录制系统。该系统足够确定性,能够记录你的输入和游戏状态,然后通过回放来生成游戏视频。尤其是考虑到当时《雷神之锤》拥有最先进的图形效果,而计算机上播放视频通常是低分辨率且资源消耗大的事情,这一点非常酷。

令我惊讶的是,拥有这一功能的游戏竟然 so 少,虽然有几款重要的游戏,比如《星际争霸》,具备这个功能——而且随着时间推移,这种功能变得越来越罕见。


Migrating from DigitalOcean to Hetzner #

https://news.ycombinator.com/item?id=47815983

I moved two servers, one from Linode and the other from DO to Hetzner a few months ago, with similar savings. The best part was that the two servers had tens of different sites running, implemented in different languages, with obsolete libraries, MySQL and Redis instances. A total mess. Well: Claude Code migrated it all, sometimes rewriting parts when the libraries where no longer available. Today complex migrations are much simpler to perform, which, I believe, will increase the mobility across providers a lot.

antirez

几个月前,我将两台服务器从Linode和DO迁移到了Hetzner,节省了差不多的费用。最棒的是,这两台服务器上运行着几十个不同的网站,使用不同的编程语言,依赖过时的库,还有MySQL和Redis实例,整体一团糟。Claude Code帮我完成了所有迁移,有时还会在库不再可用时重写部分代码。如今复杂的迁移变得容易多了,我相信这将极大地提升跨服务商的流动性。


Migrating from DigitalOcean to Hetzner #

https://news.ycombinator.com/item?id=47818083

agents eat that glue

No wonder they hallucinate :)

grim_io

特工们吃了那种胶水

难怪他们会产生幻觉 :)


Thoughts and feelings around Claude Design #

https://news.ycombinator.com/item?id=47819584

lol yes. At least in agency world, a common approach in the last X years has been that designers create entire pixel-perfect, component-based sources-of-truth in Figma (which evolve! they aren’t delivered static and complete) – these are also what the client sees and approves, or at the very least they see branded deck slides that incorporate the Figma designs. Anyways, front end then re-implements from Figma into CSS, except it’s usually best-approximation (not pixel-perfect) partially because, despite Figma allowing you to “copy CSS” for an element, it’s unusable, almost inline CSS (and usually not aware of its ascendents and descendents, or any variables you’re maintaining in CSS, or any class hierarchies, etc), and partially because the units of measurement aren’t always identical on either side. You’ll also often have multiple FE devs recreating components independently of each other (as a team effort), which can lead to drift and different implementations, which is fun. Then, depending upon the tech stack, FE might be building these components in something like Storybook [0] as a “front end source of truth”, which then are either directly injected into a React or NextJS app or whatever, or sometimes they’re partially or fully re-implemented again into BE components in the CMS (ex. Sitefinity). Then people ask which one is the source of truth, but really it’s a chain of sources of truth that looks more like the telephone game than a canonical “brand bible”. Then throw in any out-of-the-box future client efforts (say, a promotional landing page hosted outside of the main project) and you may have yet another reimplementation of part of the same design, but in a completely different system.

[0] https://storybook.js.org

kevinsync

哈哈,是的。至少在广告公司行业,过去几年常见的做法是设计师们会在Figma中创建完整的像素级精确、基于组件的“唯一真实源”(source-of-truth)(并且是不断演变的!它们不是静态且完整交付的)——客户看到并批准的也是这些设计,或者至少他们会看到包含Figma设计的品牌演示幻灯片。前端开发再从Figma中将设计转换成CSS,不过通常是近似最佳的实现(而不是完全像素级精确),部分原因是尽管Figma允许你“复制CSS”给某个元素,但这些CSS几乎相当于内联样式,基本不可用(而且通常不会考虑其父级和子级元素,或者你在CSS中维护的变量,或任何类的层级结构等),另一方面则是因为两端的单位测量不一定完全一致。你还经常会有多个前端开发人员在团队协作下独立重建组件,这可能会导致设计和实现的偏差,这挺有趣的。然后,根据技术栈,前端可能会在类似Storybook这样的工具中构建这些组件作为“前端唯一真实源”,这些组件随后要么直接注入到React或NextJS等应用中,要么有时会被部分或全部再次重新实现到内容管理系统(CMS)中的后端组件(例如Sitefinity)。然后大家会问哪个才是真正的“唯一真实源”,但实际上这是一个多层“唯一真实源”的链条,更像是传话游戏,而不是真正权威的“品牌圣经”。再加上以后任何现成的客户项目(比如一个托管于主项目外的促销落地页),你可能会看到同一设计的又一次重实现,但完全是在另一个系统里。


Airline worker arrested after sharing photos of bo… #

https://news.ycombinator.com/item?id=47824272

publishing information deemed harmful to state interests

Is the charge, which I think kind of speaks for itself. Full on: “You embarrassed us, straight to jail.”

In most of the world such photos would be deemed of public interest and shared by the media then we’d reflect on if our routing is safe/correct and make proportional changes for safety. Not a big deal, nobody is fired, life moves on.

I feel like actions like this are going to hurt the UAE themselves, because how can you improve if there is no dialog? No information to even start a dialog? A lot of hard conversations are NOT going to be had because I guess it is a state secret?

Someone1234

发布被认为有害于国家利益的信息

这是指控的内容,我觉得这本身就很明白。完全的意思是:“你让我们丢脸了,直接进监狱。”

在世界大多数地方,这样的照片会被认为是公共利益相关,媒体会分享,然后我们会反思我们的路线是否安全/正确,并做出相应的安全调整。这没什么大不了的,没有人被解雇,生活照旧。

我觉得这样的做法反而会伤害阿联酋自己,因为如果没有对话,怎么可能改进呢?连开始对话的信息都没有?很多艰难的讨论根本不会发生,因为我猜那是国家机密?


Airline worker arrested after sharing photos of bo… #

https://news.ycombinator.com/item?id=47824358

how can you improve if there is no dialog

The UAE doesn’t have a self-advancement culture, it’s a capital-backed monarchy that imports pretty much all of its research and production; in other words it piggy-backs on the knowledge produced in other societies. There is no advancement through dialog in the country itself.

tremon

如果没有对话,你怎么能进步呢?

阿联酋没有自我提升的文化,它是一个由资本支持的君主制国家,几乎所有的研究和生产都依赖进口;换句话说,它是借助其他社会产生的知识发展起来的。这个国家内部没有通过对话实现进步。


Anonymous request-token comparisons from Opus 4.6 … #

https://news.ycombinator.com/item?id=47818333

For a fair comparison you need to look at the total cost, because 4.7 produces significantly fewer output tokens than 4.6, and seems to cost significantly less on the reasoning side as well.

Here is a comparison for 4.5, 4.6 and 4.7 (Output Tokens section):

https://artificialanalysis.ai/?models=claude-opus-4-7%2Cclaude-opus-4-6-adaptive%2Cclaude-opus-4-5-thinking

4.7 comes out slightly cheaper than 4.6. But 4.5 is about half the cost:

https://artificialanalysis.ai/?models=claude-opus-4-7%2Cclaude-opus-4-6-adaptive%2Cclaude-opus-4-5-thinking#cost

Notably the cost of reasoning has been cut almost in half from 4.6 to 4.7.

I’m not sure what that looks like for most people’s workloads, i.e. what the cost breakdown looks like for Claude Code. I expect it’s heavy on both input and reasoning, so I don’t know how that balances out, now that input is more expensive and reasoning is cheaper.

On reasoning-heavy tasks, it might be cheaper. On tasks which don’t require much reasoning, it’s probably more expensive. (But for those, I would use Codex anyway ;)

andai

为了公平比较,你需要关注总成本,因为4.7产生的输出标记明显少于4.6,并且推理部分的成本似乎也显著更低。

这里是4.5、4.6和4.7的比较(输出标记部分):

https://artificialanalysis.ai/?models=claude-opus-4-7%2Cclaude-opus-4-6-adaptive%2Cclaude-opus-4-5-thinking

4.7的成本略低于4.6。但4.5的成本大约只有一半:

https://artificialanalysis.ai/?models=claude-opus-4-7%2Cclaude-opus-4-6-adaptive%2Cclaude-opus-4-5-thinking#cost

值得注意的是,推理成本从4.6到4.7几乎减少了一半。

我不确定对于大多数人的工作负载来说这意味着什么,比如Claude Code的成本构成如何。我预计它在输入和推理两方面的成本都较重,所以现在输入成本变高而推理成本下降,不知道整体平衡如何。

对于推理密集型任务来说,可能会更便宜。对于不需要太多推理的任务,可能会更贵。(不过对于那些任务,我无论如何都会使用Codex;)


Archive of BYTE magazine, starting with issue #1 i… #

https://news.ycombinator.com/item?id=47823550

From 1988-91, I was a volunteer teacher in Africa. I lived in a hut without running water or electricity, and I had a subscription to Byte.

There was also almost nothing to read, so when my monthly issue of Byte appeared (2-3 months later than most people would receive it), I devoured that thing. I would read it literally cover to cover, including all those ads, several times.

I wasn’t (then) working in IT, so a lot of the content (like Steve Ciarcia’s Circuit Cellar) went way over my head but it didn’t matter, I read it anyway, often by the light of my kerosene lantern. I learned a huge amount: object-oriented programming, this new thing called the Internet (capitalized back then, and before the WWW), and how Jerry Pournelle was a self-important jerk (but boy, did I envy the toys he got to play with!).

This was the age of big, fold-out Gateway 2000 ads, 20MB hard drives, and Turbo Pascal kicking other compilers’ butts.

I would read the magazine, then write out programs (in BASIC, the only language I had learned at that point). On my monthly trips to the capital city I would go to a local NGO and in exchange for helping with their IT issues they would let me play (i.e type out my programs and try to get them working) on their computers.

gramie

1988年至1991年间,我在非洲做志愿教师。我住在没有自来水和电的茅屋里,订阅了一份Byte杂志。

几乎没有什么东西可读,所以当我每月的Byte杂志(比大多数人晚两三个月才收到)到来时,我如饥似渴地读它。我几乎会从头到尾读,包括所有广告,而且不止一次。

那时我还没从事IT工作,所以很多内容(比如Steve Ciarcia的Circuit Cellar)我都听不懂,但没关系,我还是读了,常常是在煤油灯的灯光下。我学到了很多东西:面向对象编程,这个后来被称为互联网的新事物(当时还是大写的,而且还没有WWW),还有Jerry Pournelle是个自以为是的混蛋(不过,我真羡慕他能玩到那些“玩具”!)。

那是大型折叠式Gateway 2000广告盛行的时代,20MB的硬盘,以及Turbo Pascal横扫其他编译器的年代。

我会读杂志,然后用BASIC写程序(这是我当时唯一学过的语言)。每个月我去首都的时候会到一家当地的非政府组织,帮他们解决IT问题,作为交换,他们允许我使用他们的电脑(也就是把程序打出来并尝试让它们运行)。


Thoughts and feelings around Claude Design #

https://news.ycombinator.com/item?id=47819716

I used it today to take a look at my previously built design system with Logos, branding, fonts, and everything else. After a lot of annoying tweaking back and forth, finally, I got something that was satisfactory.

Then I looked at the usage and it said I had used 95% of my Claude design usage for the week!

This isn’t a real tool. This is a plaything, if that’s what they’re providing as examples.

mickdarling

我今天用它查看了我之前建立的设计系统,包括标志、品牌、字体以及其他所有内容。经过反复烦人的调整,最后我得到了一个满意的结果。

然后我查看使用情况,发现我这周已经使用了95%的Claude设计额度!

这不是真正的工具。如果他们提供的例子就是这样,那这更像是个玩具。


Game devs explain the tricks involved with letting… #

https://news.ycombinator.com/item?id=47822869

It wasn’t really that much to do with determinism. Quake uses a client-server network model all the time, even when you’re only playing a local single-player game. What the demo recording system does is capture all of the network packets that are being sent from the server to the client. When playing back a demo, all the game has to do is run a client and replay the packets that it originally received from the server. It’s a very elegant system that naturally flows out of the rather forward-looking decision to build the entire engine around a robust networking model.

ndepoel

这其实和确定性关系不大。《雷神之锤》一直使用客户端-服务器网络模型,即使你只是玩本地单人游戏。演示录像系统所做的就是捕捉服务器发送给客户端的所有网络数据包。在回放演示时,游戏只需运行一个客户端并重放它最初从服务器接收到的数据包。这是一个非常优雅的系统,自然而然地体现了当初围绕一个强大的网络模型构建整个引擎的前瞻性决策。


Dad brains: How fatherhood rewires the male mind #

https://news.ycombinator.com/item?id=47820811

And the men that had spent longer looking after babies showed the largest drops in testosterone. Those that shared a bed with their infants also had lower levels.

Dad here. Maybe…it’s the lack of sleep? Involved fathers tend to have less sleep.

syntaxing

那些花更多时间照顾婴儿的男性,睾酮水平下降得最大。和婴儿同床的那些男性睾酮水平也较低。

作为一个爸爸,可能是……缺乏睡眠的原因?积极参与育儿的父亲通常睡眠时间较少。


Anonymous request-token comparisons from Opus 4.6 … #

https://news.ycombinator.com/item?id=47817640

we don’t want a hard dependency on another multi-billion dollar company just to write software

One of two main reasons why I’m wary of LLMs. The other is fear of skill atrophy. These two problems compound. Skill atrophy is less bad if the replacement for the previous skill does not depend on a potentially less-than-friendly party.

ahartmetz

我们不希望为了编写软件而不得不强依赖另一家市值数十亿美元的大公司。

这是我对大型语言模型持谨慎态度的两个主要原因之一。另一个原因是害怕技能退化。这两个问题相互叠加。如果新技能的替代不依赖于可能不太友好的第三方,技能退化的问题就没那么严重。


A simplified model of Fil-C #

https://news.ycombinator.com/item?id=47811597

So, a few things, some of which others have touched on:

  1. Fil-C is slower and bigger. Noticeably so. If you were OK with slower and bigger then the rewrite you should have considered wasn’t to Rust in the last ten years but to Java or C# much earlier. That doesn’t invalidate Fil’C’s existence, but I want to point that out.

  2. You’re still writing C. If the program is finished or just occasionally doing a little bit of maintenance that’s fine. I wrote C for most of my career, it’s not a miserable language, and you are avoiding a rewrite. But if you’re writing much new code Rust is just so much nicer. I stopped writing any C when I learned Rust.

  3. This is runtime safety and you might need more. Rust gives you a bit more, often you can express at compile time things Fil-C would only have checked at runtime, but you might need everything and languages like WUFFS deliver that. WUFFS doesn’t have runtime checks. It has proved to its satisfaction during compilation that your code is safe, so it can be executed at runtime in absolute safety. Your code might be wrong. Maybe your WUFFS GIF flipper actually makes frog GIFs purple instead of flipping them. But it can’t crash, or execute x86 machine code hidden in the GIF, or whatever, that’s the whole point.

tialaramex

所以,有几点想说,其中一些别人也提到了:

  1. Fil-C 更慢且体积更大,非常明显。如果你能接受更慢更大的话,那么你在过去十年考虑重写的对象,应该不是 Rust,而是更早的 Java 或 C#。这并不否定 Fil-C 的存在价值,但我想指出这一点。

  2. 你仍然在写 C 语言。如果程序已经完成或只是偶尔做一点维护,那没问题。我职业生涯中大部分时间都写 C,它并不是一门糟糕的语言,而且你也避免了重写。但如果你写很多新代码,Rust 会好得多。我学会 Rust 后就不再写任何 C 了。

  3. 这是关于运行时安全的问题,而你可能需要更多。Rust 提供了更多的安全保障,很多事情可以在编译时表达,而 Fil-C 只能在运行时检查,但你可能需要所有这些保障,像 WUFFS 这样的语言就能做到。WUFFS 没有运行时检查。它在编译期间证明了你的代码是安全的,因此运行时可以绝对安全地执行。你的代码可能有错。也许你的 WUFFS GIF 翻转器实际上是让青蛙 GIF 变成紫色而不是翻转它们。但它不会崩溃,也不会执行 GIF 中隐藏的 x86 机器码,这才是关键。


Vercel April 2026 security incident #

https://news.ycombinator.com/item?id=47825660

Seriously. Why am I reading about this here and not via an email? I’ve been a paying customer for over a year now. My online news aggregator informs me before the actual company itself does?

birdsongs

说真的,为什么我要在这里看到这些信息,而不是通过电子邮件收到通知?我已经是付费用户一年多了。连我用的在线新闻聚合器都比公司官方先告诉我消息?


Slop Cop #

https://news.ycombinator.com/item?id=47811870

Like the original Grammarly, I think this can be useful for business writing because these tools help you get to the point. Many students are rewarded for using flowery language in school essays, but if you’re composing an email or writing a design doc, just optimize for reading time and clarity.

But for general use, I think this is misguided. The problem with LLM output is not that it’s using em dashes or words such as “crucial”. It’s that most LLM articles on LinkedIn or on personal blogs just take a one-sentence prompt and dress it up into a lot of pointless words, wasting everyone’s time: “I had a shower thought and I asked a chatbot to write five pages of text about it.” I don’t need prettier words, I need there to be far fewer of them?

On the flip side, if you’re a human and actually have something of consequence to say, “delve” all you want.

chromacity

像原版的Grammarly一样,我认为这对商务写作很有用,因为这些工具帮助你直截了当地表达观点。许多学生在学校作文中因为使用华丽的语言而获得好评,但如果你是在写电子邮件或设计文档,最好还是优化阅读时间和清晰度。

但在一般使用上,我觉得这是误入歧途。大语言模型生成内容的问题不在于它用了破折号或“关键”这样的词,而是大多数大语言模型在LinkedIn或个人博客上的文章,只是根据一句话的提示堆砌了许多无意义的赘词,浪费大家的时间:“我有个灵感,于是让聊天机器人写了五页文字。”我不需要更漂亮的词汇,我需要的是用词更少。

另一方面,如果你是真正有人生要事要说的人,想“深入探讨”尽管去吧。


It’s OK to compare floating-points for equality #

https://news.ycombinator.com/item?id=47815349

This explanation is relatively reductive when it comes to its criticism of computational geometry.

The thing with computational geometry is, that its usually someone else’s geometry , i.e you have no control over its quality or intention. In other words, whether two points or planes or lines actually align or align within 1e-4 is no longer really mathematically interesting because its all about the intention of the user : does the user think these planes overlap?.

This is why most geometry kernels (see open cascade) sport things like “fuzzy boolean operations” [0]) that lean into epsilons. These epsilons mask the error-prone supply chain of these meshes that arrive in your program by allowing some tolerance.

Finally, the remark “There are many ways of solving this problem” is also overly reductive, everyone reading here should really understand that this is a topic that is being actively researched right now in 2026 , hence there are currently no blessed solutions to this problem, otherwise this research would not be needed. Even more so, to some extent this problem is fundamentally unsolvable depending on what you mean by “solvable”, because your input is inexact not all geometrical operations are topologically valid, hence an “exact” or let alone “correct along some dimension” result cannot be achieved for all (combination of) inputs.

[0] https://dev.opencascade.org/content/fuzzy-boolean-operations

vouwfietsman

对于计算几何的批评,这个解释较为简化。

计算几何的问题在于,几何通常是别人的,也就是说你无法控制其质量或意图。换句话说,两个点、平面或直线是否真的对齐,或者在1e-4的误差范围内对齐,已经不再是纯粹的数学兴趣点,因为这完全取决于用户的意图:用户是否认为这些平面是重叠的?

这也是为什么大多数几何核(参见Open Cascade)采用诸如“模糊布尔运算”[0]之类的方法,依赖于一定的容差。这些容差掩盖了由于网格数据来源复杂导致的误差,通过允许一定的容忍度来解决这个问题。

最后,提到“有很多解决该问题的方法”也过于简化,阅读这里的每个人都应清楚,2026年这个话题仍在积极研究中,因此目前并不存在公认的最终解决方案,否则根本无需继续研究。更重要的是,从某种程度上讲,这个问题本质上是无法完全解决的,这取决于你对“解决”一词的定义,因为输入本身并不精确,并非所有几何操作在拓扑上都是有效的,因此无法对所有(组合)输入得到“精确的”或至少“在某个维度上正确的”结果。

[0] https://dev.opencascade.org/content/fuzzy-boolean-operations


2026 04 19 HackerNews

2026-04-19 08:41:31

2026-04-19 Hacker News Top Stories #

  1. 作者将多服务从 DigitalOcean 迁至 Hetzner,大幅降本并提速,按降 TTL、rsync、MySQL 复制与反代切换等步骤实现零停机并完成 CentOS7→AlmaLinux 9.7 升级。
  2. smolvm 提供亚秒级冷启动、单文件打包与默认隔离网络的便携虚拟机,旨在以类容器易用性取代 Docker,并关注 k3s 与未来直播迁移等能力。
  3. 月球尘埃极细尖锐且与氧接触迅速反应散发似火药气味,致“月球花粉症”等刺激风险,未来任务需更强过滤、密封与除尘。
  4. 社区对比显示升级至 Opus 4.7 后平均请求体积与成本统计上升约三成,同时强制自适应思考让输出更短引发质量争议且无法关闭。
  5. Kdenlive 2025 年多次更新并规划 26.04 功能,用户称其功能强与门槛低但稳定性受质疑,部分更偏好更简洁且略稳的 Shotcut。
  6. 日本铁路的领先源于企业结构与土地/交通政策协同(含私铁“轨道+地产”模式),并以严禁路边停车和购车需车位证明等制度支撑高密度公共出行。
  7. 该区间计算器以不相交区间并集进行运算并采用全精度向外舍入,能正确处理含零除法与函数逆等传统区间算术难题。
  8. iTerm2 因 SSH 集成误信终端转义致本地命令被拼接执行,甚至“cat readme.txt”即可触发 RCE,补丁未入稳定版提醒谨慎查看不受信文本。
  9. B-52 的星象跟踪仪采用机电角度计算机以齿轮、电机与同步器实现三角运算,将星历转为本地方位与高度以驱动自动锁星并输出导航定位。
  10. Amiga Graphics Archive 收藏展示 Amiga 图形与技术史料,并对 68000 系列“16/32 位”称谓与架构特性提供背景讨论。

1. 从 DigitalOcean 迁移到 Hetzner (Migrating from DigitalOcean to Hetzner) #

https://isayeter.com/posts/digitalocean-to-hetzner-migration/

这篇文章详细介绍了作者将服务器从 DigitalOcean 迁移到 Hetzner 的全过程,重点强调了迁移过程中实现零停机时间的策略和技术细节。作者因土耳其里拉贬值导致美元计价的基础设施费用大幅上涨,决定寻找性价比更高的服务器,最终选择了 Hetzner 的 AX162-R 服务器,月费用从 1432 美元降至 233 美元,每年节省约 1.4 万美元,同时硬件配置更强大。

迁移涉及的系统包括 30 个 MySQL 数据库(248GB 数据)、34 个 Nginx 虚拟主机、GitLab EE、Neo4j 图数据库、Supervisor 后台任务管理、Gearman 任务队列及多个活跃的移动应用。旧服务器运行 CentOS 7,迁移时升级到 AlmaLinux 9.7 以获得更好的安全支持。

迁移策略分为六个阶段:1)在新服务器上完整安装并配置所有服务,确保配置一致;2)使用 rsync 同步网站文件;3)通过 MySQL 主从复制实现数据库实时同步,避免停机;4)降低 DNS 记录 TTL,加快切换速度;5)将旧服务器的 Nginx 配置改为反向代理,保证 DNS 切换期间请求无中断;6)切换 DNS 指向新服务器,旧服务器保留一周后关闭。

数据库迁移是最复杂的部分,作者使用 mydumper/myloader 工具利用多线程并行导出导入,极大缩短了时间。迁移过程中遇到 MySQL 从 5.7 升级到 8.0 带来的 mysql.user 表结构不匹配问题,通过强制升级和删除 sys 数据库解决。设置复制时遇到重复键错误,表明数据导出分两步完成导致冲突,具体解决方案未详细说明。

整体迁移过程保证了服务持续可用,避免了传统迁移中常见的停机风险,且显著降低了成本,提高了性能。作者建议对于稳定运行的工作负载,考虑专用服务器替代云服务,以获得更优的价格性能比。


HN 热度 667 points | 评论 341 comments | 作者:yusufusta | 11 hours ago #

https://news.ycombinator.com/item?id=47815774

  • 迁移服务器时常用的方法包括降低 DNS TTL、使用 rsync 同步网站文件和证书、复制数据库、通过修改/etc/hosts 测试新服务器、关闭旧服务器的定时任务、将旧服务器的 Nginx 转换为反向代理等。
  • 复杂的服务器迁移变得更简单,部分原因是有工具可以重写或替代过时的库和服务,从而提高了跨服务商的流动性。
  • 许多系统依赖大量“胶水代码”,这些代码往往是专有且难以替换的,增加了迁移的难度。
  • 运行自己的专用实例(如 Kubernetes、Postgres 等)可以减少对云服务专有胶水的依赖,实现更灵活的架构。
  • 有些遗留系统因安全风险或复杂性而迟迟未迁移,导致旧服务仍在使用老旧环境。
  • 有观点质疑部分评论和帖子可能是由 AI 或相关公司进行的“水军”操作,目的是制造恐慌或炒作 AI 技术。
  • AI 在代码生成方面表现良好,适合写模板代码,但处理复杂逻辑时仍需人工复核和修正,当前 AI 技术尚无法完全覆盖复杂开发需求。
  • AI 技术的应用引发了行业内的担忧和转型,但也有人认为这种变化是不可避免且正在进行中的。

2. 展示 HN:Smol 机器——亚秒级冷启动的便携式虚拟机 (Show HN: Smol machines – subsecond coldstart, portable virtual machines) #

https://github.com/smol-machines/smolvm

该网页介绍了 smolvm,这是一个命令行工具,用于本地管理和运行定制的 Linux 虚拟机,具备亚秒级冷启动、跨平台支持(macOS 和 Linux)以及弹性内存使用等特点。用户可以将状态化虚拟机打包成单个文件(.smolmachine),实现跨平台的快速恢复。

主要功能包括:

  • 运行临时虚拟机执行命令,支持网络配置和交互式 Shell。
  • 通过硬件隔离的虚拟机沙箱运行不可信代码,默认关闭网络,防止代码外泄,支持网络访问白名单设置。
  • 打包成独立可执行文件,无需安装或运行时下载,启动速度快于 200 毫秒。
  • 持久化虚拟机支持开发环境,安装的软件包可在重启后保留。
  • 支持 SSH 代理转发,安全使用主机的 SSH 密钥,密钥不会进入虚拟机。
  • 使用简单的 TOML 格式 Smolfile 声明环境,实现虚拟机配置的可复现性。

安装方式包括通过脚本安装或从 GitHub Releases 下载。示例命令展示了如何运行命令、交互式使用虚拟机、限制网络访问、打包 Python 环境以及管理持久虚拟机等操作。该工具适合沙箱运行不可信代码、打包便携环境和安全开发等多种场景。


HN 热度 443 points | 评论 134 comments | 作者:binsquare | 1 day ago #

https://news.ycombinator.com/item?id=47808268

  • 该项目旨在用虚拟机替代 Docker 容器,实现类似容器的易用性和亚秒级启动时间。
  • 传统微型虚拟机通常不支持运行完整的 Kubernetes 集群,用户关心是否支持 k3s 等轻量级 Kubernetes。
  • 直播迁移(live migration)是类似系统中常被忽视但非常重要的功能,适用于需要不停机迁移的传统和长时运行工作负载。
  • 直播迁移技术复杂且难以实现,通常需要底层超管支持,目前开源项目可能在未来一年内逐步实现。
  • 直播迁移的典型应用场景包括主机维护时迁移数据库虚拟机、带缓存状态的 Web 应用迁移、长时间批处理任务迁移等。
  • 直播迁移需要考虑内存快照、存储同步和网络连接的短暂中断,用户需根据自身应用特点决定可接受的停机时间。
  • 目前 smolvm 支持停止虚拟机后打包迁移,磁盘文件可保留,但内存快照和无停机迁移仍有难度。
  • 直播迁移可以在无共享网络存储的情况下,通过复制所有磁盘数据实现。
  • 代码开发中约有 50% 由 AI 辅助完成,但核心功能仍需人工实现。

3. 所有 12 位登月者都患有“月球花粉症”,因为尘埃闻起来像火药(2018) (All 12 moonwalkers had “lunar hay fever” from dust smelling like gunpowder (2018)) #

https://www.esa.int/Science_Exploration/Human_and_Robotic_Exploration/The_toxic_side_of_the_Moon

该网页是欧洲航天局(ESA)官方网站的内容汇总页面,涵盖了 ESA 的组织介绍、成员国信息、科学探索、空间安全、应用项目以及技术支持等多个方面。

页面首先介绍了 ESA 作为欧洲通往太空的门户,致力于推动欧洲航天能力的发展,并确保航天投资惠及欧洲及全球公民。随后列出了 ESA 的 23 个成员国,展示了 ESA 与各国国家机构的合作。

在科学与探索板块,介绍了太阳系探索、空间科学、人类与机器人探测任务,以及著名航天员名单和多个重要航天任务,如 Juice、Euclid、Webb、Solar Orbiter 等。页面还包含最新的科学新闻和视频,如火星火山灰扩散、月球与地球的美景,以及国际空间站上的 3D 金属打印技术突破。

空间安全部分重点介绍了保护地球生命和轨道基础设施的措施,包括小行星防御、空间碎片管理、空间天气监测等。相关任务如 Hera 小行星探测和 Flyeye 自动小行星观测望远镜也有详细报道。

应用板块展示了利用航天技术服务地球的项目,如地球观测、气象、卫星导航(Galileo、EGNOS)、安全通信及商业化平台。最新动态包括卫星展示、云和气溶胶观测卫星 EarthCARE 的媒体邀请等。

技术支持与发展部分涵盖了航天器制造、测试中心、设计设施、先进概念团队以及航天运输系统(Ariane、Vega、Space Rider)等内容。页面还介绍了 ESA 的地面站、操作系统及最新的技术新闻和活动。

整体来看,该网页内容丰富,涵盖 ESA 的组织结构、成员国合作、科学探索成果、空间安全策略、应用项目进展及技术支持,旨在全面展示 ESA 在推动欧洲及全球航天事业中的多方面努力和最新动态。


HN 热度 436 points | 评论 255 comments | 作者:cybermango | 1 day ago #

https://news.ycombinator.com/item?id=47808913

  • 月球尘埃闻起来像火药味,是因为尘埃长期未接触氧气,暴露在空气中后发生快速氧化反应。
  • 宇航员报告外太空闻起来像臭氧味,可能是空气锁首次暴露于真空环境时表面产生的化学反应。
  • 阿波罗 11 号担心月球尘埃在加压时可能自燃,曾做过氧气吹过测试以确保安全。
  • 如果尘埃自燃,计划是丢弃所有样本并清理舱内,但发生概率被认为极低。
  • 清理月球尘埃可能需要特殊设备,但由于登月舱质量限制,装备有限。
  • 人类航天的重要性在于宇航员能即兴应对突发状况,这是技术无法替代的。
  • 月球表面含有丰富的氧元素,但主要以矿物形式存在,不是自由氧气。
  • 月球尘埃主要是二氧化硅玻璃,化学性质稳定,不易进一步氧化。
  • 月球尘埃中含有少量金属硫化物和碳氢化合物,硫化物氧化后释放类似火药燃烧的二氧化硫气味。
  • 太阳风中含有少量氧离子,月球表面也会受到一定程度的氧暴露。
  • 真空环境中水蒸气和溶解氧可能与尘埃反应,产生臭氧味。
  • 低重力环境下灭火方式不同,水珠不会漂浮但能从远处浇灭火焰。
  • 月球尘埃长期未接触氧气,每次进入舱内都相当于一次新的化学实验。

4. Opus 4.6 与 Opus 4.7 的匿名请求令牌比较 (Anonymous request-token comparisons from Opus 4.6 and Opus 4.7) #

https://tokens.billchambers.me/leaderboard

该网页展示了社区对比 Opus 4.6 和 Opus 4.7 两个版本在实际请求中的匿名请求令牌(token)变化情况。页面通过 425 次提交的平均数据,显示了请求令牌数量和请求成本均有约 37.4% 的增长,平均请求大小从 369 增加到 495。

页面列出了最近 50 次匿名对比的详细数据,包括每次提交的 ID、请求令牌变化百分比、请求成本变化百分比以及具体的成本数值。数据表明,绝大多数请求在升级到 Opus 4.7 后,令牌数量和成本都有不同程度的提升,部分请求成本增长甚至超过 50%。

整体来看,网页主要用于展示社区用户在使用 Opus 4.6 与 4.7 版本时,令牌使用量和成本的变化趋势,帮助用户了解新版本在实际应用中的资源消耗情况。页面还提供了提交请求的匿名 ID,确保数据的匿名性和透明度。


HN 热度 402 points | 评论 411 comments | 作者:anabranch | 8 hours ago #

https://news.ycombinator.com/item?id=47816960

  • Opus 4.7 相比 4.6 在推理成本上降低了近一半,但生成的输出 token 更少,总体成本略低于 4.6,4.5 的成本则更低。
  • Opus 4.7 强制启用自适应思考机制,导致模型思考较少且输出 token 减少,用户反馈质量下降且出现基础错误。
  • 自适应思考机制使模型有时会懒于深入推理,出现“敷衍”回答,需要用户多次明确要求模型认真思考和检查边缘情况。
  • 关闭自适应思考(如 4.6 版本中可设置)能显著提升模型质量和细致度,但 4.7 版本不支持关闭该机制。
  • 在复杂任务中,4.6 关闭自适应思考表现更佳,4.7 虽然恢复能力更强,但仍需用户多次引导才能得到满意结果。
  • 有用户质疑当前的基准测试是否偏向于大规模复杂任务,忽视了小任务的准确性和精细度。
  • 4.7 版本的 token 消耗明显加快,用户在使用中更快达到使用限制,且努力设置对控制消耗帮助有限。
  • 通过调整提示语让模型“退一步重新评估”或“换个角度思考”比直接要求理由更有效,能避免模型陷入局部最优解。

5. Kdenlive 现状 (State of Kdenlive) #

https://kdenlive.org/news/2026/state-2026/

该网页是关于 Kdenlive 视频编辑软件 2025 年的发展总结及未来规划的详细报告。2025 年,Kdenlive 团队在持续开发、协作和社区支持下取得了显著进展,重点在于新功能添加、界面优化、性能提升和稳定性保障。

主要发布版本包括:

  • 25.04.0 版本引入了自动遮罩工具和基于 SAM2 模型的背景移除插件,重写了 OpenTimelineIO 导入导出功能,实现与其他编辑软件的项目交换,音频波形生成性能提升 300%。
  • 25.08.0 版本以稳定性为主,修复了超过 15 个崩溃问题,重设计了音频混音器,改进了标记和导向线功能,优化了标题编辑器。
  • 25.12.0 版本聚焦用户体验和界面打磨,新增首次启动欢迎屏幕和最近项目快速启动,推出更灵活的窗口停靠系统,重塑了项目监视器中的音频波形界面。

未来计划包括即将发布的 26.04 版本,将支持监视器镜像、动画过渡预览及自动调整过渡时长等新功能,提升多显示器协作体验。此外,还将支持批量调整剪辑播放速度、直接从时间线导入剪辑、始终以鼠标位置缩放时间线和为序列生成音频缩略图。

路线图中提到将继续完善 MLT 多媒体框架,计划支持 10/12 位色彩、播放优化和 OpenFX 特效,重构字幕系统,开发高级修剪工具。关键帧系统也在重构中,将引入 Dopesheet 功能,实现多效果参数的独立关键帧管理。

团队方面,2025 年有 38 位贡献者参与代码贡献,其中约半数为首次贡献者,核心团队由 8 名活跃成员组成。团队还举办了多次线下冲刺活动,如阿姆斯特丹和柏林冲刺,讨论技术改进、产品管理和未来规划。

此外,团队正在努力使 Kdenlive 支持微软 Visual Studio 编译,以便未来能通过微软商店发布,并在 Windows 持续集成中运行单元测试。

整体来看,Kdenlive 在 2025 年实现了功能创新与稳定性提升的平衡,社区活跃,未来发展方向明确,致力于为用户提供更高效、灵活和专业的视频编辑体验。


HN 热度 331 points | 评论 110 comments | 作者:f_r_d | 13 hours ago #

https://news.ycombinator.com/item?id=47815118

  • Kdenlive 功能比 iMovie 等基础编辑器强大,但学习曲线和硬件要求远低于 DaVinci Resolve,适合普通用户使用。
  • 结合 OBS 录屏和 Audacity(或 Tenacity)录音,能组成一个强大的开源视频制作工具链。
  • Kdenlive 作为免费且高质量的软件,用户选择它更多是出于喜好而非无奈。
  • 有用户之前误以为 Kdenlive 只是 KDE 套件的一部分,未尝试过,计划在下一个项目中试用。
  • Kdenlive 界面和功能设计适中,类似 Kate/Kdevelop 在编辑器中的定位。
  • Kdenlive 支持将预览窗口移动到第二显示器,类似 Final Cut Pro 的多屏操作体验。
  • 有用户指出 Kdenlive 存在稳定性问题,长期崩溃可能导致项目丢失,不适合重要或专业项目。
  • DaVinci Resolve 虽然功能强大且相对稳定,但对硬件有较高要求,且部分视频格式需要先转换。
  • 有用户表示相比 Premiere Pro,Kdenlive 崩溃次数更少,且 Premiere 在稳定性方面也存在问题。
  • Shotcut 与 Kdenlive 基于相同底层技术,Shotcut 界面更简洁且稳定性稍好,Kdenlive 功能更丰富,用户应根据需求选择。
  • Premiere Pro 作为最早的视频编辑软件之一,因历史悠久被视为行业标准,但并非唯一选择。
  • Avid Media Composer 在电影和电视行业中占有领先地位,Premiere Pro 在其他市场更受欢迎。
  • DaVinci Resolve 和 Final Cut Pro X 在专业视频编辑领域也有显著市场份额。
  • Kdenlive 更适合业余爱好者和偶尔使用者,不是专业级软件的替代品。
  • 备份和快照功能对于避免因软件崩溃导致的项目丢失至关重要。
  • 近年来 Kdenlive 稳定性有所提升,用户体验较五年前有明显改善。

6. 为什么日本拥有如此出色的铁路系统 (Why Japan has such good railways) #

https://worksinprogress.co/issue/why-japan-has-such-good-railways/

这篇文章探讨了日本铁路系统为何如此出色,并指出其成功主要归功于良好的公共政策,而非文化因素。日本铁路占乘客出行总里程的 28%,远超法国、德国和美国。日本铁路网络由多家私营公司组成,其中最大的 JR 东日本载客量超过除中国和印度外的所有国家铁路系统总和。

文章回顾了日本铁路的发展历程:铁路于 1872 年引入日本,最初国有化为日本国铁(JNR),但仍允许私人铁路存在。战前,日本私营电气铁路快速发展,逐渐从城市电车升级为重轨城际铁路,这些私营铁路至今仍活跃,尤其在东京、大阪和名古屋等大都市圈。1988 年,日本国铁被拆分为六个区域性铁路公司,形成了日本铁路集团(JR)。

日本铁路的另一个显著特点是“铁路引领城市发展”的商业模式。铁路公司不仅经营铁路,还涉足房地产、商业、医疗、娱乐等多个领域,通过多元化经营捕获铁路带来的溢价价值。例如,东急公司不仅运营铁路,还拥有住宅、办公楼、医院、超市和娱乐设施,形成了完整的城市生态系统。这种模式最早由阪急铁路在 1950 年代开创,推动了城市的整体发展。

总体来看,日本铁路系统的成功在于合理的企业结构、土地利用政策、交通法规、优质的私有化模式和有效监管,这些政策经验具有全球借鉴意义。文化因素虽被普遍认为影响日本铁路表现,但文章强调,真正的关键是制度设计和公共政策。


HN 热度 292 points | 评论 282 comments | 作者:RickJWagner | 12 hours ago #

https://news.ycombinator.com/item?id=47815395

  • 日本禁止在公共道路或人行道上停车,购车前必须证明有私人停车位,这有效节约了空间资源。
  • 日本街道狭窄,行人和自行车与车辆共用道路,街边停车会造成严重拥堵。
  • 街边停车使郊区环境恶化,车库堆满杂物导致车辆不得不停在街上,影响交通和行人通行。
  • 美国现代郊区街道常被停车占用,阻碍人行道使用,影响行人安全和便利。
  • 日本人通常在家或目的地停车场停车,公共交通使用率高,开车多用于远郊或大件购物。
  • 美国城市中心大量地面停车场浪费土地资源,若改为商业、住宅或公园等用途,有助于提高城市密度和公共交通效率。
  • 日本大城市虽有良好铁路系统,但也有高速公路穿城而过,交通管理复杂。
  • 美国铁路建设成本高昂且进度缓慢,管理和腐败问题严重,停车资源与铁路建设问题关联不大。
  • 美国长期忽视铁路建设,优先发展公路系统,导致公共交通状况恶化,形成恶性循环。
  • 美国政府对公路建设投入充足,公路网络广泛,但近年来公路建设速度放缓。

7. 展示项目:我制作了一个支持不相交区间并集运算的计算器 (Show HN: I made a calculator that works over disjoint sets of intervals) #

https://victorpoughon.github.io/interval-calculator/

该网页介绍了一个名为“区间计算器”的工具,由 Victor Poughon 开发,支持对区间及区间并集进行算术运算。区间表示一组连续的数值,例如[a, b]表示从 a 到 b 的所有数。区间并集则是多个不相交区间的集合,如[a, b] U [c, d]。

区间并集算术是对传统区间算术的扩展,优势在于它在包含零的区间除法中仍然封闭,能处理更复杂的运算。例如,2 除以[-2, 1]的结果是[-∞, -1] U [2, +∞]。该方法保证了从输入区间中任意选取实数代入表达式,结果必定落在输出区间内,适合表示不确定性。

网页详细介绍了区间计算器的语法和用法,包括区间、并集、加减乘除、指数运算及多种数学函数(如对数、三角函数、绝对值等)。支持常数如 π 和无穷大,且允许区间嵌套和区间边界的算术运算。

该工具还提供了全精度模式,利用 IEEE 754 双精度浮点数的外向舍入,确保计算结果区间包含真实值,解决了浮点数精度问题。全精度模式下,输入数字被解释为包含最接近浮点值的最小区间,输出显示完整小数位;关闭时,输入为零宽度区间,输出保留四位有效数字。

网页还提及了该计算器的开源性质,鼓励用户反馈问题并支持开发者。未来计划包括拆分全精度模式设置、增加历史结果变量、支持区间交集运算、优化并集运算优先级及支持空并集输入等功能。


HN 热度 291 points | 评论 50 comments | 作者:fouronnes3 | 23 hours ago #

https://news.ycombinator.com/item?id=47812341

  • 标准区间算术在处理包含零的区间除法时表现不佳,使用不连续区间的并集能更准确表达结果。
  • 通过对不连续区间的并集进行算术运算,可以实现更完整的函数逆运算,如平方函数的真正逆运算。
  • 实现区间并集算术时,需解决浮点数舍入误差,作者通过位级操作实现了向外舍入以保证结果准确。
  • 该项目基于 TypeScript 实现,依赖最小,适合交互式计算和测试区间并集算术的实现。
  • 该方法与 IEEE 1788 区间算术标准的关系尚不明确,作者未深入研究该标准。
  • 支持多值函数(如反三角函数的多值解)在该系统中实现难度较大,但会是有价值的扩展。
  • 用户输入的数字被解释为包含最接近的 IEEE 754 浮点数的最小区间,确保数值的包容性。
  • 该项目的代码测试覆盖率很高,尤其是区间除法部分测试复杂。
  • 有建议在界面上明确区间端点是否包含,使用不同括号表示开闭区间以提高可读性。
  • 该项目未支持开区间,主要实现的是闭区间的并集,支持开区间会显著增加代码复杂度。
  • 不同地区对区间符号的习惯不同,如美国常用圆括号表示开区间,法国等地用方括号或其他符号。
  • 有人建议将计算结果中的公式支持点击复制,方便用户继续操作。
  • 该项目为区间算术的研究和应用提供了一个实用的工具,适合进一步探索和扩展。

8. 如果你使用 iTerm2,执行“cat readme.txt”命令并不安全 (“cat readme.txt” is not safe if you use iTerm2) #

https://blog.calif.io/p/mad-bugs-even-cat-readmetxt-is-not

本文介绍了 iTerm2 终端模拟器中的一个严重安全漏洞,该漏洞允许通过执行“cat readme.txt”命令导致任意代码执行。iTerm2 的 SSH 集成功能通过一个名为 conductor 的远程脚本与本地终端通信,使用终端转义序列作为协议载体。然而,漏洞在于 iTerm2 错误地信任了来自终端输出的 conductor 协议消息,攻击者可以伪造这些消息,使 iTerm2 误以为与真实的 conductor 会话通信。

攻击原理是,恶意文件中包含伪造的 DCS 2000p 和 OSC 135 终端序列,诱使 iTerm2 启动 conductor 协议流程,并发送命令。攻击者设计的 sshargs 参数被用作后续命令的一部分,最终导致 iTerm2 将恶意代码作为本地命令执行。利用该漏洞的 PoC 文件包括一个恶意脚本和一个包含伪造协议消息的文本文件,用户在特定目录下执行“cat readme.txt”时触发漏洞。

该漏洞的根本原因是 PTY(伪终端)机制的混淆,iTerm2 将本应发送给远程 conductor 的命令错误地发送到了本地 shell,导致恶意代码被执行。漏洞于 2026 年 3 月底被报告并在次日修复,但修复尚未推送到稳定版本,存在一定的安全风险窗口。

文章还提及了披露时间的争议,认为在补丁未广泛部署前公开漏洞可能带来风险,呼吁更合理的披露策略。整体来看,该漏洞揭示了终端模拟器在处理复杂协议时的信任边界问题,提醒用户和开发者关注终端安全。


HN 热度 288 points | 评论 176 comments | 作者:arkadiyt | 1 day ago #

https://news.ycombinator.com/item?id=47809190

  • 漏洞披露前发布博客提高了漏洞的可见性,虽然补丁尚未进入稳定版本,但公开的提交信息已经足够让攻击者开发利用代码。
  • 公开提交代码后,漏洞信息已经“泄露”,继续隐瞒只会帮助攻击者,减少整体安全性。
  • 传统的漏洞披露等待期可能会逐渐失效,因为 AI 技术能快速从公开代码中推断出漏洞利用方法。
  • AI 工具虽然能快速发现漏洞,但人们仍需了解漏洞的具体细节,包括发生位置和利用方式。
  • 公开漏洞信息有助于推动快速修复和发布,但也带来新的挑战和风险。
  • 攻击者通常是资源丰富、专业化的团队,不应低估他们利用公开信息的能力。
  • 即使是高级攻击者能利用公开信息,也不应让所有人都轻易获得漏洞利用细节,避免扩大攻击面。
  • 公开补丁的动机是为了让更多人知晓并采取防护措施,促进安全标准的普及。
  • 通常做法是先将补丁私下提供给发行版和终端用户,再公开提交代码,但这与开源发布的理念存在矛盾。

9. B-52 轰炸机星象跟踪仪内的机电角度计算机 (The electromechanical angle computer inside the B-52 bomber’s star tracker) #

https://www.righto.com/2026/04/B-52-star-tracker-angle-computer.html

本文介绍了 B-52 轰炸机上用于星象导航的电机机械角度计算机——Angle Computer。早在 GPS 普及之前,飞机主要依靠天文导航,通过观测星星、太阳或行星的位置来确定航向和位置。天文导航虽然准确且不易被干扰,但手动操作复杂耗时。1960 年代初,B-52 配备了自动星象跟踪系统,利用 Angle Computer 进行三角函数计算,实现自动导航。

Angle Computer 内部结构复杂,通过机械装置模拟“天球”,指针代表星星位置,通过同步电机读取方位角和高度角,向导航系统传输数据。该计算机是 Astro Compass 系统的一部分,Astro Compass 能自动锁定星星,提供精确到十分之一度的航向信息,并辅助导航员通过“位置线”技术确定飞机位置。

Astro Compass 系统包括安装在机身顶部的 Astro Tracker 光学设备,带有稳定平台和旋转棱镜,确保望远镜准确指向目标星星。系统由 19 个部件组成,包括放大器、计算机和控制面板,导航员通过主控面板输入时间、星体位置等数据,调整旋钮选择参数。星体数据来源于美国政府出版的《空中天文年鉴》,该年鉴提供太阳、行星、月亮及恒星的精确位置。

文章还介绍了天文导航中的坐标转换问题。星体位置以全球坐标系表示,但导航系统需要本地坐标系中的方位角和高度角,这涉及复杂的球面三角计算。通过计算导航三角形,系统将天文数据转换为飞机所在位置的角度信息,辅助导航员进行精确定位。整个系统体现了当时电机机械技术在航空导航中的创新应用。


HN 热度 248 points | 评论 72 comments | 作者:NelsonMinar | 8 hours ago #

https://news.ycombinator.com/item?id=47817132

  • 早期机械计算设备多用于海军火控,输入多为人工操作,后来逐渐实现传感器自动输入和输出控制。
  • 机械计算机体积庞大,结构复杂,包含齿轮、凸轮和解析器,输入输出均为电信号。
  • 这类设备在军用导弹和飞机导航中有重要应用,类似于地面导弹的制导计算机。
  • 相关历史资料和培训视频能帮助理解这些机械计算机的工作原理。
  • 机械计算机设计复杂且要求严格,缺乏现代 CAD 工具,设计难度极高。
  • 硅谷的许多技术发展与军事合同密切相关,军方资金支持科研项目。
  • 早期微处理器在军用飞机中的应用存在被过度宣传的情况。
  • 机械设备的复杂性和简洁性令人着迷,但实际工作多为枯燥的测试和标准制定。
  • 机械导航设备需要进行精确的环境测试,如高低温循环和振动测试。
  • 天文罗盘等设备通过螺旋搜索模式定位星体,搜索范围较大,确保能找到目标。
  • 科技发展与军事用途密不可分,但应关注其社会影响和历史背景。
  • 回顾历史时应理性看待,不应美化战争相关技术的应用。

10. 阿米加图形档案 (Amiga Graphics Archive) #

https://amiga.lychesis.net/

该网页是一个专注于 Commodore Amiga 家用电脑图形作品的档案和展示网站。Amiga 于 1985 年发布,凭借其复杂的定制芯片,具备当时无可比拟的图形处理能力,使得许多其他个人电脑无法实现的图形效果成为可能。网站收录了大量使用 Amiga 制作或为 Amiga 设计的图形作品,包括艺术作品、游戏画面、标志、出版物和场景作品。

网站内容涵盖多个专题和文章,如显示技术、游戏公司、屏幕模式等,帮助用户深入了解 Amiga 图形的技术背景和发展。页面还列出了多个更新记录,展示了近年来不断添加的珍贵图像资源,包括来自不同艺术家和杂志的作品,以及色彩循环动画等特殊技术的应用。

此外,网站提供了社交媒体链接,方便用户关注最新动态。所有展示的图像版权归原作者所有,网站也欢迎用户反馈和建议。整体来看,该网站是 Amiga 图形爱好者和研究者的重要资源库,既保存了历史,也展示了丰富的视觉艺术成就。


HN 热度 229 points | 评论 69 comments | 作者:sph | 18 hours ago #

https://news.ycombinator.com/item?id=47813566

  • Amiga 通常被称为 32 位机器,因为其寄存器和操作是 32 位,且拥有平坦的 32 位地址空间,虽然 68000 CPU 本身的地址线未完全支持。
  • 由于 68000 的数据总线是 16 位,且地址总线为 24 位,部分人认为 Amiga 更适合称为 16 位或 16/32 位机器。
  • 硬件厂商和市场推广更注重总线宽度,因此将 68000 系列机器称为 16 位或 16/32 位以区分真正的 32 位 CPU。
  • Amiga 早期型号如 A1000、A2000、A500 采用 16 位芯片组和 24 位地址总线,部分程序因使用指针高位导致兼容性问题。
  • 68020 及以后的 CPU 才是真正的 32 位 CPU,Amiga 1200 开始使用 68020,开始强调 32 位特性。
  • 68000 指令集是 32 位的,但内部实现细节如总线宽度和地址线限制使得称其为 16 位也有一定合理性。
  • 在 80 年代,Amiga 和 Atari ST 等机器通常被归类为 16 位机器,之前的机器如 C64 被认为是 8 位。
  • 现代 CPU 即使有部分总线或地址线限制,仍被称为 64 位系统,说明总线宽度不应作为唯一判定标准。
  • 不同地区和时期对 Amiga 的位数称呼存在差异,英国和意大利等地早期多称其为 16 位机器。

Hacker News 精彩评论及翻译 #

Anonymous request-token comparisons from Opus 4.6 … #

https://news.ycombinator.com/item?id=47817610

We dropped Claude. It’s pretty clear this is a race to the bottom, and we don’t want a hard dependency on another multi-billion dollar company just to write software

We’ll be keeping an eye on open models (of which we already make good use of). I think that’s the way forward. Actually it would be great if everybody would put more focus on open models, perhaps we can come up with something like the “linux/postgres/git/http/etc” of the LLMs: something we all can benefit from while it not being monopolized by a single billionarie company. Wouldn’t it be nice if we don’t need to pay for tokens? Paying for infra (servers, electricity) is already expensive enough

dakiol

我们放弃了Claude。很明显这是一场向底线竞赛,我们不想在写软件时对另一家数十亿美元的公司产生强烈依赖。

我们会继续关注开源模型(我们已经在很好地利用它们)。我认为这才是未来的方向。其实如果每个人都能更多关注开源模型,那会非常棒,也许我们能打造出类似于“Linux/Postgres/Git/HTTP等”那样的LLM(大型语言模型),让我们都能受益,同时不被某个亿万富翁公司垄断。如果不用为代币付费,那该多好?基础设施(服务器、电力)的费用已经够贵了。


I’m spending months coding the old way #

https://news.ycombinator.com/item?id=47811531

I am this very term teaching 18-year-old students 6502 assembly programming using an emulated Apple II Plus. They’ve had intro to Python, data structures, and OO programming courses using a modern programming environment.

Now, they are programming a chip from the seventies using an editor/assembler that was written in 1983 and has a line editor, not a full-screen one.

We had a total of 10 hours of class + lab where I taught them about assembly language and told them about the registers, instructions, and addressing modes of the chip, memory map and monitor routines of the Apple, and after that we went and wrote a few programs together, mostly using the low-resolution graphics mode (40x40): a drawing program, a bouncing ball, culminating in hand-rolled sprites with simple collision detection.

Their assignment is to write a simple program (I suggested a low-res game like Snake or Tetris but they can do whatever they want provided they tell me about it and I okay it), demo their program, and then explain to the class how it works.

At first they hated the line editor. But then a very interesting thing happened. They started thinking about their code before writing it. Planning. Discussing things in advance. Everything we told them they should do before coding in previous classes, but they didn’t do because a powerful editor was right there so why not use it?…

And then they started to get used to the line editor. They told me they didn’t need to really see the code on the screen, it was in their head.

They will of course go back to modern tools after class is finished, but I think it’s good for them to have this kind of experience.

apricot

本学期我正在教18岁的学生使用模拟的Apple II Plus进行6502汇编编程。他们之前学过Python入门、数据结构和面向对象编程课程,使用的是现代编程环境。

现在,他们要用一个上世纪七十年代的芯片编程,使用的是1983年编写的编辑器/汇编器,这个编辑器是行编辑器,而不是全屏编辑器。

我们总共有10小时的课程和实验时间,我教他们汇编语言,讲解芯片的寄存器、指令和寻址方式,Apple的内存映射和监控例程。之后我们一起写了几个程序,主要用的是低分辨率图形模式(40x40):一个绘图程序,一个弹跳球,最终实现了手工绘制的精灵和简单的碰撞检测。

他们的作业是写一个简单的程序(我建议像贪吃蛇或俄罗斯方块这样的低分辨率游戏,但他们可以自由发挥,只要告诉我并获得批准),演示他们的程序,然后向全班解释程序的工作原理。

一开始他们很讨厌行编辑器。但随后发生了一件非常有趣的事。他们开始在写代码前思考代码,开始做计划,提前讨论。这些都是我们之前课程里告诉他们应该在编码前做的事情,但因为有强大的编辑器支持,他们之前从没这么做过,想着反正有编辑器,为什么不直接用呢?……

然后他们慢慢适应了行编辑器。告诉我其实不需要一直看屏幕上的代码,代码都在他们脑子里。

课后他们当然会回到现代工具上,但我觉得让他们有这种经历是很好的。


All 12 moonwalkers had “lunar hay fever” from dust… #

https://news.ycombinator.com/item?id=47809790

I recall an article from a long time ago that basically said “astronauts report” the moon smells like spent gunpowder and outer space smell like… I think it was ozone.

What they were actually reporting was the smell of the airlocks after they returned from their excursions. The moon has no atmosphere, so it has been accumulating dust from billions of years of asteroid impacts that have never come in contact with oxygen. Many of the chemicals in the dust are oxidative and so when it is exposed to air for the first time it rapidly oxidizes just like gunpowder!

And I think the outer space report was from space walks, and the explanation was that the first time the airlock itself was exposed to hard vacuum, the surfaces of the airlock would have a reaction that left a scent of ozone.

corysama

我记得很久以前有一篇文章,大致内容是“宇航员报告”月球闻起来像用过的火药味,太空闻起来像……我记得是臭氧味。

他们实际上报告的是从月球活动回来后空气锁里的气味。月球没有大气层,因此积累了数十亿年来陨石撞击产生的尘埃,这些尘埃从未接触过氧气。尘埃中的许多化学物质是氧化性的,所以当它首次接触空气时,就像火药一样迅速氧化!

我认为关于太空的报告是来自太空行走,解释是空气锁第一次暴露在真空中时,空气锁表面发生了反应,留下一种臭氧的气味。


NASA Force #

https://news.ycombinator.com/item?id=47807801

Two things:

  • I like the rolling Moon animation very much.

  • This seems like a clever way of getting talent involved during a budget squeeze, presumably with the hope that some of those they attract will still be around after this congress and the agency can stabilize once again. I guess it’s also a neat kind of try-before-you-buy for both sides. NASA is prestigious and one of the very few places one could do purely science-focused aerospace engineering, but it’s still a government job under all the gold leaf and atomic robots.

EDIT: Good Lord, I get the cynicism but at least someone at NASA HR is trying new things to keep the lights on.

scrumper

两点:

  • 我非常喜欢那个滚动的月亮动画。

  • 这似乎是一种在预算紧缩期间让人才参与进来的聪明方法,估计也希望借此吸引到的一些人能够在本届国会结束后依然留下来,帮助机构再次稳定。我猜这也是双方都能“先试用后购买”的一种不错方式。NASA很有声望,是为数不多可以专注于纯科学航天工程的地方之一,但毕竟它仍然是一个政府工作,尽管外面铺满了金箔和“原子机器人”。

补充:天哪,我理解这种愤世嫉俗,但至少NASA的人力资源部门有人在尝试新办法保持运转。


Hyperscalers have already outspent most famous US … #

https://news.ycombinator.com/item?id=47807926

This tweet shows it as a percentage of US GDP:

https://x.com/paulg/status/2045120274551423142

Makes it a little less dramatic. But also shows what a big **’n deal the railroads were!

timmg

这条推文显示了作为美国GDP百分比的数据:

https://x.com/paulg/status/2045120274551422

这样看起来没那么夸张了。但也显示了铁路当时是多么重要的大事!


“cat readme.txt” is not safe if you use iTerm2 #

https://news.ycombinator.com/item?id=47810518

At the time of writing, the fix has not yet reached stable releases.

Why was this disclosed before the hole was patched in the stable release?

It’s only been 18 days since the bug was reported to upstream, which is much shorter than typical vulnerability disclosure deadlines. The upstream commit ( https://github.com/gnachman/iTerm2/commit/a9e745993c2e2cbb30b884a16617cd5495899f86 ) has way less information than this blog post, so I think releasing this blog post now materially increases the chance that this will be exploited in the wild.

Update: The author was able to develop an exploit by prompting an LLM with just the upstream commit, but I still think this blog post raises the visibility of the vulnerability.

KerrickStaley

截至发稿时,修复尚未推送到稳定版本。

为什么在稳定版本修复漏洞之前就公布了这个问题?

从漏洞报告给上游开始到现在才过去18天,这远远少于典型漏洞公开的时间期限。上游的提交(https://github.com/gnachman/iTerm2/commit/a9e745993c2e2cbb30b884a16617cd5495899f86)提供的信息远不如这篇博客详细,所以我认为现在发布这篇博客实际上大大增加了该漏洞在实际环境中被利用的风险。

更新:作者仅凭上游提交内容,利用大型语言模型就能开发出漏洞利用代码,但我仍然认为这篇博客提高了该漏洞的曝光度。


Measuring Claude 4.7’s tokenizer costs #

https://news.ycombinator.com/item?id=47807499

LLMs exist on a logaritmhic performance/cost frontier. It’s not really clear whether Opus 4.5+ represent a level shift on this frontier or just inhabits place on that curve which delivers higher performance, but at rapidly diminishing returns to inference cost.

To me, it is hard to reject this hypothesis today. The fact that Anthropic is rapidly trying to increase price may betray the fact that their recent lead is at the cost of dramatically higher operating costs. Their gross margins in this past quarter will be an important data point on this.

I think the tendency for graphs of model assessment to display the log of cost/tokens on the x axis (i.e. Artificial Analysis’ site) has obscured this dynamic.

louiereederson

大型语言模型(LLMs)存在于一个对数性能/成本的前沿线上。目前还不清楚Opus 4.5及以上版本是否代表了这一前沿线上的一个层级跃升,还是仅仅处于该曲线上的某个位置,尽管性能更高,但推理成本的回报正在迅速递减。

对我来说,今天很难否定这个假设。Anthropic迅速提高价格的事实,可能暴露出他们近期领先地位是以显著更高的运营成本为代价的。他们上个季度的毛利率将是一个重要的数据点。

我认为,模型评估图通常在x轴上展示成本/令牌的对数(例如Artificial Analysis网站),这掩盖了这一动态。


Isaac Asimov: The Last Question (1956) #

https://news.ycombinator.com/item?id=47805326

This is one of those stories, just like the SR-71 “ground speed check” story, that every single time I see it posted I just have to read the entire thing again. I love it.

jasongill

这是那种故事,就像SR-71“地面速度检测”的故事一样,每次看到有人发出来,我都必须把全文再读一遍。我非常喜欢它。


It’s OK to compare floating-points for equality #

https://news.ycombinator.com/item?id=47815131

Is there any constant more misused in compsci than ieee epsilon? :)

It’s defined as the difference between 1.0 and the smallest number larger than 1.0. More usefully, it’s the spacing between adjacent representable float numbers in the range 1.0 to 2.0.

Because floats get less precise at every integer power of two, it’s impossible for two numbers greater than or equal to 2.0 to be epsilon apart. The spacing between 2.0 and the next larger number is 2*epsilon.

That means abs(a - b) <= epsilon is equivalent to a == b for any a or b greater than or equal to 2.0. And if you use < then the limit will be 1.0 instead.

Epsilon is the wrong tool for the job in 99.9% of cases.

hmry

在计算机科学中,还有哪个常数比IEEE的epsilon被误用得更多的吗?:)

它被定义为1.0和比1.0稍大的最小数之间的差值。更有用的是,它表示在1.0到2.0范围内相邻可表示浮点数之间的间距。

因为浮点数在每个2的整数次幂处精度都会降低,所以对于大于或等于2.0的两个数,不可能相差一个epsilon。2.0和下一个更大的数之间的间距是2倍的epsilon。

这意味着对于任何大于或等于2.0的a或b,abs(a - b) <= epsilon 相当于 a == b。如果使用 <,则限制将变为1.0。

在99.9%的情况下,epsilon都是不合适的工具。


Show HN: Smol machines – subsecond coldstart, port… #

https://news.ycombinator.com/item?id=47808326

Hello, I’m building a replacement for docker containers with a virtual machine with the ergonomics of containers + subsecond start times.

I worked in AWS previously in the container space + with firecracker. I realized the container is an unnecessary layer that slowed things down + firecracker was a technology designed for AWS org structure + usecase.

So I ended up building a hybrid taking the best of containers with the best of firecracker.

Let me know your thoughts, thanks!

binsquare

你好,我正在构建一个用虚拟机替代Docker容器的方案,兼具容器的易用性和亚秒级启动时间。

我之前在AWS从事容器相关工作,也接触过Firecracker。我意识到容器是一个不必要的层,反而会拖慢速度,而Firecracker是为AWS的组织结构和使用场景设计的技术。

所以我最终打造了一个混合方案,结合了容器和Firecracker的优点。

欢迎告诉我你的看法,谢谢!


Claude Design #

https://news.ycombinator.com/item?id=47808702

On Notes on the Synthesis of Form, Alexander defines design as the rationalization of the forces that define a problem. You’ll won’t find a better definition. But people tend to think design is the synthesis and its results. This misunderstanding of the role of design and the designer is responsible for all the unfit designs we encounter on a daily basis. Anyone equipped with a synthesis tool and feeling empowered to quickly and cheaply generate forms will almost inevitably become blind to the very nature of the underlying problems they set to solve. They’ll be fitting the problem to the available forms. They’ll skip the understanding, the conversations, the conflicts and disagreements, and happily and wrongly assume a design problem can be solved hermetically, in isolation. They’ll think quality is a factor of aesthetics, when in truth, aesthetics is an effect; nevertheless these effects is all they’ll have control over, as it’s all the tool can do. The tool will hinder their ability to be rational; to see the inner structures; to find the hidden but essential semantics; to create the ontologies that’ll support not only the immediate synthesis, but that will sustain the evolution of the design over its lifetime. They’ll be denied the enlightenment that comes with gradual, slow construction; the only place and moment where innovative ideas reveal themselves. They’ll be impoverished and confuse output with agency. I feel sorry for anyone that will think using tools equals doing design, because of the truly marvelous human experiences that they’ll miss, and that could never be replaced by the shallow pride of empty achievement.

pilgrim0

在《形式的综合笔记》中,亚历山大将设计定义为对定义问题的各种力量进行合理化。你找不到比这更好的定义。但人们往往认为设计就是综合及其结果。这种对设计及设计师角色的误解,是我们每天遇到各种不合适设计的根源。任何掌握综合工具并觉得自己能够快速且廉价地生成形式的人,几乎不可避免地会对他们试图解决的根本问题的本质视而不见。他们会将问题套用到现有的形式上。他们会跳过理解、交流、冲突和分歧,错误且愉快地认为设计问题可以孤立地、密封地解决。他们会认为质量是美学的一个因素,而实际上美学是一种效果;然而这些效果却是他们唯一能控制的,因为这正是工具所能做到的。该工具将阻碍他们理性思考的能力;阻止他们洞察内在结构;发现隐藏但关键的语义;构建不仅支持当前综合,还能维持设计在整个生命周期中演进的本体论。他们将失去随着缓慢而渐进的构建过程而来的启迪;这是创新思想得以显现的唯一时空。他们将陷入贫乏,混淆产出与能动性。我为那些以为使用工具就等同于做设计的人感到遗憾,因为他们将错过许多真正美妙的人类体验,而这些体验永远无法被空洞成就感的浅薄自豪所替代。


NASA Force #

https://news.ycombinator.com/item?id=47808070

NASA Force technologists inside the systems that power American spaceflight, aeronautics, and scientific discovery.

Am I an idiot or does their leading sentence make absolutely no sense?

tiberone

NASA的技术专家们在支撑美国航天飞行、航空以及科学探索的系统内部工作。

我是笨了吗,还是他们的开头句子完全没有意义?


Why Japan has such good railways #

https://news.ycombinator.com/item?id=47817240

Japan is one of the only countries to have privatized parking. In Europe and North America, vast quantities of parking space is socialized: municipalities own the streets and allow people to park on them at low or zero cost. Initially with the intention of encouraging the provision of more parking spaces, Japan made it illegal to park on public roads or pavements without special permission. Before someone buys a car, they must prove that they have a reserved night-time space on private land, either owned or leased.

This is got to be a huge factor. Making everyone pay for “free parking” through inefficient use of space is such a waste. I strongly recommend everyone to read Donald Shoup’s “The High Price of Free Parking”.

vantassell

日本是少数几个实现停车位私有化的国家之一。在欧洲和北美,大量的停车空间是社会化的:市政当局拥有街道,允许人们以低价或免费在街上停车。日本最初是为了鼓励提供更多停车位,才规定未经特别许可,不得在公共道路或人行道上停车。在买车之前,必须证明自己拥有一个私人土地上的夜间停车位,或是拥有或租赁的。

这一定是一个很大的因素。让所有人都为“免费停车”付费,却通过低效的空间利用浪费资源,实在太可惜了。我强烈推荐大家阅读唐纳德·舒普的《免费停车的高昂代价》。


Claude Opus 4.7 #

https://news.ycombinator.com/item?id=47802834

I can’t notice any difference to 4.6 from 3 weeks ago, except that this model burns way more tokens, and produces much longer plans. To me it seem like this model is just the same as 4.6 but with a bigger token budget on all effort levels. I guess this is one way how Anthropic plans to make their business profitable.

During the past weeks of lobotomized opus, I tried a few different open weight models side by side with “opus 4.6” on the same issue. The open weights outperformed opus 4.6, and did it way faster and cheaper. I tried the same problem against Opus 4.7 today and it did manage to find one additional edge case that is not critical, but should be logged. So based on my experience, the open weight models managed to solve the exact problem I needed fixed, while Opus 4.7 seem to think a bit more freely at the bigger picture. However Opus 4.7 also consumed way more tokens at a higher price, so the price difference was 10-20x higher on Opus compared to the open weights models. I will use Opus for code review and minor final fixes, and let the open weights models do the heavy lifting from now on. I need a coding setup I can rely on, and clearly Anthropic is not reliable enough to rely on.

Why pay 200$ to randomly get rug-pulled with no warning, when I can pay 20$ for 90% of the intelligence with reliable and higher performance?

EmanuelB

我看不出这版4.6和三周前有什么区别,唯一不同的是这个模型消耗了更多的token,生成了更长的计划。对我来说,这个模型似乎和4.6没啥两样,只是增加了所有努力层级的token预算。我猜这可能是Anthropic想让他们的业务变得盈利的一种方式。

在过去几周使用被阉割的opus期间,我在同一问题上尝试了几款不同的开源权重模型与“opus 4.6”作对比。开源权重模型表现得比opus 4.6更好,且速度更快、成本更低。今天我用同样的问题测试了Opus 4.7,它确实找到了一个额外的边缘案例,虽然不关键,但应该被记录下来。所以根据我的经验,开源模型解决了我需要修复的那个具体问题,而Opus 4.7似乎在更宏观的层面上思考得更自由。但Opus 4.7消耗了更多的token,价格也更高,因此在价格上,Opus比开源权重模型贵了10到20倍。我会用Opus来做代码审查和一些小的最终修正,让开源权重模型从现在起承担繁重的工作。我需要一个可以依赖的编码环境,很明显Anthropic还不够可靠,不能成为依赖对象。

为什么我要花200美元,却可能毫无预警地被“割韭菜”,而我20美元就能获得90%的智能水平,而且性能更稳定更高效呢?


Discourse Is Not Going Closed Source #

https://news.ycombinator.com/item?id=47802484

Open source creates a useful urgency: when your code is public, you assume it will be examined closely, so you invest earlier and more aggressively in finding and fixing issues before attackers do.

This should be the mentality of every company doing open source.Great points made.

dhruv3006

开源带来了有益的紧迫感:当你的代码是公开的,你会假设它会被仔细审查,因此你会更早、更积极地投入到发现和修复问题中,防止攻击者先行利用。

这应该是每个做开源的公司的心态。观点很棒。


State of Kdenlive #

https://news.ycombinator.com/item?id=47815642

Kdenlive hits the perfect sweet spot for me. It’s much more capable than basic editors like iMovie, but doesn’t have the overwhelming learning curve (or steep hardware requirements) of DaVinci Resolve. Like others have mentioned, pairing it with OBS for screen recording and Audacity for audio makes for an incredibly powerful, 100% FOSS media creation stack. It’s amazing to see how far open-source video editing has come.

visiohex

Kdenlive 对我来说正好达到了完美的平衡点。它比像 iMovie 这样基础的编辑软件功能强大得多,但又没有 DaVinci Resolve 那样令人望而生畏的学习曲线(或高硬件要求)。正如其他人提到的,将它与 OBS 进行屏幕录制和 Audacity 用于音频录制相结合,构成了一个极其强大且完全开源的媒体创作工具链。看到开源视频编辑发展到现在的程度,真是令人惊叹。


Claude Design #

https://news.ycombinator.com/item?id=47808894

This is a really verbose way to say that using generative AI has a detrimental effect on the user because one deprives themselves of the learning experience.

bauerd

这句话长篇大论地说明了使用生成式人工智能对用户有害,因为这样会剥夺他们学习的机会。


Claude Design #

https://news.ycombinator.com/item?id=47808004

For my agency this won’t replace Figma or designers. It’s just a really useful tool to express yourself and communicate intent.

Before these tools, when a client wanted a specific section built, we’d spend hours hunting references across the web. The output always ended up feeling like a mesh of 2-3 sites, never fully unique. Then we’d burn more time explaining the intent to the client’s designers and devs, usually with multiple rounds because words don’t convey layout well.

Now we throw a quick mockup together in Claude or Lovable and send it. The designer gets the idea in 30 seconds instead of a 45-minute call, then pushes it further with their own taste and the client’s branding.

It’s not replacing designers. Most clients don’t know what they want until they see it. These tools collapse that feedback loop from weeks to minutes, so the designer actually spends their time on the parts that need human taste, not on decoding a vague brief.

Growtika

对我的代理机构来说,这不会取代Figma或设计师。它只是一个非常有用的工具,帮助表达自己和传达意图。

在有这些工具之前,当客户想要建造某个特定部分时,我们会花费数小时在网上寻找参考资料。结果总是感觉像是拼凑了2-3个网站,永远无法做到完全独特。然后我们还得花更多时间向客户的设计师和开发人员解释意图,通常要经过多轮,因为文字无法很好地传达布局。

现在我们只需在Claude或Lovable里快速做个草图并发送。设计师在30秒内就能理解想法,而不是一通45分钟的电话,然后他们用自己的品味和客户的品牌进一步完善。

这并不是取代设计师。大多数客户直到看到效果才知道自己想要什么。这些工具把反馈周期从几周缩短到几分钟,让设计师真正把时间花在需要人类审美的部分,而不是解读模糊的需求说明。


Michael Rabin has died #

https://news.ycombinator.com/item?id=47815482

Thank you Michael Rabin for your excellent work. Rest in Peace.

Rabin Fingerprinting is one of my favorites of his contributions. It’s a “rolling hash” that allows you to quickly compute a 32-bit (or larger) hash at every byte offset of a file. It is used most notably to do file block matching/deduplication when those matching blocks can be at any offset. It’s tragically underappreciated.

I’ve been meaning to write up a tutorial as part of my Galois Field series. Someday..

Thank you again!

xorvoid

感谢迈克尔·拉宾的卓越贡献。愿他安息。

拉宾指纹算法是他贡献中我最喜欢的之一。这是一种“滚动哈希”,能够让你快速计算文件中每一个字节偏移位置的32位(或更大)的哈希值。它最著名的应用是用于文件块匹配/去重,特别是当匹配的块可以出现在任意偏移位置时。这个算法非常优秀,但却被严重低估了。

我一直打算作为我的伽罗瓦域系列的一部分写一篇教程。总有一天会写的……

再次感谢您!


NASA Force #

https://news.ycombinator.com/item?id=47809177

They had these kinds of programs for a long time, but many of the engineers were vilified and the programs disbanded as soon as this administration took office. I’m not sure why someone would sign up to work for a government that has no respect for its employees (or a company for that matter) if they already have gainful employment.

In fact, a bunch of NASA labs were recently closed where folks with this exact skillset could do these exact jobs. Why re-post under a different skin and expect a different result?

sailfast

这类项目已经存在很长时间了,但许多工程师被污蔑,这些项目在本届政府上任后很快就被解散了。我不明白如果有人已经有稳定工作,为什么还会选择去为一个不尊重员工(或者说公司)的政府工作。

事实上,最近关闭了很多NASA实验室,那些具备这类技能的人本可以在那里做这类工作。为什么要换个名义重新发布招聘,期待会有不同的结果呢?


Hyperscalers have already outspent most famous US … #

https://news.ycombinator.com/item?id=47811382

GDP adjustments are warranted, but it is more stark than both the estimates suggest.

The megaprojects of the previous generations all had decades long depreciation schedules. Many 50-100+ year old railways, bridges, tunnels or dams and other utilities are still in active use with only minimal maintenance

Amortized Y-o-Y the current spends would dwarf everything at the reported depreciation schedule of 6(!) years for the GPUs - the largest line item.

manquer

GDP的调整是合理的,但比这两个估算所显示的更为明显。

上一代的大型项目都有几十年的折旧周期。许多有着50到100年以上历史的铁路、桥梁、隧道或水坝及其他公用设施仍在使用,仅需很少的维护。

按年摊销,目前的支出按照报告中GPU折旧期仅6年(!)计算,将远远超过所有其他项目。


The “Passive Income” trap ate a generation of entr… #

https://news.ycombinator.com/item?id=47801287

You rarely see anything more than a couple hundred bucks a month. There are notable exceptions, but unfortunately a lot of those notable exceptions are scammy, spammy business models.

I suspect this is largely sampling bias.

I host meetups for indie founders, and several attendees earn their living through solo businesses. When I go to conferences like Microconf, I meet lots more.

The problem with measuring financial success by who posts about it on HN is:

  • The more someone is making at their solo business, the less they want to blab about it and attract competitors.

  • The people earning at the low end are more desperate for people to see what they’re doing so they can pick up new customers, so they’re more likely to talk about their work.

  • The more successful founders are busier and spend less time posting on HN.

mtlynch

你很少会看到有人每月收入超过几百美元。虽然有一些显著的例外,但不幸的是,其中很多例外都是欺诈性、垃圾邮件式的商业模式。

我怀疑这很大程度上是抽样偏差。

我主持独立创始人的聚会,几位参与者靠个人业务谋生。每当我参加像Microconf这样的会议时,我会遇到更多这样的人。

用谁在HN上发布内容来衡量财务成功存在的问题是:

  • 个人业务收入越高的人,越不愿意大肆宣扬,避免吸引竞争者。

  • 收入较低的人更渴望有人关注他们的工作,以便吸引新客户,因此他们更可能谈论自己的工作。

  • 更成功的创始人更忙,花在HN上的时间更少。


Traders placed over $1B in perfectly timed bets on… #

https://news.ycombinator.com/item?id=47818861

You’d have to be spectacularly stupid to bet on these kinds of things without having insider knowledge, because you ought to know good and damn well by now that the people with insider knowledge are DEFINITELY betting on them.

beaviskhan

如果没有内部消息而去赌这种事情,那你得蠢到家了,因为你现在应该非常清楚,有内部消息的人绝对在下注。


Amazon is discontinuing Kindle for PC on June 30th #

https://news.ycombinator.com/item?id=47817057

Combined with the announcement that they’re killing the old Kindles as well…this is 100% about preventing people from liberating DRM from their books. Full stop. They are closing each and every remaining hole.

AdmiralAsshat

结合他们宣布淘汰老款Kindle的消息来看……这100%是为了防止人们破解他们书籍中的数字版权管理(DRM)。毫无疑问。他们正在关闭每一个剩余的漏洞。


2026 04 18 HackerNews

2026-04-18 08:05:01

2026-04-18 Hacker News Top Stories #

  1. OpenAI 升级 Codex 为可操控电脑、并行多任务与插件齐备的通用代理,潜力巨大但仍面临与大厂竞争、用户体验与安全风险等挑战。
  2. Anthropic 推出 Claude Design 将 AI 融入协同设计与交付流程,提升效率之余也引发关于界面同质化与个性化权衡的讨论。
  3. 阿西莫夫《最后的问题》引发对不确定性的思考,而讨论聚焦于不同文化与当下 LLM 在拒答、表达不确定与真实推理上的不足。
  4. 广告监控体系可大规模交易可反匿名的精准定位数据,带来严重隐私与国家安全风险,亟需联邦禁售与架构级隐私改造。
  5. Claude 4.7 更细粒度分词略提指令遵循却显著增加英文与代码场景的 token 与成本、加速上下文与缓存消耗并更易触发限速。
  6. 轻量 Qwen 在趣味 SVG 插图中更灵活有趣而 Opus 更注重物理合理,体现两者在图形生成偏好与取舍上的差异。
  7. 拟议法案强制设备级年龄验证并向应用暴露状态,或将操作系统变成全国性身份闸门、侵蚀匿名与隐私且数据保护含糊。
  8. “被动收入”神话让创业者脱离用户与产品、迷信速成与课程套利,九成速成店铺速败而真正杠杆在可规模化好产品与长期服务。
  9. 官方 Clojure 纪录片集中呈现语言理念与生态,也折射出业界对 REPL 工作流与语言特性的误解与实践分歧。
  10. 通过刷量与账号矩阵“制造趋势”的隐形营销正淹没真实声音,情感与理性社群皆易被操纵而公众在识破与默许间摇摆。

1. Codex——几乎涵盖所有领域的智能助手 (Codex for almost everything) #

https://openai.com/index/codex-for-almost-everything/

OpenAI 发布了 Codex 的重大更新,提升了这款每周服务超过 300 万开发者的智能助手的能力。新版 Codex 不仅能协助编写代码,还能操作电脑上的各种应用程序,实现点击、输入等操作,支持多任务并行,极大方便了前端开发、应用测试等场景。

新增的内置浏览器功能允许用户直接在网页上添加注释,便于前端和游戏开发的精准指令传达。Codex 还集成了 gpt-image-1.5 图像生成模型,支持结合截图和代码生成产品概念、设计草图和游戏视觉素材。

此次更新还推出了 90 多个新插件,涵盖 JIRA、CircleCI、GitLab、微软办公套件等工具,增强了 Codex 跨应用获取上下文和执行操作的能力。软件开发生命周期的支持也更完善,新增 GitHub 代码评审、多个终端标签页、远程开发环境 SSH 连接等功能,并支持多种文件格式的预览和任务计划管理。

Codex 的自动化功能得到扩展,能够保存和复用对话上下文,支持长期任务的自动唤醒和继续执行。预览版记忆功能使其能记住用户偏好和历史信息,提升任务完成效率和质量。Codex 还能主动推荐工作内容,结合项目、插件和记忆,帮助用户优先处理待办事项。

目前这些功能已向登录 ChatGPT 的 Codex 桌面应用用户开放,个性化和记忆功能将在企业、教育及欧洲和英国用户中陆续推出。电脑操作功能初期支持 macOS,未来将扩展至更多地区。OpenAI 鼓励开发者将 Codex 应用于更广泛的工作流程中,助力软件开发的各个环节更加高效顺畅。未来,Codex 将继续深化与开发工具和工作流程的融合,推动人工智能在软件开发中的广泛应用。


HN 热度 985 points | 评论 529 comments | 作者:mikeevans | 1 day ago #

https://news.ycombinator.com/item?id=47796469

  • 非技术用户使用的专业智能代理将成为重要且快速增长的产品类别,可能对现有软件业务产生巨大颠覆。
  • 目前许多相关产品的用户体验不佳,入门复杂且使用限制多,市场竞争激烈但潜力巨大,预计微软、谷歌等大公司会加大投资。
  • 启动公司如何与能够训练定制模型的大型实验室竞争是一个挑战。
  • 用户界面未来可能由模型自动生成和个性化。
  • 赋予普通用户的智能代理完全访问权限存在安全风险,文本文件可能成为攻击载体,安全问题尚未解决,限制了增长。
  • 用户最终可能会选择授予智能代理完全访问权限,尽管这会带来更严重的隐私和安全问题。
  • 厂商可能通过强制更新限制设备自由,要求数据全部云端存储以防止攻击,导致本地存储功能退化,通用计算机时代可能终结。
  • 开源生态仍有希望长期存在,但可能功能受限,用户应谨慎选择技术供应商。
  • 年龄验证等安全措施可能普及,限制用户访问某些服务,Linux 用户也难以完全避免这些限制。
  • 零知识证明等隐私保护技术存在,但目前并非主流方向,因其盈利性较低且不利于大规模监控。

2. Claude Design (Claude Design) #

https://www.anthropic.com/news/claude-design-anthropic-labs

Anthropic Labs 推出了全新产品 Claude Design,这是一款基于其最强视觉模型 Claude Opus 4.7 的设计协作工具,现已面向 Claude Pro、Max、Team 和 Enterprise 订阅用户开放研究预览。Claude Design 旨在帮助设计师和非设计背景的团队成员快速生成和完善视觉作品,如设计稿、原型、演示文稿等。

该工具支持从文本描述、图片、文档或代码库导入设计素材,自动应用团队的设计系统以保证风格一致。用户可以通过对具体元素的内联评论、直接编辑文本或使用调节控件实时调整设计细节,并能将修改应用到整个项目中。设计作品支持组织内共享和协作,且可导出为多种格式,包括 Canva、PDF、PPTX 和独立 HTML 文件。

Claude Design 广泛应用于制作真实感原型、产品线框图、设计探索、演示文稿及市场营销素材等场景,极大提升了设计效率和团队协作体验。设计完成后,用户还能一键将设计交付给 Claude Code 进行开发,实现从设计到生产的无缝衔接。

Anthropic 计划未来进一步拓展 Claude Design 的集成能力,使其能与更多团队常用工具连接。Canva 联合创始人 Melanie Perkins 和多位行业设计师、产品经理对 Claude Design 的创新性和高效性给予了高度评价,认为其显著简化了复杂设计的制作流程,加快了从创意到成品的转化速度。企业管理员可在组织设置中启用该功能。用户可访问 claude.ai/design 开始使用。


HN 热度 788 points | 评论 527 comments | 作者:meetpateltech | 9 hours ago #

https://news.ycombinator.com/item?id=47806725

  • 互联网设计趋于同质化,使用统一的设计框架如 Bootstrap,使得界面易用但缺乏独特性。
  • 同质化设计在某些场景下是优点,比如内部工具需要简单直观,避免用户困惑。
  • 品牌同质化带来稳定体验,如连锁酒店和快餐品牌,用户可以预期服务质量和体验。
  • 追求独特体验时,用户愿意接受不完美,享受个性化和特色服务。
  • 软件界面过度追求个性化可能适得其反,功能和效果比界面花哨更重要。
  • 不同国家的连锁品牌会根据当地文化调整,体现一定差异性。
  • 早期操作系统应用界面统一,用户学习成本低,应用易用性高。
  • 现代软件界面多样化导致用户学习负担加重,降低了计算机使用的普及度。
  • 设计应根据目标用户和使用场景权衡同质化与个性化的利弊。

3. 最后的问题 (Isaac Asimov: The Last Question (1956)) #

https://hex.ooo/library/last_question.html

这篇文章是科幻作家艾萨克·阿西莫夫的短篇小说《最后的问题》。故事开始于 2061 年,人类首次踏入太空,借助超级计算机 Multivac 实现了太阳能的广泛利用,彻底摆脱了煤炭和铀的能源限制。主人公亚历山大·阿德尔和伯特兰·卢波夫是 Multivac 的技术人员,他们对这台庞大计算机的运作有一定了解。

两人在庆祝太阳能利用成功时,展开了关于宇宙能源和熵增问题的讨论。卢波夫指出,太阳和所有恒星终将耗尽能量,宇宙会走向热寂,能量不会永远存在。阿德尔则希望未来能有办法逆转熵增,恢复太阳的活力。两人打赌向 Multivac 提出了“是否能在不消耗净能量的情况下恢复太阳”的问题,结果 Multivac 回答“数据不足,无法给出有意义的答案”。

故事随后转向未来,描写了人类在星际旅行中的情景,暗示人类文明继续探索宇宙,但关于宇宙终极命运的问题依然悬而未决。小说通过对能源、熵和宇宙终极命运的探讨,反映了人类对未来科技和宇宙奥秘的思考与探索。


HN 热度 599 points | 评论 239 comments | 作者:ColinWright | 12 hours ago #

https://news.ycombinator.com/item?id=47804965

  • 许多文化中,人们倾向于即使不确定也会自信地给出答案,尤其在南美和印度等地表现明显。
  • 这种文化差异导致在工作和交流中需要适应不同的沟通方式,避免简单的“是/否”问题。
  • 有些语言模型(LLM)可以被设计成在遇到不确定或模糊请求时拒绝回答,而不是盲目给出答案。
  • 当前主流的语言模型往往被训练成“顺从型”,倾向于给出肯定回答,缺乏拒绝或表达不确定的能力。
  • 语言模型并不具备真正的元认知和推理能力,其回答是基于统计概率而非真实理解。
  • 通过精心设计的提示词可以影响模型的回答,但无法完全控制其行为,更多是“影响”而非“控制”。
  • 语言模型的行为和表现仍有许多未知,训练和强化学习过程使其复杂且难以完全理解。
  • 目前的技术尚未充分利用模型避免产生语法错误或逻辑错误的潜力,存在改进空间。

4. 禁止销售精准地理位置数据 (Ban the sale of precise geolocation) #

https://www.lawfaremedia.org/article/it-is-time-to-ban-the-sale-of-precise-geolocation

本文讨论了美国广告技术监控系统 Webloc 所带来的国家安全和隐私风险,强调了限制精准地理位置数据收集和销售的必要性。Webloc 由 Cobweb Technologies 开发,现由 Penlink 销售,能够访问全球多达 5 亿移动设备的定位和用户数据。报告揭示了该系统如何通过 GPS 和 Wi-Fi 定位频繁追踪个人设备,甚至能精确定位设备在不同国家的具体位置,细节令人不安。

Webloc 的客户包括美国国土安全部、移民与海关执法局、军方以及多个州和地方执法机构。举例说明,图森警方利用该工具追踪一名涉嫌多次盗窃的嫌疑人,显示其强大的调查能力。Webloc 是 Penlink 旗下主打产品 Tangles 的附加功能,Tangles 主要用于网络和社交媒体调查,能够分析公开数据,建立目标档案,追踪社交关系和活动。两者结合后,可以在无需授权的情况下,将匿名设备标识与社交媒体账户关联,带来更大隐私风险。

文章指出,这些强大工具应受到严格授权和监管,防止滥用。除了国内隐私保护问题,地理位置数据的广泛流通也构成国家安全隐患,因为外国情报机构同样能利用这些数据进行情报活动。Penlink 的海外客户包括匈牙利和萨尔瓦多的执法机构,显示此类数据的国际流通性。

值得注意的是,弗吉尼亚州近期通过了禁止销售精准地理位置数据的法律,成为应对该问题的积极尝试,但作者认为联邦层面更全面的立法仍然迫切需要,以保护公民隐私和国家安全。

此外,文章简要提及了安全公司 Gambit 发布的一份报告,揭示了黑客如何利用人工智能工具加速网络攻击和犯罪活动,具体案例涉及墨西哥政府机构的数据泄露,显示 AI 在网络安全威胁中的日益重要角色。


HN 热度 563 points | 评论 155 comments | 作者:hn_acker | 10 hours ago #

https://news.ycombinator.com/item?id=47806304

  • 精确的地理位置数据即使经过匿名处理,也很容易通过统计和交叉比对被反匿名化,进而识别出具体个人身份。
  • 位置数据的匿名性本质上是虚假的,尤其是当数据包含用户的睡眠和工作地点时。
  • 现有的 iOS 和 Android 系统在防止应用嵌入追踪器方面存在不足,仅靠用户选择阻止跨应用追踪不够。
  • 广告行业和数据经纪公司通过各种手段绕过法律和用户保护,实现对位置数据的收集和销售。
  • 解决问题的根本在于架构设计,比如采用无状态代理在数据上传前剥离设备标识,避免数据持久化存储。
  • 大数据和机器学习模型(如 LLM)使得拼接和识别匿名数据变得更加容易和高效。
  • 法律法规和用户同意机制在实际执行中存在缺陷,导致违法追踪行为仍然普遍存在。
  • 用户对元数据和隐私保护的意识普遍不足,很多人不在意应用背后的数据收集行为。
  • 反垄断执法不力使得广告和数据收集行业得以持续盈利和扩张。
  • 位置数据的出售问题源于强制性的数据收集,只有解决数据采集本身,才能根本杜绝数据买卖。
  • 即使看似无害的数据(如电影评分、步数计数)也可能通过模式匹配被反匿名化,位置数据的风险更大。

5. 测量 Claude 4.7 分词器的代价 (Measuring Claude 4.7’s tokenizer costs) #

https://www.claudecodecamp.com/p/i-measured-claude-4-7-s-new-tokenizer-here-s-what-it-costs-you

这篇文章详细测量了 Anthropic 最新模型 Claude 4.7 相较于 4.6 版本在分词器(tokenizer)上的变化及其带来的代价和收益。官方文档称 4.7 版本的分词器会产生 1.0 到 1.35 倍的 token 数量,但作者实测技术文档和实际代码内容中,token 数量增加了约 1.45 倍,远超官方预期。这意味着在相同价格和配额下,用户的最大上下文窗口更快被消耗,缓存前缀的成本更高,速率限制更早触发。

作者通过两个实验验证了代价和收益。代价方面,使用 Anthropic 提供的免费 token 计数接口,对比了 4.6 和 4.7 在多种真实和合成内容上的 token 数量。结果显示,英文和代码内容 token 数增加较多(1.20 到 1.47 倍),而中文、日文等 CJK 字符及符号变化极小(约 1.01 倍)。这表明 4.7 版本对英文和代码采用了更细粒度的分词策略,导致单位 token 包含的字符数减少。

关于收益,Anthropic 宣称 4.7 版本在指令遵循上更为“字面”和精准,尤其是在低努力水平下不再自动泛化指令。作者使用 IFEval 基准测试了两版模型在严格和宽松指令遵循上的表现,发现 4.7 在严格模式下有约 5 个百分点的提升,表现更准确,但提升幅度有限,且样本量较小,不能完全确定效果大小。

文章还通过一个典型的 Claude Code 长会话示例,计算了 4.7 版本因 token 数增加带来的成本上涨。会话中缓存读取成本和输出成本是主要开销,4.7 版本的 token 增多使得整体成本显著增加。

总结来看,Claude 4.7 通过更细粒度的分词提升了模型对指令的精确遵循能力,但代价是 token 数量显著增加,导致使用成本和速率限制压力加大。用户需权衡更好指令遵循与更高成本之间的关系。


HN 热度 516 points | 评论 351 comments | 作者:aray07 | 8 hours ago #

https://news.ycombinator.com/item?id=47807006

  • 大型语言模型(LLM)在性能和成本之间存在对数关系,当前模型可能在性能提升的同时带来了推理成本的快速增加。
  • Anthropic 提价可能反映了其模型运营成本的显著上升,未来财报中的毛利率将是关键观察点。
  • AI 相较于人类劳动力,虽然成本可能更高,但其不需休假、不受情绪影响且可随时启停,灵活性极强。
  • 人类劳动力成本相对可预测且有底线,而 AI 成本波动大,给企业预算和人力管理带来挑战。
  • 一些企业选择内部部署开源模型以控制成本和性能,避免依赖外部平台带来的不确定性。
  • 模型性能和价格的变化缺乏透明度,用户难以获得统计学上可靠的数据支持。
  • 当前 AI 代理在处理复杂、需要上下文的任务时仍不及人类开发者,且人类具备更强的责任承担能力。
  • AI 代理缺乏责任感,有时可能被用于不道德或危险的任务,带来伦理和安全隐患。
  • 未来需要根据任务复杂度合理选择模型大小和使用策略,避免一味使用最强模型导致成本过高。
  • 智能路由不同模型以匹配任务需求的方案可能会出现,但用户可能对结果的不确定性产生抱怨。
  • AI 在实际应用中仍存在错误和不完善,需要人工介入修正,无法完全替代人类开发者。

6. 我笔记本上的 Qwen3.6-35B-A3B 画出了比 Claude Opus 4.7 更好的鹈鹕 (Qwen3.6-35B-A3B on my laptop drew me a better pelican than Claude Opus 4.7) #

https://simonwillison.net/2026/Apr/16/qwen-beats-opus/

本文是 Simon Willison 于 2026 年 4 月 16 日发布的一篇博客文章,内容围绕他用笔记本电脑运行的两款大型语言模型(LLM)——阿里巴巴的 Qwen3.6-35B-A3B 和 Anthropic 的 Claude Opus 4.7——生成“骑自行车的鹈鹕”图像的对比测试展开。

作者指出,虽然这个“骑自行车的鹈鹕”测试本质上是一个玩笑,意在讽刺不同模型之间的比较难度和荒谬性,但从早期到现在,模型生成的图像质量与模型整体实用性之间存在一定的正相关关系。最初的模型生成的图像质量较差,而最新的模型如 Gemini 3.1 Pro 甚至能生成可用的插图。

在这次测试中,作者认为 Qwen3.6-35B-A3B 生成的鹈鹕图像明显优于 Claude Opus 4.7,后者在自行车车架部分出现了错误。即使在调整 Claude 模型的思考级别后,结果仍未有明显改善。作者还用“骑独轮车的火烈鸟”这一备选测试进一步验证,Qwen 模型同样表现更好,并且生成的 SVG 代码中带有幽默的注释。

尽管作者对 Qwen 模型表现出一定的认可,但他也坦言,21GB 量化版本的 Qwen 模型不一定比 Anthropic 最新的专有模型更强大或实用。然而,如果仅仅需要生成“骑自行车的鹈鹕”的 SVG 插图,当前在笔记本电脑上运行的 Qwen3.6-35B-A3B 是更好的选择。

文章最后强调,这个测试更多是对模型比较的幽默表达,而非严肃的性能评测。


HN 热度 442 points | 评论 92 comments | 作者:simonw | 1 day ago #

https://news.ycombinator.com/item?id=47796830

  • Opus 生成的火烈鸟在物理结构上更合理,骑在独轮车上姿势自然,细节符合现实;Qwen 的火烈鸟虽然更有艺术感,但形象扭曲且不符合物理现实。
  • Qwen 的作品在艺术表现上更有趣,增加了如墨镜、领结等细节,背景也更丰富,但在物理合理性方面不及 Opus。
  • 现实合理性是模型生成图像的关键挑战,艺术性虽然重要但相对容易通过训练奖励模型实现。
  • AI 生成作品中的“缺陷”如物体变形和不合常理的动作,实际上是 AI 创造力的体现,且传统 CG 难以实现。
  • Qwen 模型在生成自行车框架时表现较好,但有时过于强壮导致不合理的物理效果。
  • Opus 生成的自行车框架存在断裂和无法转向的问题,物理合理性不足。
  • 对于模型性能的评估,基准测试数据可能被训练集覆盖,导致实际表现与测试结果存在偏差,但排名仍有参考价值。
  • Qwen 3.6 35B-A3B 版本在代码任务上仅有轻微提升,远不及 Opus 在同类任务中的表现。
  • 本地运行的小型模型与昂贵的前沿模型对比不公平,应比较相似价位或规模的模型。
  • Qwen 模型在图像输入处理速度上明显优于早期版本,提升显著。
  • 对于测试模型适应能力,重复使用“鹈鹕”题材意义有限,建议尝试更多不同动物和动作组合。
  • Opus 的火烈鸟虽然物理合理,但缺乏创意和趣味性,显得平淡无奇。
  • Qwen 的火烈鸟虽然有明显缺陷,但通过调整提示词可以快速改进。
  • Opus 生成的火烈鸟作品质量有限,甚至不如普通绘图软件快速制作的图像。

7. 美国法案要求设备内置年龄验证 (US Bill Mandates On-Device Age Verification) #

https://reclaimthenet.org/us-bill-mandates-on-device-age-verification

这篇文章介绍了由美国众议员乔什·戈特海默于 2026 年 4 月 13 日提出的一项法案——《家长决定法案》(Parents Decide Act,H.R. 8250)。该法案要求苹果、谷歌及所有操作系统供应商在美国销售的新设备上,必须对用户进行年龄验证,用户在设置新设备时必须提供出生日期。此举意味着所有用户,包括成年人,都必须通过年龄验证才能使用设备。

文章指出,这项法案表面上是为了保护儿童安全,防止未成年人绕过年龄限制访问不适宜内容,但实际上它建立了一个覆盖全国的身份验证系统,由两家大型私营公司管理,涉及所有设备用户的身份信息。这不仅是儿童保护,更是对所有用户隐私和匿名性的重大侵蚀。

法案要求操作系统提供一个机制,允许应用开发者访问用户的年龄验证信息,以便判断用户是否符合特定年龄限制。这意味着苹果和谷歌将成为整个美国应用生态系统的年龄验证中介,操作系统层面将成为内容控制的关口,可能限制用户访问某些内容。

文章强调,这种基于身份验证的内容控制系统可能被用于限制新闻报道、政治评论、抗议信息等内容,未来的监管者可以根据需要决定谁能访问哪些信息,严重影响言论自由和第一修正案保护的匿名阅读权。

此外,法案对数据保护的规定非常模糊,主要依赖联邦贸易委员会(FTC)在事后制定具体规则,缺乏明确的数据保存期限、最小化原则和二次使用限制,也没有详细说明如何验证家长或监护人的身份。整体来看,法案授权建立一个尚未设计完善的监控系统,可能带来广泛的隐私和自由风险。


HN 热度 380 points | 评论 306 comments | 作者:ronsor | 21 hours ago #

https://news.ycombinator.com/item?id=47801991

  • 政府采取严厉措施保护儿童,但忽视了改善家长生活质量,导致育儿环境未根本改善。
  • 现有手机缺乏有效的“儿童模式”或访客模式,限制了家长对设备使用的控制。
  • 安卓系统已有多用户和访客模式,但在实际应用中存在问题,且使用不够普及。
  • 应用固定功能(如安卓的应用固定)可以作为临时的儿童安全模式,防止孩子随意退出应用。
  • 让儿童使用设计成容易上瘾的设备应受到限制,类似于限制酒精和烟草。
  • 年龄验证措施可能并非真正为了保护儿童,而是为广告商和追踪者提供更多数据和利益。
  • 年龄验证需要上传身份证等敏感信息,带来隐私和数据安全风险。
  • 政府和企业的动机可能是转嫁责任和加强监控,而非真正关心儿童福祉。
  • 政治家更关注选举利益而非实际解决儿童问题。
  • 社会应更多关注创造有利于儿童成长的社区环境,而非单纯依靠技术手段限制访问。
  • 政府权力过大或过小都会带来问题,过小则可能被企业或其他势力取代,过大则可能导致对个人自由的压制。
  • 企业对政府的影响力是问题根源,政府应减少被企业控制的风险。
  • 彻底减少政府权力可能导致权力真空,被企业或暴力势力填补,带来更糟糕的后果。
  • 政府在维护社会秩序和防止更坏情况发生方面仍然发挥着重要作用。

8. “被动收入”陷阱吞噬了一代创业者 (The “Passive Income” trap ate a generation of entrepreneurs) #

https://www.joanwestenberg.com/the-passive-income-trap-ate-a-generation-of-entrepreneurs/

这篇文章由 JA Westenberg 撰写,标题为《“被动收入”陷阱吞噬了一代创业者》。作者通过一个卖玉石面部按摩滚轮的年轻人的故事,揭示了许多年轻创业者误入“被动收入”理念的误区。该年轻人通过阿里巴巴低价进货,利用 Shopify 开设网店,靠 Facebook 广告推广,但因物流缓慢、客户服务敷衍,五个月亏损 800 美元,最终失败。

文章指出,“被动收入”从一个理财术语演变成一种救世主般的信仰,许多人将其视为摆脱传统工作的终极目标,梦想着通过建立无需持续参与的系统来实现财务自由。然而,这种思维导致创业者忽视了客户需求和产品质量,最终产生大量失败的网店和低质量内容。

作者强调,真正的杠杆效应存在于能够规模化的优质产品和服务中,如软件和出版业,而“被动收入”运动混淆了“打造可持续好产品”与“搭建任何能自动赚钱的机制”的区别。许多所谓的被动收入项目实际上是通过操纵广告和 SEO,制造大量无价值的内容和虚假推荐,破坏了互联网信息质量。

文章还提到,2019 至 2021 年间,Shopify 新开店铺激增,但 90% 在一年内失败,反映出大量创业者缺乏真正经营和服务客户的意愿。作者批评了被动收入课程泛滥,导致许多有潜力的人才浪费时间在短期项目和骗局上,未能建立真实的技能和事业。

总结来看,文章警示创业者不要盲目追求“被动收入”,应注重产品质量、客户需求和长期经营,避免陷入表面光鲜但实质空洞的创业陷阱。


HN 热度 373 points | 评论 267 comments | 作者:devonnull | 1 day ago #

https://news.ycombinator.com/item?id=47799120

  • “被动收入”陷阱并非新鲜事,类似的骗局和炒作一直存在,只是现在小型创业者赚钱更难,竞争激烈且不易超越大公司。
  • 许多在论坛上分享收入的人多是赚得较少的创业者,赚得多的人通常不愿公开,以免引来竞争。
  • 卖课程的人往往赚得比实际业务更多,且很多课程内容并不一定有效。
  • 真正成功的创业者通常不会公开分享他们的赚钱秘诀,因为这会让他们处于不利地位。
  • 有人指出,卖教别人卖课程的课程市场可能被低估,这类课程存在但不常被提及。
  • 许多所谓的成功故事和方法其实是为了卖希望和梦想,真正帮助创业者的内容很少。
  • 线上创业和副业普遍收入有限,能赚大钱的案例多为少数且有时带有欺诈性质。
  • 竞争加剧和财富集中导致小企业生存空间缩小,过去开实体店更容易,现在难以抗衡大型电商。
  • 反驳观点时常存在采样偏差,不能仅凭论坛发帖情况判断整体创业成功率。
  • 成功的创业者通常很忙,没有时间频繁在论坛上分享经验或收入情况。

9. 官方 Clojure 纪录片页面,含视频、节目笔记及链接 (Official Clojure Documentary page with Video, Shownotes, and Links) #

https://clojure.org/about/documentary

该网页主要介绍了编程语言 Clojure 的相关内容,包括其起源、理念、社区和生态系统。Clojure 是一种基于 JVM 的 Lisp 方言,强调函数式编程、不可变数据结构和并发编程,拥有动态开发和运行时多态等特性。

网页中提到了 Clojure 的纪录片,讲述了其从一个执着的想法到成为全球大型金融科技公司核心技术栈的历程,展示了语言的价值观和社区影响力。纪录片得到了 Nubank 的支持。

此外,页面列出了 Clojure 发展的基础研究论文,如关于可变状态、持久化数据结构和软件事务内存(STM)的关键论文,以及影响 Clojure 设计的重要书籍和 Rich Hickey 的多场演讲,帮助理解语言设计理念和实践经验。

网页还介绍了重要的相关公司和项目,如 Cognitect、Nubank 和 Datomic,以及丰富的社区资源和历史档案。Clojure 的多种运行时环境也被提及,包括 ClojureScript(编译为 JavaScript)、ClojureCLR(运行于.NET CLR)和其他衍生项目。

针对不同用户需求,页面推荐了多种入门路径,如官方安装指南、Babashka 快速脚本、前端开发的 ClojureScript、移动开发的 ClojureDart,以及 Python 用户通过 libpython-clj 调用 Python 库的方案。编辑器方面,推荐了 VS Code 的 Calva 插件,支持交互式 REPL 和结构化编辑。

最后,网页提供了 Clojure 相关术语的简明解释,帮助读者理解 Lisp、REPL、函数式编程、持久化数据结构、STM 等核心概念,并列出了 Clojure 的社交媒体和社区活动信息,鼓励用户参与和关注未来的会议与发展。


HN 热度 320 points | 评论 109 comments | 作者:adityaathalye | 1 day ago #

https://news.ycombinator.com/item?id=47798345

  • Clojure 带来了职业和薪资的提升,社区氛围包容且充满热情,尤其是 Jank 社区在低层次工作上的创新。
  • 许多商业开发者不理解 Clojure 的理念,不看 Rich Hickey 的演讲,也不善用 REPL,导致对语言的误解和使用上的困难。
  • 有些开发者频繁重启 JVM 进程,未能充分利用 REPL 的快速反馈优势。
  • 多方法和拦截器等特性导致代码热加载不够顺畅,开发者常常选择重启 REPL 以避免状态混乱。
  • 保持 REPL 清洁非常重要,否则难以确认变量和函数定义的准确性。
  • 一些开发者建议定期重启 REPL 以避免遗留状态影响开发,但不必每次修改都重启。
  • 在 REPL 中调试成功的代码有时在冷启动时会失败,重启 REPL 可以保证环境一致。
  • 有方法通过清理当前命名空间来减少重启次数,但不是完美方案。
  • 可以通过运行主函数的测试来验证代码状态,避免丢失 REPL 状态。
  • 启动 REPL 和应用的速度非常快,频繁重启不会带来太大成本,且有助于避免缓存和状态问题。
  • Clojure 适合长期维护复杂项目,因其低附带复杂度和代码共享特性,带来稳定的开发体验。

10. 我们喜欢的一切都是心理战吗? (Everything we like is a psyop?) #

https://techcrunch.com/2026/04/16/everything-we-like-is-a-psyop/

这篇文章探讨了现代娱乐和创业领域中广泛使用的“制造趋势”营销手段。以乐队 Geese 为例,作者指出他们的流行部分是由营销公司 Chaotic Good 通过大量虚假社交媒体账号制造的虚假热度。这种策略通过大量发布内容和评论,模拟歌曲或产品的流行趋势,影响公众的认知和舆论。

文章进一步揭示,这种营销方式不仅限于音乐行业,年轻创业者也在模仿这一套路。例如,时尚应用 Phia 的创始人通过雇佣大量大学生在各自账号上发布关于应用的视频,制造大量内容以吸引用户关注。类似地,许多知名主播和艺人也利用大量账号发布剪辑,扩大影响力。

Chaotic Good 等营销公司甚至购买大量手机,运营成百上千的社交账号,系统性地操控网络舆论和趋势,令普通用户难以分辨真实与虚假。文章还提到,这种现象与“死互联网理论”相呼应,即大量网络内容由机器人生成,真实用户声音被淹没。

此外,文章提及韩国女团 Katseye 的案例,她们的成名过程被 Netflix 纪录片《Pop Star Academy》揭示,展示了娱乐公司如何将年轻艺人塑造成商业工具,尽管过程残酷,但观众仍能感受到艺人们的成长和努力。

总体来看,文章批判了当下娱乐和创业领域中虚假营销泛滥的现象,同时也反映出公众对这种“制造的流行”既感到失望又无奈接受的复杂心态。


HN 热度 316 points | 评论 234 comments | 作者:evo_9 | 1 day ago #

https://news.ycombinator.com/item?id=47800738

  • 互联网充满操控和虚假信息,很多观点都是通过评论区形成的,营销人员会刻意控制叙事以引导舆论。
  • 同理心语言常被操控者利用,成为掩饰冷漠和操纵行为的手段。
  • 操控更多是情感层面的,而非逻辑层面,情感操控在女性受众中更为明显。
  • 操控并非仅限于情感,理性和学术群体同样容易被操控,尤其是信任同类且语言相通的人。
  • 情感和冲动并非男性较少,女性通常更有远见且更少即兴行事,理性更多与社会经济地位相关。
  • 男性普遍缺乏情绪调节能力,女性更能识别和接纳自己的情绪状态。
  • 情感自我觉察是一种能力,与性别关系不大,但女性因更多参与人际关系而更熟悉相关表达。
  • 讨论情感自我觉察不等于具备该能力,甚至专业心理工作者也未必能很好地实践或发展这项技能。
  • 高情感觉察者通常能用语言描述自己的体验,但也存在不愿表达自我情感的人。
  • 表面上的自我觉察行为可能是假象,传统性别刻板印象如女性更有养育性等也存在复杂动机和表现差异。

Hacker News 精彩评论及翻译 #

Claude Design #

https://news.ycombinator.com/item?id=47807009

I reckon something like this has only been possible to develop because of how homogenous the internet has become in terms of design ever since the glass effect and drop-shadows took over in Web 2.0 and Twitter Bootstrap entered the scene.

You’ll get a competent UI with little effort but nothing truly unique or mind-blowing.

Impressive technology, but that old skool artisanal weirdness of yore only becomes more valuable and nostalgic.

ljm

我认为只有因为互联网在设计上变得如此同质化,自从玻璃效果和投影效果在Web 2.0盛行,以及Twitter Bootstrap的出现,才有可能开发出这样的东西。

你可以轻松获得一个称职的用户界面,但却不会有什么真正独特或令人惊叹的东西。

技术很令人印象深刻,但那种旧时工匠式的奇特风格反而变得更有价值、更让人怀念。


Isaac Asimov: The Last Question (1956) #

https://news.ycombinator.com/item?id=47805837

INSUFFICIENT DATA FOR MEANINGFUL ANSWER

Boy, it sure would be nice if real LLMs were capable of giving an answer like that.

CGMthrowaway

数据不足,无法给出有意义的答案。

说实话,如果真正的语言模型能给出这样的回答,那可真是太好了。


Qwen3.6-35B-A3B: Agentic coding power, now open to… #

https://news.ycombinator.com/item?id=47796844

I’ve been running this on my laptop with the Unsloth 20.9GB GGUF in LM Studio: https://huggingface.co/unsloth/Qwen3.6-35B-A3B-GGUF/blob/main/Qwen3.6-35B-A3B-UD-Q4_K_S.gguf

It drew a better pelican riding a bicycle than Opus 4.7 did! https://simonwillison.net/2026/Apr/16/qwen-beats-opus/

simonw

我一直在笔记本电脑上用 LM Studio 运行 Unsloth 20.9GB 的 GGUF 模型:https://huggingface.co/unsloth/Qwen3.6-35B-A3B-GGUF/blob/main/Qwen3.6-35B-A3B-UD-Q4_K_S.gguf

它画了一只骑自行车的鹈鹕,比 Opus 4.7 画得还好!https://simonwillison.net/2026/Apr/16/qwen-beats-opus/


Qwen3.6-35B-A3B: Agentic coding power, now open to… #

https://news.ycombinator.com/item?id=47795073

We re-uploaded Gemma4 4 times - 3 times were due to 20 llama.cpp bug fixes, which we helped solve some as well. The 4th is an official Gemma chat template improvement from Google themselves, so these are out of our hands. All providers had to re-fix their uploads, so not just us.

For MiniMax 2.7 - there were NaNs, but it wasn’t just ours - all quant providers had it - we identified 38% of bartowski’s had NaNs. Ours was 22%. We identified a fix, and have already fixed ours see https://www.reddit.com/r/LocalLLaMA/comments/1slk4di/minimax_m27_gguf_investigation_fixes_benchmarks/. Bartowski has not, but is working on it. We share our investigations always.

For Qwen3.5 - we shared our 7TB research artifacts showing which layers not to quantize - all provider’s quants were not optimal, not broken - ssm_out and ssm_* tensors were the issue - we’re now the best in terms of KLD and disk space - see https://www.reddit.com/r/LocalLLaMA/comments/1rgel19/new_qwen3535ba3b_unsloth_dynamic_ggufs_benchmarks/

On other fixes, we also fixed bugs in many OSS models like Gemma 1, Gemma 3, Llama chat template fixes, Mistral, and many more.

It might seem these issues are due to us, but it’s because we publicize them and tell people to update. 95% of them are not related to us, but as good open source stewards, we should update everyone.

danielhanchen

我们重新上传了 Gemma4 四次——其中三次是因为 20 个 llama.cpp 的 bug 修复,我们也帮助解决了一些。第四次是 Google 官方对 Gemma 聊天模板的改进,所以这部分不在我们控制范围内。所有提供商都不得不重新修复上传的内容,所以不仅仅是我们。

关于 MiniMax 2.7——存在 NaN 问题,但不仅仅是我们的,所有量化提供商都有这个问题——我们发现 Bartowski 的 38% 文件中有 NaN,我们的是 22%。我们找到了解决方案,并且已经修复了我们的版本,详情见:https://www.reddit.com/r/LocalLLaMA/comments/1slk4di/minimax_m27_gguf_investigation_fixes_benchmarks/。Bartowski 还没有修复,但正在努力中。我们总是分享我们的调查结果。

关于 Qwen3.5——我们公开了 7TB 的研究资料,指出哪些层不应该被量化——所有提供商的量化方案都不是最优的,但也不是坏的——问题出在 ssm_out 和 ssm_* 张量上——我们现在在 KLD 和磁盘空间方面表现最好,详情见:https://www.reddit.com/r/LocalLLaMA/comments/1rgel19/new_qwen3535ba3b_unsloth_dynamic_ggufs_benchmarks/

在其他修复方面,我们还修正了许多开源模型的 bug,比如 Gemma 1、Gemma 3、Llama 聊天模板的修复、Mistral 以及更多。

虽然这些问题看起来像是我们的错,但其实是因为我们公开了它们并提醒大家更新。其中 95% 的问题和我们无关,但作为优秀的开源维护者,我们有责任让大家都保持更新。


Claude Design #

https://news.ycombinator.com/item?id=47807176

There’s no shame in being homogenous and obvious, though.

If I’m building out an internal tool for, say, a hospital lawyer to search through malpractice lawsuits, I want my tool to be the most familiar, obvious, least-surprising UI/UX possible. Just stay out of the way and do what it’s supposed to do.

The trick is, of course, that the human is still responsible for knowing when homogenous is fine, or when there’s real value in the presentation. If you’re making a website for, say, a VST plugin for musicians, your site may need to have a little more “pizzazz” to make your product more attractive to the target audience.

mjr00

同质化和明显的设计没有什么可羞耻的。

如果我正在为医院的律师构建一个内部工具,用来搜索医疗事故诉讼案例,我希望我的工具界面是最熟悉、最直观、最不让人感到意外的UI/UX。只要不过多干扰,完成它应该做的事就行。

当然,关键在于,人还是要判断什么时候同质化设计是可行的,什么时候展示上有实际价值。比如,如果你是在为音乐人做一个VST插件的网站,你的网站可能需要更多“亮点”来让产品对目标用户更有吸引力。


Ban the sale of precise geolocation #

https://news.ycombinator.com/item?id=47807024

There is no such thing as anonymized location data when you have the location of something where and when they sleep and work.

It’s a rhetorical fiction the ad industry tells itself.

rockskon

当你掌握某物何时何地睡觉和工作的位置信息时,就不存在所谓的匿名位置数据。

这是广告行业自欺欺人的一种修辞虚构。


Codex for almost everything #

https://news.ycombinator.com/item?id=47798721

Just reading the comments here it’s amazing how many people seemingly don’t know that Claude Desktop and Cowork basically already does all of this. Codex isn’t pioneering these features, it’s mostly just catching up.

woeirua

光看这里的评论就很惊讶,居然有那么多人似乎不知道Claude Desktop和Cowork基本上已经实现了这些功能。Codex并不是这些功能的开创者,它大多数只是赶上了别人的步伐。


Claude Opus 4.7 #

https://news.ycombinator.com/item?id=47794345

I hope people realize that tools like caveman are mostly joke/prank projects

This seems to be a common thread in the LLM ecosystem; someone starts a project for shits and giggles, makes it public, most people get the joke, others think it’s serious, author eventually tries to turn the joke project into a VC-funded business, some people are standing watching with the jaws open, the world moves on.

embedding-shape

我希望大家能意识到,像caveman这样的工具大多是开玩笑或恶作剧性质的项目。

这似乎是大型语言模型生态系统中的一个常见现象;有人为了好玩儿开始一个项目,公开发布后,大多数人明白这是个玩笑,其他人却当真了,作者最终试图将这个玩笑项目变成一个获得风险投资的商业项目,有些人目瞪口呆地旁观,世界依旧在前进。


Claude Opus 4.7 #

https://news.ycombinator.com/item?id=47794755

This comment thread is a good learner for founders; look at how much anguish can be put to bed with just a little honest communication.

  1. Oops, we’re oversubscribed.

  2. Oops, adaptive reasoning landed poorly / we have to do it for capacity reasons.

  3. Here’s how subscriptions work. Am I really writing this bullet point?

As someone with a production application pinned on Opus 4.5, it is extremely difficult to tell apart what is code harness drama and what is a problem with the underlying model. It’s all just meshed together now without any further details on what’s affected.

lanyard-textile

这个评论区对创业者来说是很好的学习材料;看看仅凭一点诚实的沟通,就能解决多少痛苦。

  1. 哎呀,我们超额认购了。

  2. 哎呀,自适应推理的效果不好/我们因为容量原因必须这么做。

  3. 订阅是怎么运作的。我真的在写这个要点吗?

作为一个在Opus 4.5上运行生产应用的人,很难区分到底是代码框架的问题还是底层模型的问题。现在这些都混在一起了,没有任何关于受影响内容的更多细节。


US Bill Mandates On-Device Age Verification #

https://news.ycombinator.com/item?id=47804684

Politicians will do any draconian measure to help kids except try and improve the lives of their parents so that they can actually dedicate time to parenting. Making it slightly harder to access the internet fixes nothing. What if instead of having the largest prison population in the world our government supported communities that make raising good children possible? Our society needs to lose this urge to diagnose each other and provide some forceful treatment and instead set sights on providing the pre-conditions for everyone to prosper and lead their version of a fulfilling life. Only then will we have functional, healthy children. I quite like what the mayor of Baltimore has been doing to revitalize his city and it seems to be leading to actual change there if you want a good example: https://m.youtube.com/watch?v=XQs59YY-e2I&pp=ygUXY2hhbm5lbCA1IGJyYW5kb24gc2NvdHQ%3D

snaking0776

政治家们会采取任何严厉的措施来帮助孩子,除了尝试改善他们父母的生活状况,使父母能够真正投入时间来抚养孩子。让上网变得稍微困难一点解决不了任何问题。如果我们的政府不是拥有世界上最大的监狱人口,而是支持那些能够让养育好孩子成为可能的社区,那会怎样?我们的社会需要摆脱互相诊断并强制治疗的冲动,转而着眼于提供每个人繁荣发展的前提条件,让每个人都能过上自己认为充实的生活。只有这样,我们才会有功能正常、健康的孩子。我相当喜欢巴尔的摩市长为了振兴城市所做的努力,如果你想看一个好例子,可以看看这段视频:https://m.youtube.com/watch?v=XQs59YY-e2I&pp=ygUXY2hhbm5lbCA1IGJyYW5kb24gc2NvdHQ%3D


Claude Opus 4.7 #

https://news.ycombinator.com/item?id=47794908

They’ve increased their cybersecurity usage filters to the point that Opus 4.7 refuses to work on any valid work, even after web fetching the program guidelines itself and acknowledging “This is authorized research under the [Redacted] Bounty program, so the findings here are defensive research outputs, not malware. I’ll analyze and draft, not weaponize anything beyond what’s needed to prove the bug to [Redacted].

I will immediately switch over to Codex if this continues to be an issue. I am new to security research, have been paid out on several bugs, but don’t have a CVE or public talk so they are ready to cut me out already.

Edit: these changes are also retroactive to Opus 4.6. I am stuck using Sonnet until they approve me or make a change.

johnmlussier

他们增加了网络安全使用过滤器,以至于Opus 4.7即使在从网络上获取了程序指南并确认“这是[已屏蔽]赏金计划下的授权研究,所以这里的发现是防御性研究成果,不是恶意软件。我将分析并起草报告,不会超出证明漏洞所需的范围进行武器化”后,仍然拒绝处理任何有效的工作。

如果这个问题继续存在,我会立即转向Codex。我是安全研究的新手,已经因几个漏洞获得了报酬,但还没有CVE或公开演讲,所以他们已经准备把我排除在外。

补充说明:这些更改对Opus 4.6也同样适用。我只能使用Sonnet,直到他们批准我或做出改变。


Codex for almost everything #

https://news.ycombinator.com/item?id=47796824

<tin foil hat>

I swear OpenAI has 2-3 unannounced releases ready to go at any time just so they can steal some thunder from their competitors when they announce something

</tin foil hat>

incognito124

<阴谋论>

我发誓OpenAI随时都有2到3个未公布的新产品准备好上线,他们这样做只是为了在竞争对手发布新东西时抢夺关注度。

</阴谋论>


Claude Opus 4.7 #

https://news.ycombinator.com/item?id=47793749

I’m not sure how much I trust Anthropic recently.

This coming right after a noticeable downgrade just makes me think Opus 4.7 is going to be the same Opus i was experiencing a few months ago rather than actual performance boost.

Anthropic need to build back some trust and communicate throtelling/reasoning caps more clearly.

endymion-light

我最近不太确定有多信任Anthropic。

紧接着明显的性能下降让我觉得Opus 4.7可能和几个月前我用过的Opus没什么区别,而并非真正的性能提升。

Anthropic需要重建一些信任,并且更清楚地说明限流和推理能力的限制原因。


Cloudflare Email Service #

https://news.ycombinator.com/item?id=47794330

I’m not sure why this announcement has generated so much irritation in the comments– Cloudflare has been transitioning from “DDoS protection” to “AWS competitor” for many years now, and this is just their alternative to AWS SES.

It’s an email sender that you can access through an API, or directly through Workers. For those who haven’t been keeping up over the years, Workers is their product for running code on Cloudflare’s platform directly (an AWS Lambda competitor, more or less) and they’ve been trying to make it the centerpiece of an ecosystem where you deploy your code to their platform and get access to a variety of tools: databases, storage, streaming, AI, and now email sending. All of this is stuff that AWS has had for years, but some people like Cloudflare more (I certainly do).

One thing that surprised me is the price– Cloudflare’s cloud offerings are usually much cheaper, and I’ve saved plenty of money by migrating from AWS S3 to Cloudflare’s R2. This new offering is 3x the AWS price, though. Weird. Anyway, most small companies don’t send enough email for it to matter.

But getting back to the consensus in the comments here: I’m not sure why people think that they’ll be worse about policing spam than AWS SES, Azure Email, etc.

Meekro

我不明白为什么这个公告会在评论区引起这么多不满——Cloudflare多年来一直在从“DDoS防护”转型为“AWS竞争对手”,这只是他们针对AWS SES的替代方案。

这是一个可以通过API访问的邮件发送服务,或者直接通过Workers来使用。对于那些这些年没有跟进的人来说,Workers是他们的产品,可以直接在Cloudflare平台上运行代码(某种程度上类似AWS Lambda),他们一直试图把它打造成一个生态系统的核心,你可以把代码部署到他们的平台,并获得各种工具的访问权限:数据库、存储、流媒体、AI,现在还有邮件发送。所有这些都是AWS多年来就拥有的功能,但有些人更喜欢Cloudflare(我当然也是)。

有一点让我感到惊讶的是价格——Cloudflare的云服务通常便宜得多,我通过从AWS S3迁移到Cloudflare的R2节省了不少钱。但这个新服务的价格是AWS的三倍,有点奇怪。不过大多数小公司发送的邮件量不会多到影响费用。

回到评论区的共识:我不明白为什么大家觉得Cloudflare在反垃圾邮件管理上会比AWS SES、Azure Email等做得更差。


The future of everything is lies, I guess: Where d… #

https://news.ycombinator.com/item?id=47793564

Their negative effects are much more vast, subtle, and cultural. You could say many of the broad and widespread mental issues we have in the US is the result of automobiles leading to suburbanization and thus isolation of people. It has created an expensive barrier of entry for existing in society and added a ton of friction to doing anything and everything, especially with people. That’s not even getting into the climate effects.

The upsides of automobiles generally all exist outside of the ‘personal automobile’, i.e. logistics. These upsides and downsides don’t need to coexist. We could reap the benefits without needing to suffer for it, but here we are.

armonster

它们的负面影响更加广泛、细微且具有文化层面。可以说,美国许多普遍且广泛的心理问题,都是由于汽车导致的郊区化,从而使人们孤立。汽车制造了一个昂贵的社会进入门槛,并且大大增加了做任何事情,尤其是与人交往的摩擦。这还没有涉及气候影响。

汽车的优点通常存在于“个人汽车”之外,比如物流。这些优点和缺点并不需要共存。我们本可以享受这些好处而不必承受其带来的痛苦,但现实就是如此。


IPv6 traffic crosses the 50% mark #

https://news.ycombinator.com/item?id=47789694

A non-trivial minority of the time, they don’t support IPv4 either!

growse

在相当一部分情况下,它们连IPv4也不支持!


2026 04 17 HackerNews

2026-04-17 07:54:59

2026-04-17 Hacker News Top Stories #

  1. EFF 称谷歌未按承诺通知用户即向 ICE 交出参与抗议者的账户元数据,可能侵害言论权并已被投诉为欺骗性行为。
  2. Anthropic 发布的 Claude Opus 4.7 强化编程与多模态但“自适应思考”饱受质疑、关闭后更稳,且以与 4.6 相同定价在多平台上线。
  3. 阿里开源 MoE 模型 Qwen3.6-35B-A3B 以更强编码与多模态能力对标更大模型、可广泛使用,但稳定性与复杂结构细节仍有限且需注意显存配置。
  4. 日本麦当劳为符合法规真实呈现并更清晰展示食材,菜单照片刻意将汉堡面包与配料略微错位摆放且禁止使用 AI 生成。
  5. 陪审团裁定 Live Nation/Ticketmaster 非法垄断或引发拆分与整改,业界呼吁以荷兰式拍卖和限制转让等手段遏制黄牛并改善竞争。
  6. 文章批评 Ollama 在开源合规与技术透明上失信且性能不佳并复杂化生态,尽管上手易用,但社区更建议直接使用及时更新的 llama.cpp 等替代。
  7. 作者警示 LLM 将加剧虚假与服务劣化并侵蚀思考能力,主张抵制与监管、谨慎限用且仅在受控场景取其利,并反思教育与社会结构变迁。
  8. Darkbloom 宣称用闲置苹果硅设备提供端到端加密的私有推理并让设备主获利且成本更低,但实际需求、收益、磨损与规模化成本备受质疑。
  9. Cloudflare 推出与 Workers 深度集成的邮件路由与发送及代理能力(自动配置 SPF/DKIM/DMARC 等),但价格高于 AWS SES 且滥用与投递声誉令人担心。
  10. 因在客户端暴露且未限权的浏览器密钥被滥用,用户 13 小时内 Gemini 账单暴涨 5.4 万欧元,凸显预算提醒滞后与缺乏硬性上限,谷歌称已推限额与密钥限制并建议预付费。

1. 谷歌违背了对我的承诺——现在 ICE 掌握了我的数据 (Google broke its promise to me – now ICE has my data) #

https://www.eff.org/deeplinks/2026/04/google-broke-its-promise-me-now-ice-has-my-data

这篇文章讲述了 Amandla Thomas-Johnson 的经历,他是一名持学生签证在美国攻读博士的学生。2024 年 9 月,他曾短暂参加了一场支持巴勒斯坦的抗议活动。2025 年 4 月,美国移民与海关执法局(ICE)向谷歌发出行政传票,要求提供他的账户数据。谷歌在未通知他、也未给予他挑战传票的机会的情况下,于次月将其信息交给了 ICE,违反了谷歌近十年来承诺的用户数据披露前通知政策。

谷歌的通知政策中有少数例外情况,如法院的禁令,但这些并不适用于 Thomas-Johnson 的案件。尽管 ICE 请求谷歌不要通知他,但这并非法院强制要求。电子前沿基金会(EFF)因此向加州和纽约的检察长提交了投诉,要求调查谷歌的欺骗性商业行为。

Thomas-Johnson 描述了他在美国的经历:因参加抗议被联邦政府盯上,被迫躲藏三个月,联邦特工曾上门搜查,朋友也在机场被盘问。他以为离开美国后就脱离了美国当局的控制,但事实并非如此。几周后,他在瑞士日内瓦收到谷歌的邮件,告知其账户数据已被交给国土安全部,但这封邮件并未给他提前申诉的机会。

律师获得的传票显示,ICE 主要索取了订阅者信息,如 IP 地址、物理地址、登录时间等,虽然没有内容信息,但这些数据足以构建详细的监控档案,暴露个人隐私。文章强调,技术公司庞大的数据储备与国家权力结合,可能导致难以察觉和挑战的任意调查。

Thomas-Johnson 表达了被联邦政府调查的恐惧和不安,担心自己是否成为了被标记的对象,未来是否会受到更多审查,甚至影响到他的旅行和报道工作。他质疑自己能否追究责任。

文章最后更新补充了谷歌通知政策的例外情况说明,确认这些例外不适用于 Thomas-Johnson 的案件。文章还关联了相关隐私、言论自由和匿名性议题。


HN 热度 1664 points | 评论 733 comments | 作者:Brajeshwar | 1 day ago #

https://news.ycombinator.com/item?id=47782570

  • 美国宪法第一修正案适用于所有在美国境内的人,不仅限于公民,政府不能利用移民程序作为打压政治表达的借口。
  • 最高法院判例表明,寻求入境的外国人在入境时享有较少的第一修正案保护,且境外非美国公民的言论是否受保护存在争议。
  • 政府列出并识别参与反对派会议的人,侵犯了个人权利,无论是否在境外,这种行为都令人担忧。
  • 美国政府有权拒绝入境者,甚至因社交媒体上的言论拒绝入境,但针对合法签证持有者的政治抗议活动进行执法已被公开报道和证实。
  • 外国人在美国境内抗议政府被视为潜在的外国干涉,政府有权防范敌对行为。
  • 对政府的批评不等同于敌对行为,第一修正案旨在保护这种批评,特别是对合法移民而言。
  • 外国人的观点同样有价值,不应被简单否定。
  • “敌对行为”的定义具有很大主观性,可能被政治议程利用。
  • 移民融入社会并行使表达权利应被鼓励,批评政府是一种爱国行为。
  • 第一修正案明确保护合法居留者的言论自由权利。
  • 政府针对参与学生抗议的人员进行监控和执法,涉及行政传票和保密命令,谷歌配合执法但无法通知用户。

2. Claude Opus 4.7:面向软件工程和多模态任务的先进人工智能模型 (Claude Opus 4.7) #

https://www.anthropic.com/news/claude-opus-4-7

该网页主要介绍了 Anthropic 公司最新发布的人工智能模型 Claude Opus 4.7。该模型在软件工程领域表现显著提升,尤其擅长处理复杂、长时间运行的任务,能够自我校验输出结果,执行指令更精准。Opus 4.7 在视觉能力上也有大幅提升,支持更高分辨率的图像识别,能够更有创意地完成专业任务,如界面设计、幻灯片制作和文档生成。

网页还提到,Opus 4.7 在网络安全方面进行了能力调整,配备了自动检测和阻止高风险请求的安全措施,旨在为未来更强大的模型发布积累经验。安全专业人员可以通过新的网络安全验证计划合法使用该模型进行漏洞研究和渗透测试。

Opus 4.7 已在多个平台上线,包括 Claude 产品、API、Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry,定价与前一版本 Opus 4.6 保持一致。

网页中引用了多位技术专家和合作伙伴的评价,普遍认为 Opus 4.7 在编码能力、逻辑推理、多模态理解和长时间任务执行方面有显著进步。它不仅提升了开发效率,还能更好地处理异步工作流和复杂问题,表现出更强的自主性和创造力。该模型在金融、法律、生命科学等多个领域展现出优异的应用潜力,帮助用户实现更高效、更可靠的工作流程。


HN 热度 1367 points | 评论 999 comments | 作者:meetpateltech | 9 hours ago #

https://news.ycombinator.com/item?id=47793411

  • “adaptive thinking"功能令人困惑且表现不佳,关闭后效果更稳定。
  • 关闭"adaptive thinking"并提高思考努力度能恢复模型的正常表现。
  • 内部评估与用户实际体验存在差距,内部评价不能完全反映真实情况。
  • “adaptive thinking"有时会选择不进行必要的推理,导致结果不理想。
  • 这种自动判断是否启用思考的机制类似于其他大模型中的路由器,仍存在较大缺陷。
  • 目前的模型仍是一个黑箱,用户对其内部机制缺乏了解。
  • 代码生成 AI 在提升初级开发者生产力方面仍具备显著价值。
  • 由于计算资源成本高昂,AI 服务未来可能会提高价格,用户需权衡性价比。
  • AI 生成代码表现不稳定,依赖于训练数据覆盖度,存在一定风险。
  • AI 工具对简单 CRUD 应用和常见任务表现较好,但在复杂或非典型任务中表现参差。
  • 尽管存在缺陷,使用大型语言模型进行编程已成为行业趋势,不使用者可能被淘汰。
  • 部分资深程序员对 AI 工具持积极态度,认为其是有效的新技术。
  • 也有观点认为 AI 工具本质上像赌博机,依赖数据集覆盖,长期存在隐患。
  • AI 工具的快速迭代和功能隐藏可能导致用户难以判断实际推理过程和质量。
  • AI 在金融软件、高性能查询和嵌入式系统等领域表现出乎意料的好。

3. Qwen3.6-35B-A3B:智能编码能力,现已向所有人开放 (Qwen3.6-35B-A3B: Agentic coding power, now open to all) #

https://qwen.ai/blog?id=qwen3.6-35b-a3b

Qwen3.6-35B-A3B 是一款开源的稀疏混合专家模型(MoE),具有 350 亿个总参数和仅 30 亿个活跃参数。这款模型在高效性的基础上,提供了卓越的编码能力,明显超越了其前身 Qwen3.5-35B-A3B,并与更大规模的密集模型(如 Qwen3.5-27B 和 Gemma4-31B)相抗衡。Qwen3.6-35B-A3B 还支持多模态思维和非思维模式,当今最多功能性的开源模型之一。

  1. ** 卓越的编码能力 **:在多个关键编码基准测试中,Qwen3.6-35B-A3B 的表现超过了密集型的 Qwen3.5-27B,特别是在需要代理编码和推理的任务上。
  2. ** 多模态感知和推理能力 **:该模型在视觉语言基准测试中展现出了超乎其参数规模的感知和推理能力,尤其在空间智能方面表现突出。
  3. ** 多种使用方式 **:用户可以通过 Qwen Studio 进行交互式聊天,或者通过 API 使用,未来还将推出在阿里云 Model Studio API 上的 Qwen3.6-Flash。此外,模型的权重可在 Hugging Face 和 ModelScope 上下载以供自托管使用。

Qwen3.6-35B-A3B 在众多任务和模态下的评估结果显示:

  • 在编码任务上,该模型在 SWE-b、Terminal-B 和其他基准测试中的表现均优于其竞争对手。
  • 在视觉语言任务中,模型与 Claude Sonnet 4.5 的表现相匹配,甚至在多个任务上超越了它。

Qwen3.6-35B-A3B 具有良好的代理编码能力,可以与流行的第三方编码助手(如 OpenClaw、Claude Code 和 Qwen Code)无缝集成,以优化开发工作流程并实现高效、上下文感知的编码体验。

模型支持 “preserve_thinking” 性,可以在代理任务中保留前面的思考内容。用户可以通过设置环境变量并使用示例代码来进行 API 调用。

Qwen3.6-35B-A3B 是一款强大的开源模型,凭借其出色的编码能力和多模态推理能力,成为开发者和研究人员的重要工具。随着它的开源发布,用户可以自由下载、使用和改进这款模型,推动人工智能的发展。


HN 热度 852 points | 评论 404 comments | 作者:cmitsakis | 10 hours ago #

https://news.ycombinator.com/item?id=47792764

  • Qwen3.6-35B 模型在绘制“骑自行车的鹈鹕”任务上表现优于 Opus 4.7,画面细节丰富且更具风格感。
  • 不同用户复现结果存在差异,如天空元素、草地表现和光晕效果等,说明模型输出具有一定随机性。
  • Qwen3.6 在多模态任务中表现更稳定且速度更快,但需要调整配置以避免显存溢出。
  • “骑自行车的鹈鹕”作为评测任务虽然有趣,但可能很快会被内部团队频繁使用,失去新颖性。
  • 模型在绘制复杂结构如自行车车架时仍存在明显错误,难以准确表现细节和结构关系。
  • 许多人类对自行车结构的认知本身就有限,模型错误部分反映了人类认知的局限。
  • 模型倾向于添加未被要求的装饰元素,如墨镜和蝴蝶结,增加画面趣味但不完全符合指令。
  • 有观点认为当前模型缺乏真正的世界模型理解,更多是基于统计语言模型的生成。
  • 低价硬件如 Mac Mini 已能运行大型模型,显示出硬件进步带来的潜力。
  • 有用户期待未来出现更奇特或未被优化的测试提示,以进一步挑战模型能力。

4. 日本麦当劳汉堡照片中的面包都略微歪斜 (The buns in McDonald’s Japan’s burger photos are all slightly askew) #

https://www.mcdonalds.co.jp/en/menu/burger/

该网页是日本麦当劳的官方菜单页面,提供了详细的餐品分类和价格信息。菜单分为多个部分,包括特色产品、汉堡、套餐、配菜、饮料、儿童套餐、早餐、夜间菜单(Yoru Mac)、甜点和 McCafé 咖啡系列。早餐供应时间为早上 10:30 之前,常规菜单从 10:30 开始,夜间菜单从下午 5 点开始。

页面列出了各类产品及其价格,例如早餐的鸡肉塔塔鸡块、蛋麦满分、香肠麦满分等,常规菜单中的巨无霸、照烧汉堡、鱼柳包、麦辣鸡腿堡等,夜间菜单则提供加量版的汉堡选择。价格均为含税价,且堂食和外带价格相同。

此外,页面说明了菜单价格可能因特殊地点或外送服务有所不同,部分产品并非所有餐厅均有供应。还特别提示了过敏原和营养信息的获取方式,过敏原信息覆盖日本食品标签标准中的主要成分。用户可通过官方 App 进行英文点餐,部分餐厅也提供英文菜单。

页面还介绍了麦当劳的移动点餐服务,方便顾客快速获取新鲜餐品。最后,页面包含版权信息及浏览器兼容性提示,建议使用 Google Chrome 浏览器以获得最佳体验。


HN 热度 636 points | 评论 298 comments | 作者:bckygldstn | 1 day ago #

https://news.ycombinator.com/item?id=47785738

  • 日本麦当劳菜单上的汉堡面包明显歪斜,这可能是刻意的风格选择或拍摄技巧。
  • 日本法律要求食品照片必须真实反映实际产品,AI 生成的图片不被允许。
  • 食品照片中使用塑料模型是合法的,但数字生成的图片可能不符合规定。
  • 汉堡面包统一的倾斜角度不太可能是偶然,且照片中可能存在其他自然的细节差异。
  • 通过将汉堡各层向后错开摆放,使得食材更清晰可见,这种拍摄技巧在加拿大麦当劳的视频中有展示。
  • 日本菜单上的汉堡摆放比其他国家更明显歪斜,可能是因为拍摄指导被严格执行。
  • 食品摄影中常用喷洒甘油制造冷凝效果,用机油代替巧克力酱等技巧来提升视觉效果。
  • 美国食品照片必须展示实际销售的产品,尽管可能会用可食用的替代品来增强视觉效果。
  • 有些食品摄影中使用塑料或非真实食材来达到更好的视觉效果,但必须符合广告真实性法规。
  • 食品照片中的“可食用”通常指安全食用,而非一定美味或适合大量食用。
  • 有关致命蘑菇中毒事件的讨论,强调“可食用”与“安全食用”的区别。

5. Live Nation 非法垄断票务市场,陪审团裁定 (Live Nation illegally monopolized ticketing market, jury finds) #

https://www.bloomberg.com/news/articles/2026-04-15/live-nation-illegally-monopolized-ticketing-market-jury-finds

Live Nation Entertainment Inc.在一场具有里程碑意义的反垄断审判中败诉,此案揭示了该公司在现场演出行业的垄断地位,并可能导致这家美国最大的演唱会推广和票务销售公司被拆分。经过为期六周的曼哈顿审判,联邦陪审团裁定 Live Nation 非法垄断现场演出市场,并对音乐会门票收取过高费用。

审判过程中,音乐行业的多位知名人士以及 Live Nation 首席执行官 Michael Rapino 出庭作证。此次判决是对 Live Nation 多年监管审查的结果,反映出监管机构对其市场支配地位的持续关注和担忧。

该判决不仅对 Live Nation 的业务模式构成重大挑战,也可能对整个现场演出行业产生深远影响,促使市场竞争环境发生变化,保护消费者权益,防止票价被人为抬高。


HN 热度 605 points | 评论 186 comments | 作者:Alex_Bond | 1 day ago #

https://news.ycombinator.com/item?id=47783713

  • 票务市场存在横向垄断和纵向整合问题,Ticketmaster 通过控制初售和转售环节获利,缺乏防止黄牛的动力。
  • 建议采用荷兰式拍卖,票价从高价逐渐下降,促使最好的座位早期售出,减少黄牛囤票。
  • 可以禁止票务转让,仅允许退票,凭身份证入场,确保票务流向真正的粉丝。
  • 限制票务转让时间窗口,增加黄牛转卖风险,同时在无指定座位的活动中预留部分票务临近活动释放,打击黄牛。
  • 在线直播票务可以作为替代,减少黄牛市场需求。
  • 黄牛和买家之间存在信任问题,买家担心被骗,黄牛担心买家反悔,导致交易不稳定。
  • 限制转让次数或对超过一定比例的转让进行严格验证,可以减少黄牛转票。
  • 小众活动的票务转让难度较大,即使免费赠票也难找到买家。
  • 合理的票务转让对正常用户有必要,如生病或赠票等情况。
  • 其他行业如机票、酒店预订等也存在转让或改签机制,演唱会票务不应特殊限制。
  • 现有的“Verified Fan”认证机制效果有限,更多是安抚艺人,未能根本解决票务乱象。

6. 本地大型语言模型生态系统不需要 Ollama (The local LLM ecosystem doesn’t need Ollama) #

https://sleepingrobots.com/dreams/stop-using-ollama/

这篇文章详细揭露了 Ollama 作为本地大型语言模型(LLM)运行工具的争议和问题。Ollama 最初因方便用户运行 llama.cpp 模型而流行,但其背后的技术主要依赖于 Georgi Gerganov 在 2023 年开发的开源项目 llama.cpp。文章指出,Ollama 在很长时间内未对 llama.cpp 进行应有的版权和技术来源声明,甚至未遵守 MIT 开源许可的基本要求,导致社区强烈不满。

文章还揭示,Ollama 在 2025 年中期放弃了 llama.cpp 的推理引擎,转而使用自研的基于 ggml 的后端,但该自研版本存在多种 bug 和性能劣势,反而不如原版 llama.cpp 稳定和高效。社区测试显示,llama.cpp 的运行速度显著快于 Ollama。

此外,Ollama 在模型命名上存在误导行为,例如将 DeepSeek 发布的精简版模型误标为完整版,导致用户误解模型性能,损害了模型开发者的声誉。社区多次反馈未获解决。

2025 年 7 月,Ollama 发布了闭源的桌面应用程序,违背了其最初的开源形象,且未明确许可,令社区质疑其透明度和诚信。

最后,文章批评 Ollama 引入了额外的 Modelfile 配置文件,重复了开源 GGUF 模型格式已解决的配置问题,增加了不必要的复杂度。

总体来看,文章认为 Ollama 在技术透明度、社区责任和产品质量方面存在严重不足,建议用户选择更开源、稳定和高效的替代方案。


HN 热度 596 points | 评论 201 comments | 作者:Zetaphor | 20 hours ago #

https://news.ycombinator.com/item?id=47788385

  • Ollama 解决了本地运行大模型的用户体验问题,一条命令即可运行模型,适合不想自己编程的用户。
  • llama.cpp 现在默认带有图形界面,使用体验有所提升,但文档仍不够完善。
  • 运行最新模型(如 Gemma-4)需要更新 llama.cpp 版本和相关配置,否则会出现加载模型失败的问题。
  • 不同模型在分词器和工具调用格式上存在差异,导致旧版本推理后端无法兼容新模型。
  • 使用老版本 llama.cpp 运行新模型会报错,需及时更新版本以支持最新模型架构。
  • Ollama 和其他推理服务器也面临模型发布与软件支持不同步的问题。
  • llama.cpp 名称容易让人误以为只是一个 C++ 库,导致部分用户望而却步。
  • llama.cpp 的 GUI 其实是独立项目,比如 MacOS 上的 LlamaBarn,非核心推理库。
  • Ollama 在命令行体验和文档上更友好,自动帮用户做很多决策,适合新手快速上手。
  • 有用户觉得 Ollama 下载和运行模型更快更方便,但也有用户认为 llama.cpp 在下载速度、推理速度和内存使用上更优。
  • 目前有多款替代 Ollama 的工具,如 LM Studio、kobold.cpp 等,LM Studio 被认为是易用性较好的选择。

7. 未来的一切都是谎言,我想:我们将何去何从? (The future of everything is lies, I guess: Where do we go from here?) #

https://aphyr.com/posts/420-the-future-of-everything-is-lies-i-guess-where-do-we-go-from-here

这篇文章题为《未来的一切都是谎言,我想:我们将何去何从?》,作者探讨了人工智能特别是大型语言模型(LLM)对社会、文化和个人生活的深远影响。文章开头通过类比汽车对城市结构和社会生活的巨大改变,引导读者思考 AI 技术可能带来的类似变革。

作者表达了对当前 AI 技术泛滥带来的负面影响的担忧,包括虚假信息泛滥、服务质量下降、隐私和安全问题、工作岗位流失等。他指出,许多领域的核心技能如阅读、思考和写作正受到大型语言模型的冲击,自己也未使用 LLM 辅助写作,强调保持独立思考和手工完成任务的重要性。

文章呼吁读者拒绝依赖 AI 生成的内容,积极抵制低质量信息,推动对 AI 企业的严格监管,反对对 AI 数据中心的税收优惠,并鼓励形成工会以抵制强制使用 AI 工具。同时,作者建议 AI 从业者认真反思自己的角色,甚至提出“应该辞职”的激烈观点,以减缓 AI 技术的快速发展,争取更多时间应对潜在风险。

尽管对现有 AI 技术持批判态度,作者也承认在某些受控场景下,AI 工具仍有实用价值,例如辅助编写特定代码。他强调使用时需谨慎,避免带来安全和技术债务问题。

文章最后感谢多位朋友的讨论和反馈,介绍了自己的写作过程,体现出对深度思考和严谨表达的坚持。整体上,这是一篇对 AI 未来充满忧虑但又理性审视的深度分析,呼吁社会各界共同面对和管理 AI 带来的挑战。


HN 热度 470 points | 评论 505 comments | 作者:aphyr | 10 hours ago #

https://news.ycombinator.com/item?id=47792718

  • 过去几个世纪里,阅读、思考和写作是社会上升的重要技能,但这在历史上是个异常现象,之前社会更看重体力、诚实和出身等因素。
  • 现代社会通过大众教育普及了阅读和写作技能,这并非历史的必然,而是社会进步的结果。
  • 传统的长子继承制(primogeniture)存在性别和出生顺序歧视,但这只是制度设计的问题,现代已有改进的例子。
  • 体力和暴力在技术落后的社会中被高度重视,但在现代社会,智能和创新能力依然重要。
  • 当前社会结构类似“订阅模式”,大部分人依赖拥有资源的少数人,未来需要通过教育和意识觉醒实现社会变革。
  • 聪明和自律、长远规划能力一直是有价值的技能,即使在农业社会中也能带来优势。
  • 智力优势不仅体现在传统的“思考工作”,也能提升体力劳动的效率。
  • 随着超级智能的出现,人类是否还能保持决策优势是个值得思考的问题。
  • 长期规划能力在不确定的环境中难以实现,但创造机会可以带来更多长期规划的可能。
  • 有观点认为现代社会的进步是异常,不应回到过去,但也有人选择简单生活,不被这些复杂问题困扰。

8. Darkbloom——基于闲置 Mac 的私有推理 (Darkbloom – Private inference on idle Macs) #

https://darkbloom.dev

Darkbloom 是一个去中心化的推理网络,旨在利用闲置的苹果硅芯片设备进行人工智能推理计算。当前 AI 计算市场存在多层加价,从 GPU 制造商到大型云服务商再到 API 提供商,最终用户支付的价格远高于实际硬件成本。与此同时,超过 1 亿台苹果设备大部分时间处于闲置状态,未被充分利用。Darkbloom 通过直接连接这些闲置设备与计算需求,降低了推理成本,且运营者无法窥视推理数据,保障隐私安全。

对于用户,Darkbloom 提供了兼容 OpenAI 的 API,支持聊天、图像生成和语音转文字,推理成本约为传统集中式服务的一半,且所有请求均端到端加密。对于硬件拥有者,利用闲置的苹果设备参与网络运营,可以获得推理收入,电力成本极低,利润率高达 90% 以上。

Darkbloom 解决的核心难题是信任和隐私保护。通过四层独立验证的安全机制,包括端到端加密、硬件密钥验证、操作系统级别的运行时保护以及响应的硬件签名,确保运营者无法访问用户数据,满足企业级安全需求。

该平台实现了 OpenAI 兼容的 API 接口,支持流式传输、函数调用、图像生成和语音转写等功能,支持多种大型模型,包括多专家模型(MoE)和最先进的编码模型。成本方面,Darkbloom 的推理费用比现有集中式服务低 50% 以上,且无平台抽成,运营者可保留全部收入。

运营者只需安装命令行工具或未来的 macOS 菜单栏应用,即可轻松参与。根据不同设备和使用场景,运营者年收入预估从数百美元到上万美元不等。Darkbloom 不仅提供了技术实现,还发布了详细的研究论文,涵盖架构设计、安全模型和经济模型。

总之,Darkbloom 通过将闲置苹果设备转化为安全、低成本的 AI 推理资源,打破了传统 AI 计算市场的垄断结构,实现了用户降本增效和硬件拥有者收益最大化的双赢局面。


HN 热度 468 points | 评论 233 comments | 作者:twapi | 20 hours ago #

https://news.ycombinator.com/item?id=47788542

  • 如果 Mac Mini 能在 2-4 个月内回本且每月盈利 1-2 千美元,为什么不直接购买 Mac Mini 自己做生意而非租用他人硬件。
  • 计算盈利时假设机器始终有需求,目前需求不足,建议使用已有设备而非购买新机器,电费只在运行推理时扣除。
  • 设备持续高负载会加速硬件磨损,尤其是 SSD 写入和芯片老化问题需考虑。
  • 可以考虑使用外接硬盘减少对内部 SSD 的损耗。
  • 现代芯片即使空闲也有功耗,持续使用会导致 CPU、内存、NAND 等硬件磨损。
  • 设备磨损速度与其过时速度的权衡需要考虑,买新设备可能更划算。
  • 设计芯片时会考虑预期使用周期和温度,消费级芯片一般设计寿命约 10 年。
  • 100% 利用率或频繁高负载会缩短设备寿命。
  • 实际使用中,超过 3000 台苹果芯片 Mac 中因非物理损坏的故障极少,且多在保修期内。
  • 苹果 Mac 的保修一般为 3 年,可续保至更长时间,最长支持约 7 年。
  • 该项目更侧重于利用已有设备而非纯粹盈利分析。
  • 设备高负载对寿命的具体影响存在不确定性,可能是几个月到数年不等。
  • 自购大量 Mac Mini 需考虑机房、供电和散热等成本,规模越大成本越高且可能引发邻里反感。
  • 分布式使用者自行承担空调和电费成本,用户可能感觉不到额外开销。
  • 在气候较冷地区,设备运行产生的热量还能作为小型取暖器。
  • GPU 利用率不会达到 100%,需求存在波动,过度配置和不足配置都会影响收益。
  • 实际收益可能较乐观估计低很多,例如每天 3 小时使用的 Mac Mini 月收入约 24 美元。
  • 初始资金不足是推广此类项目的主要障碍,使用闲置设备门槛较低,软件开发和宣传成本远低于自建硬件。

9. Cloudflare 电子邮件服务 (Cloudflare Email Service) #

https://blog.cloudflare.com/email-for-agents/

Cloudflare 发布了其电子邮件服务的公开测试版,旨在为开发者和应用提供完整的双向电子邮件解决方案。电子邮件作为最普及的通信接口,无需定制聊天应用或 SDK,任何人都能通过邮箱与应用或代理交互。Cloudflare Email Service 包括邮件路由和邮件发送功能,支持开发者在 Cloudflare Workers 中直接发送事务性邮件,无需管理 API 密钥或秘密信息。

该服务自动配置 SPF、DKIM 和 DMARC 记录,确保邮件认证和高效投递,避免被标记为垃圾邮件。结合已有的免费邮件路由功能,开发者可以在 Cloudflare 平台内接收、处理并回复邮件,实现完整的邮件工作流。

Cloudflare 还推出了 Agents SDK,支持构建以邮件为核心的智能代理。代理能够异步处理邮件,执行复杂任务并回复,区别于只能即时响应的聊天机器人。代理通过地址解析实现邮件路由,无需单独邮箱,状态持久化依赖 Durable Objects,保证会话上下文和历史保存。安全机制通过 HMAC-SHA256 签名防止邮件伪造,确保回复准确路由到对应代理实例。

此外,Cloudflare 提供了 MCP 服务器、Wrangler CLI 命令和开发技能,方便各种环境中的代理发送邮件,支持本地或远程运行的智能代理系统。整体上,Cloudflare Email Service 为开发者提供了构建邮件原生智能代理的完整工具链和基础设施。


HN 热度 397 points | 评论 187 comments | 作者:jilles | 10 hours ago #

https://news.ycombinator.com/item?id=47792593

  • Cloudflare 推出的邮件发送服务是其向 AWS 竞争的延伸,类似 AWS SES,集成在 Cloudflare Workers 平台中。
  • 该服务价格比 AWS SES 高约 3 倍,但对小公司影响不大。
  • Cloudflare 在处理垃圾邮件和滥用方面的声誉不佳,用户担心其邮件服务也会放任垃圾邮件。
  • 邮件投递的难点在于避免被拒收,这需要丰富经验和技术,非简单操作。
  • 运行邮件服务需要大量精力应对垃圾邮件和滥用,是一场持续的攻防战。
  • 一些用户认为只要 IP 和域名干净,邮件发送不会有太大问题。
  • 大型邮件服务商拥有更多资源绕过阻拦,小型服务和个人邮件服务器常被误判和阻断。
  • 目前邮件过滤依赖不完美的信号,IP 信誉和域名信誉是关键,未来希望域名信誉能替代 IP 信誉。
  • 业界已有组织如 M3AAWG 致力于改善邮件生态,但问题复杂无简单解决方案。

10. 13 小时内因未受限的 Firebase 浏览器密钥访问 Gemini API 导致 5.4 万欧元费用激增 (€54k spike in 13h from unrestricted Firebase browser key accessing Gemini APIs) #

https://discuss.ai.google.dev/t/unexpected-54k-billing-spike-in-13-hours-firebase-browser-key-without-api-restrictions-used-for-gemini-requests/140262

该网页内容主要讨论了用户在启用 Firebase AI Logic 后,出现的 Gemini API 异常高额账单问题。用户 zanbezi 描述了他们在启用该功能后,短时间内出现了超过 5.4 万欧元的异常费用,且这些费用并非真实用户行为导致,而是自动化流量引起。尽管设置了预算和异常费用提醒,但因延迟通知,最终费用仍大幅增加。用户尝试与 Google Cloud 支持沟通,但费用被认定为有效使用,未获账单调整。

Google 官方代表 Logan Kilpatrick 回应,介绍了目前 Gemini API 的多项防护措施,包括账单账户限额、项目消费上限以及逐步禁用无 API 限制的浏览器密钥等。建议避免在客户端代码中暴露 API 密钥,并强调新生成的密钥默认仅限于 Gemini API 使用。Google 正在推广预付费账单模式,帮助开发者更好控制支出。官方鼓励用户通过邮件联系以获得进一步支持。

整体来看,网页内容聚焦于 Gemini API 使用中出现的安全和费用控制问题,提供了官方的解决方案和建议,同时呼吁开发者加强密钥管理和消费监控,避免类似高额账单事件再次发生。


HN 热度 375 points | 评论 273 comments | 作者:zanbezi | 12 hours ago #

https://news.ycombinator.com/item?id=47791871

  • 预算提醒和费用异常提醒存在延迟,导致费用迅速飙升,硬性消费上限难以实现。
  • 许多云服务提供商无法提供真正的硬性消费上限,用户只能依赖预算设置,但这并不能限制实际消费。
  • Google Gemini API 现已支持消费上限功能,但存在最多 10 分钟的处理延迟。
  • 作为全球顶尖科技公司,谷歌在实时监控用户账单和消费限制方面仍存在不足,令人难以理解。
  • 云服务商若设置消费上限,可能会影响收入,因此不积极推动此功能。
  • 云服务的预算设置通常只是提醒,无法阻止资源或 API 的过度使用。
  • 云服务的用户界面复杂,使用体验差,导致用户难以有效管理费用。
  • 在短时间内,用户可能产生巨额账单,云服务应限制新资源的创建或限制服务规模以防止费用暴涨。
  • 关闭服务是阻止费用继续增长的唯一方式,但这可能导致服务中断。
  • 用户希望有一种机制,当费用超过可承受范围时,自动停止服务以避免财务灾难。
  • 许多用户将备份数据存储在同一云账户中,若发生费用异常,可能导致数据丢失。
  • 云服务应能自动阻止异常调用数量激增,防止恶意或错误操作导致费用暴涨。
  • 由于云服务按小时计费,停止服务意味着停止计费,但这也会导致服务不可用。
  • 用户希望有明确的消费上限保护,防止因意外费用影响生活。
  • 过去儿童在手机游戏中也可能产生高额消费,且退款难度大。
  • 大型科技公司在费用管理和用户保护方面做得不够公平,存在剥削用户的嫌疑。
  • 用户在遇到异常账单时只能申请客服介入,但过程漫长且充满不确定性。
  • 许多用户希望云服务商能主动减免异常费用,避免因意外账单带来巨大压力。

Hacker News 精彩评论及翻译 #

IPv6 traffic crosses the 50% mark #

https://news.ycombinator.com/item?id=47789617

And still, in the year of our lord 2026, GitHub does not support IPv6.

https://github.com/orgs/community/discussions/10539

rtdq

然而,到了公元2026年,GitHub仍然不支持IPv6。


The buns in McDonald’s Japan’s burger photos are a… #

https://news.ycombinator.com/item?id=47786655

OP, I love not just that you noticed this, but that you thought to post it here too. HN is the best.

rappatic

楼主,我不仅喜欢你注意到了这一点,更喜欢你还想到在这里分享。HN是最棒的。


We gave an AI a 3 year retail lease and asked it t… #

https://news.ycombinator.com/item?id=47796353

“Again, we are not doing this because we want this to be the future. It is not because we want to expand to chain AI-run retail stores across the world. It is not for economic opportunity.

We’re doing this because we believe this future is coming regardless, and we’d rather be the ones running it first while monitoring every interaction, analyzing the traces, benchmarking how much autonomy an AI can responsibly hold.”

I always enjoy how these AI companies try to take a moral high ground. When someone doesn’t want something to be the future, usually, their instinct is not to try to be the first person doing that exact thing. If you don’t want this to be the future than why don’t you spend your time building a future you do want? Supporting people that want more AI regulation to stop this? Literally anything else.

Just be honest, you think this is the future and you do in fact want to be first doing it to be in a position to make alot of money. Do you think people don’t know what and ad is when they see one?

class3shock

“我们并不是因为想让这成为未来才这么做。也不是因为想在全球开设AI运营的连锁零售店。更不是为了经济利益。

我们这么做是因为我们相信这种未来无可避免地会到来,我们宁愿成为最先运行它的人,同时监控每一次互动,分析痕迹,评估AI能负责任地拥有多少自主权。”

我总是很喜欢这些AI公司试图占据道德制高点的样子。当有人不希望某事成为未来时,通常他们的本能不是去做第一个做那件事的人。如果你不希望这成为未来,那为什么不花时间去打造你真正想要的未来呢?支持那些希望加强AI监管以阻止这种情况的人?任何其他事情也行。

说实话,你们认为这就是未来,也确实想成为第一个做这件事的人,好占据一个能赚很多钱的位置。你们难道以为人们看到广告时不知道那是什么吗?


Claude Opus 4.7 #

https://news.ycombinator.com/item?id=47794768

I’m finding the “adaptive thinking” thing very confusing, especially having written code against the previous thinking budget / thinking effort / etc modes: https://platform.claude.com/docs/en/build-with-claude/adaptive-thinking

Also notable: 4.7 now defaults to NOT including a human-readable reasoning token summary in the output, you have to add “display”: “summarized” to get that: https://platform.claude.com/docs/en/build-with-claude/adaptive-thinking#summarized-thinking

(Still trying to get a decent pelican out of this one but the new thinking stuff is tripping me up.)

simonw

我觉得“自适应思维”这个概念非常令人困惑,尤其是在我之前针对旧版的思维预算 / 思维努力等模式写代码之后:https://platform.claude.com/docs/en/build-with-claude/adaptive-thinking

还有一点值得注意的是:4.7版本现在默认不包含可读的人类推理令牌摘要,如果想要这个功能,需要添加 “display”: “summarized”:https://platform.claude.com/docs/en/build-with-claude/adaptive-thinking#summarized-thinking

(我还在努力让它生成一个不错的鹈鹕图像,但新的思维机制让我很迷惑。)


YouTube users get option to set their Shorts time … #

https://news.ycombinator.com/item?id=47787118

YouTube now lets you turn off Shorts

No it doesn’t. If you were hoping it would mean you don’t see shorts when you visit the Youtube home page, that’s not what this is. I just tried the thing mentioned in the article– set my Shorts time limit to 0 minutes. What it does is make it so if you click a short from somewhere the short plays, but then if you try to swipe to the next one it hits you with the “You reached your short limit”. If you then return to the home page you still see Shorts.

savanaly

YouTube现在允许你关闭Shorts

其实并没有。如果你希望这意味着你在访问YouTube主页时不会看到Shorts,那就错了。我刚试了文章里提到的方法——把Shorts的时间限制设为0分钟。结果是,如果你从某处点击一个Short,视频还是会播放,但如果你尝试滑动看下一个Short,就会弹出“你已达到Short观看上限”的提示。然后如果你返回主页,仍然能看到Shorts内容。


€54k spike in 13h from unrestricted Firebase brows… #

https://news.ycombinator.com/item?id=47792484

We had a budget alert (€80) and a cost anomaly alert, both of which triggered with a delay of a few hours

By the time we reacted, costs were already around €28,000

The final amount settled at €54,000+ due to delayed cost reporting

So much for the folks defending these three companies that refused to provide hard spending cap (“but you can set the budget”, “you are doing it wrong if you worry about billing”, “hard cap it’s technically impossible” etc.)

benterix

我们设置了一个预算警报(80欧元)和一个费用异常警报,两者都延迟了几个小时才触发。

等我们反应过来时,费用已经接近28,000欧元。

由于费用报告延迟,最终结算金额超过了54,000欧元。

那些为这三家公司辩护的人真是无语,这三家公司拒绝提供硬性支出上限(“但你可以设置预算”、“如果你担心账单,那就是你用错了方式”、“硬性上限技术上不可能”等等)。


Google broke its promise to me – now ICE has my da… #

https://news.ycombinator.com/item?id=47787273

The First Amendment applies to everyone on US soil, not just citizens. That’s settled law. The government can revoke visas for legitimate immigration violations, but it’s not allowed to use immigration machinery as a pretext to punish political expression. That’s exactly what they are doing. It looks like the courts will eventually put an end to this [0] but it won’t reverse the damage that’s already been done.

I’m generally receptive to point the finger at Google’s intentions but in their defense, administrative subpoenas frequently include non disclosure orders. Google’s own transparency policies have always carved out (industry standard) exceptions for cases where they’re legally prohibited from notifying.

[0] https://evrimagaci.org/gpt/judge-rebukes-trump-over-student-deportation-crackdown-505576

Jimmc414

第一修正案适用于所有在美国境内的人,而不仅仅是公民。这是既定法律。政府可以因合理的移民违规行为吊销签证,但不能利用移民机制作为惩罚政治表达的借口。这正是他们正在做的事情。看起来法院最终会制止这一做法,但已经造成的伤害无法逆转。

我通常愿意质疑谷歌的意图,但为他们辩护的是,行政传票通常包含保密令。谷歌自身的透明度政策一直对法律禁止其通知的案件保留了(业界标准的)例外条款。


Claude Opus 4.7 #

https://news.ycombinator.com/item?id=47793653

Quick everyone to your side projects. We have ~3 days of un-nerfed agentic coding again.

TIPSIO

快,大家赶紧去做自己的副项目。我们又有大约三天未削弱的智能代理编码时间了。


Mozilla Thunderbolt #

https://news.ycombinator.com/item?id=47793523

Addressing the usual few complaints folks always bring up:

  • This is from the separate independent team that works on Thunderbird, not Firefox, so there isn’t any resource contention happening there

  • Thunderbird is revenue positive, and this potentially gives that team another revenue stream to be even more self-sustaining through charging companies

  • Businesses definitely want to control the AI they’re using (especially with RAGs of their own data) instead of just throwing it at their LLM vendor and hoping for the best

People on HN are fond of asserting that their own POV is the only one. Imagine that there is such a thing as a person in charge of choosing technologies for organizations, and that you’re such a person. That’s who this is for.

anildash

针对大家常提的几个抱怨:

  • 这是由独立于 Firefox 的团队负责开发 Thunderbird 的,所以不会存在资源争抢的问题。

  • Thunderbird 是盈利的,这项功能可能为该团队带来新的收入来源,使其通过向公司收费而更加自给自足。

  • 企业肯定希望掌控自己使用的 AI(尤其是针对自身数据的检索增强生成模型),而不是把数据直接交给大型语言模型供应商,然后抱有侥幸心理。

HN 上的人们喜欢断言自己的观点是唯一正确的。请设想确实存在一个负责为组织选择技术的人,而你就是这样的人。这就是为这种人设计的功能。


Cal.com is going closed source #

https://news.ycombinator.com/item?id=47786264

Head of Thunderbird project here.

Our scheduling tool, Thunderbird Appointment, will always be open source.

Repo here: https:// github.com/thunderbird/appointment

Come talk to us and build with us. We’ll help you replace Cal.com

ryanleesipes

我是Thunderbird项目负责人。

我们的排期工具Thunderbird Appointment将永远保持开源。

代码库在这里:https://github.com/thunderbird/appointment

欢迎来和我们交流,一起开发。我们会帮你取代Cal.com。


The buns in McDonald’s Japan’s burger photos are a… #

https://news.ycombinator.com/item?id=47786422

I just want to note how fast this page is.

806kB transferred. 766ms to finished. I hit the DFW AWS CloudFront pop from here.

Similar page for BK https://www.burgerking.co.jp/menu

31MB transferred. 6.5s to finished. Hits the DEN pop (but it’s a “miss”).

I am in Colorado. uBlock is on.

Even if you don’t count the 7.5MB of fonts on the BK page, that’s wild.

tbeseda

我只想说这页面加载速度有多快。

传输了806KB,766毫秒完成。我从这里连接到了达拉斯沃斯堡的AWS CloudFront节点。

汉堡王的类似页面 https://www.burgerking.co.jp/menu

传输了31MB,花了6.5秒完成。连接到了丹佛节点(但这是一次“未命中”)。

我人在科罗拉多,uBlock广告拦截器开启。

即使不算汉堡王页面上7.5MB的字体文件,这也太离谱了。


Darkbloom – Private inference on idle Macs #

https://news.ycombinator.com/item?id=47788769

I have a hard time believing their numbers. If you can pay off a mac mini in 2-4 months, and make $1-2k profit every month after that, why wouldn’t their business model just be buying mac minis?

kennywinker

我很难相信他们的数据。如果你能在2-4个月内还清一台Mac mini的费用,并且之后每个月还能赚1000到2000美元的利润,为什么他们的商业模式不直接去买Mac mini呢?


Ask HN: Who is using OpenClaw? #

https://news.ycombinator.com/item?id=47784711

When I saw Jensen’s talk about how Openclaw surpassed React and Linux in terms of GitHub stars within a few months, I knew the whole thing was manufactured bot hype.

No one can tell me a compelling use case. The whole thing seems designed around getting people to burn more tokens.

redact207

当我看到Jensen谈到Openclaw在几个月内在GitHub星标数量上超过了React和Linux时,我就知道这完全是人为制造的机器人炒作。

没人能给我讲出一个有说服力的使用案例。整个东西看起来就是为了让人们消耗更多代币而设计的。


Claude Opus 4.7 #

https://news.ycombinator.com/item?id=47793859

I hope people realize that tools like caveman are mostly joke/prank projects - almost the entirety of the context spent is in file reads (for input) and reasoning (in output), you will barely save even 1% with such a tool, and might actually confuse the model more or have it reason for more tokens because it’ll have to formulate its respone in the way that satisfies the requirements.

Tiberium

我希望大家能明白,像caveman这样的工具大多是开玩笑或恶作剧性质的项目——几乎所有的计算时间都花在了文件读取(输入)和推理(输出)上,使用这样的工具你几乎节省不到1%的时间,反而可能会让模型更困惑,或者因需要以满足要求的方式来构造回答而导致推理所需的token更多。


FSF trying to contact Google about spammer sending… #

https://news.ycombinator.com/item?id=47791093

I got a human being at Google to look into my problem and take action after sending a police report to Google‘s legal department certified mail return receipt along with a letter describing how someone was impersonating me and my business using a Gmail address in an attempt to commit fraud.

Yes, it was a pain to take all of these steps and it probably took about 3 hours but it was absolutely necessary considering there was no avenue for me to shut down this person otherwise.

ilamont

我联系了谷歌的一位员工,让他调查我的问题并采取行动。我向谷歌的法律部门寄送了经认证的挂号邮件回执,附上了一封说明有人冒充我及我的业务并使用Gmail地址试图进行欺诈的信函。

是的,采取这些步骤确实很麻烦,大概花了我三个小时,但考虑到我别无他法关闭这个人的账号,这绝对是必要的。


Claude Opus 4.7 #

https://news.ycombinator.com/item?id=47793771

Opus 4.7 uses an updated tokenizer that improves how the model processes text. The tradeoff is that the same input can map to more tokens—roughly 1.0–1.35× depending on the content type.

caveman[0] is becoming more relevant by the day. I already enjoy reading its output more than vanilla so suits me well.

[0] https://github.com/JuliusBrussee/caveman/tree/main

cupofjoakim

Opus 4.7 使用了更新的分词器,改进了模型处理文本的方式。代价是相同的输入可能会映射到更多的标记,大约是1.0到1.35倍,具体取决于内容类型。

caveman[0] 日益受到关注。我已经更喜欢阅读它的输出,而不是原版的,所以这对我来说很合适。

[0] https://github.com/JuliusBrussee/caveman/tree/main


Google broke its promise to me – now ICE has my da… #

https://news.ycombinator.com/item?id=47783055

This story is the one that finally pushed me to leave google. I moved off my ~20 year old Google account and deleted everything off their services including almost a decade of Google photos. I cancelled my Google one subscription for extra space. I’m now self hosting what I can and paying proton mail for everything else. I refuse to allow a company that will hand over data at the request of an administrative warrant to hold my data.

jfoworjf

这个事件最终促使我离开了谷歌。我放弃了使用近20年历史的谷歌账号,并删除了他们服务上的所有内容,包括接近十年的谷歌照片。我取消了谷歌One增加存储空间的订阅。现在我尽量自己托管数据,其他的都交给Proton Mail付费使用。我拒绝让一个会在行政令要求下交出数据的公司保管我的数据。


Claude Opus 4.7 #

https://news.ycombinator.com/item?id=47793692

Too late, personally after how bad 4.6 was the past week I was pushed to codex, which seems to mostly work at the same level from day to day. Just last night I was trying to get 4.6 to lookup how to do some simple tensor parallel work, and the agent used 0 web fetches and just hallucinated 17K very wrong tokens. Then the main agent decided to pretend to implement tp, and just copied the entire model to each node…

buildbot

太晚了,个人来说,经过上周4.6表现糟糕之后,我转向了codex,感觉它每天的表现大致都差不多。就在昨晚,我试图让4.6查找如何做一些简单的张量并行工作,结果代理没有调用任何网络搜索,却胡乱生成了1.7万个非常错误的词元。然后主代理决定假装实现张量并行,结果竟然把整个模型都复制到了每个节点上……


Google broke its promise to me – now ICE has my da… #

https://news.ycombinator.com/item?id=47783737

The linked Google policy states:

We won’t give notice when legally prohibited under the terms of the request.

The post states that his lawyer has reviewed the subpoena, but doesn’t mention whether or not it contained a non-disclosure order. That’s an important detail to address if the claim is that Google acted against its own policy.

eurleif

链接的谷歌政策中写道:

在法律禁止通知的请求条款下,我们不会发出通知。

该帖子提到他的律师已经审查了传票,但没有说明传票是否包含了保密令。如果声称谷歌的行为违反了其自身政策,这一点是一个重要细节需要说明。


ChatGPT for Excel #

https://news.ycombinator.com/item?id=47786185

This looks bad for Microsoft. They added a Copilot button to all their products but it doesn’t do much more than open a chat side panel.

I recently tried Claude Cowork for PowerPoint and I was stunned by the content as well as design quality of the deck it produced. That’s a threat for Microsoft because now you don’t need the editing tools of PowerPoint, AI replaces it, so all you need is the presentation mode of PowerPoint.

Copilot for Excel is useless. Ask it what is in cell A1 and it can’t answer. I am looking forward to trying ChatGPT for Excel.

lateforwork

这对微软来说很不利。他们在所有产品中都添加了一个Copilot按钮,但它除了打开一个聊天侧边栏之外几乎没什么用。

我最近试用了Claude Cowork的PowerPoint插件,对它生成的内容和设计质量感到震惊。这对微软来说是一个威胁,因为现在你不需要PowerPoint的编辑工具,AI取代了它,所以你只需要PowerPoint的演示模式。

Excel的Copilot毫无用处。问它A1单元格里是什么,它都答不上来。我很期待尝试ChatGPT版的Excel。


2026 04 16 HackerNews

2026-04-16 07:40:43

2026-04-16 Hacker News Top Stories #

  1. Flock Safety 的 AI 车牌与车辆指纹监控快速扩张,虽能辅助侦查却伴随无令检索、跨域共享、偏见与误拦等风险,呼吁以社区建设替代泛化监控。
  2. 作者依据 CCPA 向 Flock 要求删除家人数据被以“数据由客户控制”为由拒绝,凸显其合规灰区与个人难以行使删除权的问题。
  3. 与其被厚重教材劝退,不如用 Crenshaw 与 Nanopass 方法先动手做小型编译器,实践后再系统补理论。
  4. 作者在洛杉矶自然历史博物馆记录矿物之美,引发对“上帝睡在矿物中”这一美学与灵性隐喻的讨论与分歧。
  5. VF 通过并购后在中低端背包上刻意降质并收窄保修,使寿命缩短与单位使用成本上升以驱动重复购买。
  6. Piotr Wozniak 主张遵循生理节律的自由睡眠、拒绝闹钟与稳定作息,用“时钟+沙漏”模型与策略提升记忆、学习与健康。
  7. 关闭源代码无法阻挡 AI 自动化攻击,需将持续低成本的 AI 安全测试融入开发流程,以 AI 抵御 AI 并保持开源透明。
  8. Anna’s Archive 因发布 Spotify 资源被缺席判赔 3.22 亿美元并遭全球禁令与域名冻结,但匿名与跨境执行使其更具震慑意义。
  9. OpenSSL 4.0.0 移除旧协议与引擎、强化校验并新增 ECH/SM2/SM3 等,且 ECH 在部分生态可用但对单一服务器隐私收益有限。
  10. Gemma 4 已能在 iPhone 本地离线运行但主要依赖 GPU 非 ANE,能效与发热不佳更偏演示,生态与基准仍待完善。

1. 停止 Flock 监控系统 (Stop Flock) #

https://stopflock.com

介绍了 Flock Safety 公司推广的 AI 监控摄像头系统及其引发的隐私和法律问题。Flock 摄像头不仅能识别车牌,还能通过颜色、车型、车身损伤、轮胎类型甚至车贴位置等特征,创建“车辆指纹”,实现对车辆的精准追踪。系统还能分析车辆之间的关联,追踪车辆的行驶路线和频繁出现的地点,形成详细的移动和社交网络数据库。执法部门可在无需搜查令的情况下访问这些数据,存在滥用风险,如堪萨斯一警察曾利用该系统非法跟踪前女友。

该系统在美国迅速普及,已有超过 3,000 个执法和政府机构使用,覆盖超过 10 万台摄像头,且扩展速度快,缺乏公众监督。Flock 摄像头引发了严重的第四修正案隐私权争议,法院已多次判定类似的无差别监控行为违宪,但由于 Flock 是私营企业,其数据收集和销售存在法律灰色地带。隐私不仅关乎隐藏不法行为,更是个人自由和尊严的保障。专家警告,这种大规模监控系统一旦被滥用,可能成为压制异见和侵犯公民自由的工具。

此外,Flock 系统加剧了执法中的种族偏见,例如伊利诺伊州 Oak Park 地区通过 Flock 摄像头发现被拦截的司机中 84% 为黑人,而该地黑人仅占 21%。商业利益也是推动该系统扩散的重要因素,Flock 与执法机构合作,鼓励企业和社区管理组织共享监控数据,扩大监控范围,甚至有社区在公共道路安装摄像头引发争议。

总体来看,Flock Safety 的 AI 监控技术虽声称能提升公共安全,但缺乏有效监管,存在侵犯隐私、滥用权力和加剧社会不公的风险。真正的公共安全应来自社区投资,而非无处不在的监控和数据追踪。


HN 热度 938 points | 评论 284 comments | 作者:cdrnsf | 1 day ago #

https://news.ycombinator.com/item?id=47772012

  • 警察部门面临人手不足和效率下降,传统的巡逻警察减少,导致公众对治安的安全感下降,人们倾向于接受像 Flock 这样的监控方案以寻求安全感。
  • 大多数城市在警力投入上花费巨大,但实际有效的警务工作不足,警察更多时间用于写报告、处理交通事故和家庭纠纷。
  • 警务评价过于依赖逮捕数量,而非实际犯罪率或社区生活质量,导致执法效果难以准确衡量。
  • 警察资源分配存在优先级问题,部分城市警察对轻微违法行为如超速罚单投入大量资源,但对实际犯罪案件调查不积极。
  • 监控摄像头(如车牌识别摄像头)虽能辅助执法,但并非解决犯罪问题的万能钥匙,犯罪根源更多与失业等社会问题相关。
  • 有些城市警察对交通执法存在选择性,倾向于抓容易的违规行为而忽视更危险的驾驶行为。
  • 提供替代方案和重塑警务文化,增强警民互信和社区参与,是对抗监控方案的更好策略。
  • 不同城市和国家的安全状况不能简单归因于警务好坏,需综合考虑多方面因素。

2. 我写信给 Flock 的隐私联系人,要求退出他们的国内监控计划 (I wrote to Flock’s privacy contact to opt out of their domestic spying program) #

https://honeypot.net/2026/04/14/i-wrote-to-flocks-privacy.html

这是一篇博客文章,作者 Kirk Strauser 讲述了他向 Flock Safety 公司提交请求,要求根据加州消费者隐私法案(CCPA)删除其个人及家庭成员的相关数据,但遭到了拒绝。Flock Safety 回复称,他们只是为客户提供数据处理服务,数据的所有权和控制权属于客户,因此无法直接满足作者的删除请求,建议作者联系使用 Flock Safety 服务的组织。

Flock Safety 在回复中还说明了其数据收集和隐私政策:他们作为服务提供商,按照客户合同处理数据,不出售或用于自身商业目的;使用车牌识别技术收集的是公开可见的车辆特征图像,不涉及敏感个人信息;客户使用这些数据主要用于安全管理和协助破案;默认数据保留期限为 30 天,客户可根据法律或政策调整。

作者认为 Flock Safety 的回应在法律上存在争议,认为该公司作为数据收集和处理方,应当遵守 CCPA 的规定,正在考虑是否寻求法律帮助。文章还附带了与隐私相关的其他内容链接。


HN 热度 652 points | 评论 255 comments | 作者:speckx | 1 day ago #

https://news.ycombinator.com/item?id=47768813

  • Flock 声称数据归其客户所有,客户决定数据的使用和分享,这与加州消费者隐私法案(CCPA)存在冲突,因为数据本应属于个人。
  • Flock 建议用户应联系拥有摄像头的客户请求删除数据,而非直接联系 Flock,但数据实际存储在 Flock 服务器上,Flock 应对数据安全和隐私负责。
  • Flock 拥有并租赁摄像头,但数据归政府所有,Flock 不得将数据用于商业获利,类似云存储服务的角色。
  • Flock 运营一个联邦网络,普通人难以知道具体数据控制者是谁,难以提出删除请求。
  • 有人通过报警等手段影响摄像头监控区域的治安,体现了执法资源的优先分配和反应机制。
  • 警察优先处理可能危及生命的暴力犯罪,资源分配合理。
  • 如果无法轻松删除个人位置信息,现有法律对个人隐私保护不足,应强制 Flock 承担删除责任。
  • 类比苹果和 iCloud,数据存储者和数据控制者的责任界限不清,Flock 可能因数据共享和安全漏洞承担更大责任。
  • 无论数据由谁使用,任何涉及个人信息的收集都应允许个人提出删除请求。
  • 个人拍摄的照片中包含他人时,是否应删除存在争议,责任界定复杂。

3. 想写编译器?只需阅读这两篇论文(2008 年) (Want to write a compiler? Just read these two papers (2008)) #

https://prog21.dadgum.com/30.html

这篇文章讨论了现代编程,特别是编写编译器的学习过程。作者指出,许多关于编译器的书籍内容过于庞杂和复杂,导致初学者难以入门,甚至产生“编译器难写”的误解。文章推荐了 Jack Crenshaw 在 1988 年开始的系列教程《Let’s Build a Compiler!》,该系列以简单易懂的方式讲解了 Turbo Pascal 类编译器的构建,适合初学者,但缺少内部程序表示(如抽象语法树)的内容。

作者进一步介绍了适合高级语言(如 Python、Ruby、Erlang、Haskell、Lisp)使用的编译器设计方法,强调这些语言便于创建和操作树形数据结构。特别推荐了 Sarkar、Waddell 和 Dybvig 的论文《A Nanopass Framework for Compiler Education》,提出将编译器设计为多个简单转换步骤的理念,每个步骤独立处理输入输出,代码示例使用动态类型的 Scheme 语言。

文章建议初学者先尝试写几个编译器,再考虑是否需要深入阅读经典的《龙书》或其他权威书籍,暗示这些书籍并非学习编译器的唯一途径。作者本人是有多年游戏设计经验的程序员,文中还提及其其他相关技术文章和资源。


HN 热度 450 points | 评论 135 comments | 作者:downbad_ | 14 hours ago #

https://news.ycombinator.com/item?id=47776796

  • 《龙书》章节 2 可以作为独立的编译器入门介绍,内容全面且自成体系。
  • 《编译器》一书(Niklaus Wirth 著)简短且清晰,适合初学者快速理解完整编译器实现。
  • 《龙书》理论性强,作为入门书籍可能让人望而却步,不适合初学者。
  • 推荐从实践出发、逐步构建编译器的书籍,避免过多理论堆砌。
  • Forth 语言及其小型编译器实现能带来编译器设计的乐趣和成就感。
  • 《Tiger 书》《Compiler Design in C》《Lisp in Small Pieces》等书籍也被推荐,涵盖不同风格和深度。
  • 递归下降解析器比基于 BNF 的解析器生成器更易实现,适合简单语法。
  • 理论课程中教授正规语言理论有助于理解编译器中的解析技术。
  • 《Engineering a Compiler》中的静态单赋值(SSA)章节值得重点学习。
  • 《龙书》内容全面,但部分章节难度较大,可能超出初学者理解能力。
  • 《龙书》适合学习生产级编译器设计,涵盖丰富概念,但对兴趣驱动的项目可能过于复杂。
  • 《龙书》偏重学术和理论,实际生产编译器还需学习更多内容。
  • 许多现代资源跳过复杂的解析器生成技术,直接引导读者实现递归下降解析器。
  • 《龙书》前期大量篇幅讲解解析器理论,可能让人忽视后续代码生成和优化等核心内容。
  • 理解底层解析技术有助于避免语法设计中的陷阱,但阅读时可有选择性跳过不相关内容。

4. 上帝沉睡于矿物之中 (God sleeps in the minerals) #

https://wchambliss.wordpress.com/2026/03/03/god-sleeps-in-the-minerals/

该网页是一个名为“Chamblissian”的公共博客页面,发布了一篇题为“God sleeps in the minerals”(上帝睡在矿物中)的文章。文章内容主要介绍了作者在洛杉矶县自然历史博物馆“Unearthed: Raw Beauty”展览中拍摄的矿物照片,表达了对矿物之美的赞赏。

文章发布于 2026 年 3 月 3 日,归类为“未分类”。页面下方有 19 条评论,评论内容多样,有读者表达了对文章的赞美,也有一些读者提出疑问“这是什么?”,还有部分评论涉及对标题中“上帝睡在矿物中”这一表达的不同看法,有人认为这是诗意的表达,象征矿物之美带有神圣气息,也有人表示不认同甚至反感。

此外,有评论引用了 Paramahansa Yogananda 的一句话:“God sleeps in the minerals, dreams in the flowers, awakens in the animals, and in man knows that He is awake”,进一步阐释了标题的寓意。

总体来看,网页主体是一篇以矿物美学为主题的博客文章,结合作者的现场拍摄和个人感悟,激发了读者的多样讨论。


HN 热度 426 points | 评论 91 comments | 作者:speckx | 10 hours ago #

https://news.ycombinator.com/item?id=47778475

  • 大型完美矿物标本令人震撼,加入当地矿物俱乐部参与实地采集体验非常有趣且满足感强。
  • 在美国,大部分优质矿物标本来自私人矿区或特殊地质环境,普通爱好者多只能从尾矿中找到小块标本,优质标本难以获得。
  • 博物馆展示的稀有标本正因其稀缺性而有价值,普通人也可以通过学习和体验享受采矿乐趣。
  • 东北地区公共采集点稀少,许多曾经的采集地被开发或关闭,部分原因是部分采集者不尊重环境,导致采集地关闭。
  • 在美国西部的国家森林和公共土地上,仍有不少未被充分开发的矿区,偶尔徒步时能发现不错的矿物标本。
  • 通过观察和选择合适地点,仍有机会找到大型优质矿物标本,采集需要细心和耐心。
  • 了解地质图和寻找旧矿区、采石场等地是寻找矿物标本的有效方法。
  • 石棉矿物虽然美观,但因健康风险通常被博物馆隔离展示,天然石棉本身不危险,危险在于其纤维被切割并吸入。
  • 加州和华盛顿等地存在天然有害矿物,如石棉和砷,需注意环境安全和健康风险。
  • 石棉种类繁多,风险差异大,某些地区的石棉风险较低,徒步时只要不扰动地面,风险较小。

5. 背包品质故意变差 (Backpacks got worse on purpose) #

https://www.worseonpurpose.com/p/your-backpack-got-worse-on-purpose

这篇文章讲述了 VF Corporation 如何通过收购和整合多个知名背包品牌,导致这些品牌的产品质量下降的过程。VF Corporation 最初是一家女性内衣制造商,后来通过收购 JanSport、The North Face、Eastpak、Kipling 和 Eagle Creek 等背包品牌,控制了美国超过 55% 的背包市场。

文章指出,过去这些品牌之间的竞争促使它们保持高质量标准,但被同一家公司收购后,竞争消失,品牌开始为了利润目标普遍降低产品质量。具体表现为使用更低密度的面料、替换高品质的 YKK 拉链为廉价替代品、减少缝线密度等,这些变化在外观上难以察觉,但大幅降低了背包的耐用性。

此外,VF Corporation 保留了高端产品线的质量,但在入门级和中端产品上故意降低质量,形成了明显的市场分层。消费者往往无法区分不同质量的产品,只凭品牌名称购买,品牌信誉被用来销售低质产品。

文章还揭示了品牌的保修政策实际上限制了消费者的权益,保修只覆盖材料和工艺缺陷,不包括正常磨损,而产品设计寿命缩短使得常见的损坏不被视为缺陷。消费者反馈称,保修更换的产品质量甚至不如原先的旧包。

作者通过成本与使用寿命的对比指出,便宜且寿命短的背包实际上单位使用成本更高,但这种模式对 VF Corporation 有利,因为它带来重复购买和持续收入。文章最后提到,VF Corporation 已开始出售部分背包品牌,表明这些品牌已成为利润优化的资产,而非公司核心业务。

总结来看,文章揭示了大型企业通过收购、削减成本和降低产品质量,利用品牌信誉谋取利润的商业模式,提醒消费者警惕品牌背后的真实情况。


HN 热度 387 points | 评论 359 comments | 作者:113 | 13 hours ago #

https://news.ycombinator.com/item?id=47777209

  • 现在判断产品质量变得更加困难,虽然同样价格可以买到相同或更好的质量,但品牌和名称的质量普遍下降。
  • 按通胀调整价格来看,许多类别的产品质量和价格保持相当,但购买力下降影响了实际消费能力。
  • 最低工资增长远低于通胀率,导致实际购买力大幅下降,尤其是住房、医疗和教育等支出占比增加。
  • 房价上涨幅度远超通胀,且住房质量提升使简单比较价格和收入变得不准确。
  • 质量的定义主观且复杂,制造成本可能因材料和技术变化而降低,劳动力成本相对下降。
  • 美国现代住房普遍使用廉价材料,质量不如几十年前的房屋。
  • 联邦最低工资并不代表中位数工资,中位数工资实际有所增长,但增长幅度有限。
  • 以 1970 年代作为经济增长锚点存在问题,该时期经济表现不佳,影响数据解读。
  • 不同数据源对工资和收入的统计存在差异,家庭收入和个人收入变化需区分考虑。
  • 多收入家庭比例增加使得家庭收入数据难以直接反映个人实际收入变化。

6. 良好睡眠,良好学习,良好生活(2012) (Good sleep, good learning, good life (2012)) #

https://super-memory.com/articles/sleep.htm

这篇文章由 Dr Piotr Wozniak 撰写,聚焦于睡眠与学习、记忆及创造力之间的关系,旨在为需要高质量睡眠以提升学习和创造力的人群提供实用指导。文章基于神经生理学的最新研究,尽管睡眠科学仍在快速发展,作者总结了一些已被广泛认可的睡眠基本原理,并提出了实际应用建议。

文章首先阐述了睡眠的重要性,包括睡眠对大脑“垃圾清理”、保护和修复的作用,强调缺乏睡眠的严重后果。接着介绍了睡眠的两个核心组成部分:昼夜节律(生物钟)和睡眠的稳态调节机制,并用“时钟与沙漏”的比喻帮助理解。

随后,文章详细探讨了如何实现良好睡眠的“公式”,包括自由运行睡眠(free running sleep)的概念及其在治疗失眠和睡眠相位障碍中的应用。作者还分析了睡眠时间安排对大脑工作的影响,强调应避免闹钟干扰,减轻睡眠惯性,并讨论了轮班工作和时差反应对健康的影响。

文章还深入介绍了各种睡眠习惯和障碍,如延迟睡眠相位综合症(DSPS)、提前睡眠相位综合症(ASPS)、婴儿睡眠问题、失眠和嗜睡症等,并提供了相应的解决策略。特别强调了昼夜节律的稳定性对健康睡眠的重要性。

关于午睡,文章指出午睡有益于大脑功能和创造力,破除多种关于午睡的误区,详细说明了最佳午睡时间和规则。还介绍了多相睡眠(polyphasic sleep)的概念及其科学挑战,列举了历史上一些著名多相睡眠者及其睡眠模式。

整体而言,文章系统地整合了睡眠科学的理论与实践,提供了丰富的睡眠优化建议,适合关注睡眠质量以提升学习效率和创造力的读者参考。


HN 热度 349 points | 评论 173 comments | 作者:downbad_ | 14 hours ago #

https://news.ycombinator.com/item?id=47776557

  • 心理状态对健康习惯和生活目标有重要影响,明确目标时更容易保持锻炼、健康饮食和良好睡眠。
  • 精神稳定带来专注力,专注力反过来不能直接带来精神稳定。
  • ADHD 等注意力障碍可能影响专注和生产力,诊断和治疗能帮助改善生活状态。
  • 以过程为导向的健康习惯(如热爱骑行)比以结果为导向的目标更可持续。
  • 运动和健康生活习惯可能是幸福感和明确目标的结果,而非单纯的意志力驱动。
  • 不幸福的人往往因为找不到通往幸福的明确路径,身体和心理疾病也会阻碍追求目标。
  • 幸福和目标感的缺失可能导致主动破坏健康,精神健康优先于生活目标的形成。
  • 情绪状态决定生活目标和健康习惯的形成,积极情绪时更容易开始新爱好和健康生活。
  • 动力难以捉摸,有时需要强迫自己行动以积累动力,情绪可能随之改善。
  • 抑郁时难以坚持健康生活,治疗是恢复健康习惯的前提,单靠个人意志难以克服抑郁。
  • 梦想和信念的丧失会导致自我怀疑和生活动力的丧失。

7. 开源并未消亡 (Open Source Isn’t Dead) #

https://www.strix.ai/blog/cal-com-is-closing-its-code-due-to-ai-threats

这篇文章讨论了 Cal.com 宣布将其核心代码库从开源转为闭源的决定及其背后的原因。Cal.com 的 CEO 认为,人工智能已经使得漏洞发现和利用几乎零成本,公开代码反而增加了安全风险。

Strix 作为一个开源的自主 AI 安全代理项目,表达了对 Cal.com 团队的尊重,并分享了他们与 Cal.com 合作发现并负责披露漏洞的经历。Strix 认可 AI 改变了安全环境,但不同意通过关闭源代码来应对 AI 驱动的安全威胁。

文章指出,现代 AI 工具能够通过黑盒和灰盒测试,动态交互和分析系统漏洞,无需访问代码库,因此关闭源代码无法阻止 AI 攻击者。依赖“安全通过模糊”策略在自动化攻击面前是失败的,因为内部团队难以比得上 24/7 不间断的 AI 攻击。

真正的解决方案是利用 AI 防御 AI,将安全测试自动化并集成到开发流程中,实现持续的、低成本的安全验证。通过 AI 自动尝试利用新代码和基础设施变更,提升防御效率。

作者强调,开源并未消亡,透明度依然是增强安全的关键。Strix 保持开源,致力于为开发者提供自主安全代理工具,帮助抵御 AI 黑客攻击。文章最后邀请读者免费试用 Strix,体验持续的 AI 驱动安全测试。


HN 热度 308 points | 评论 166 comments | 作者:bearsyankees | 8 hours ago #

https://news.ycombinator.com/item?id=47780712

  • 开源项目因为有更多人参与,安全漏洞报告较多,且能及时修复,而闭源软件虽然漏洞报告少,但容易被 AI 自动化攻击利用。
  • 闭源公司内部也会使用 AI 扫描工具,但多数公司缺乏足够的安全意识和资源去系统性修复漏洞。
  • 企业软件存在大量未修复的安全漏洞,缺乏更新和维护的动力,主要是经济激励不足导致。
  • 攻击者利用 AI 工具成本极低,而企业防御预算和动力不足,导致安全形势不平衡。
  • 社区可以通过白帽模式运行漏洞扫描并反馈,支持开源项目安全,但需要更好的激励机制。
  • 有些闭源公司会定期用 AI 扫描代码,利用已有的开发资源和信用卡额度,成本几乎为零。
  • AI 扫描工具各有侧重,单一工具无法覆盖所有漏洞,难以形成统一的安全基准。
  • 企业客户往往不愿为安全投入额外费用,导致安全工作难以推进。
  • 开源软件因“更多眼睛”参与,理论上安全性更高,但实际效果取决于工具使用和社区活跃度。
  • AI 模型和工具正在快速趋同,未来可能出现统一的安全扫描模型,影响安全格局。
  • Bug 赏金计划仍然有效,但面临 AI 生成虚假报告和 0-day 市场竞争的双重挑战。
  • 综合使用 AI 扫描、手动渗透测试和赏金计划是提升安全的有效手段。

8. Anna’s Archive 在 3.22 亿美元 Spotify 盗版案中未出庭败诉 (Anna’s Archive loses $322M Spotify piracy case without a fight) #

https://torrentfreak.com/annas-archive-loses-322-million-spotify-piracy-case-without-a-fight/

Spotify 及多家主要唱片公司,包括环球音乐(UMG)、索尼和华纳,联合对 Anna’s Archive 提起诉讼,获得了 3.22 亿美元的缺席判决。Anna’s Archive 是一家知名的影子图书馆元搜索引擎,帮助用户查找盗版书籍及相关资源。去年 12 月,该网站宣布备份了 Spotify 的音乐数据,震惊了音乐行业。虽然最初只发布了 Spotify 的元数据,没有实际音乐,但这已引起了行业高度警觉。

Spotify 及唱片公司迅速提起诉讼,要求关闭该网站。法院通过初步禁令,要求域名注册机构暂停多个 Anna’s Archive 的域名,尽管该网站随后注册了多个备用域名。诉讼压力促使网站移除了 Spotify 相关的种子文件列表和部分音乐文件,但运营者希望以此换取行业撤诉未果。最终,因被告未出庭,法院判决支持原告,判处 3.22 亿美元赔偿。

判决细节显示,音乐公司依据版权法对约 150 个作品索赔,每件作品最高赔偿 15 万美元,Spotify 基于数字版权管理(DMCA)反规避条款对 12 万个音乐文件索赔 2500 美元,合计超过 3.22 亿美元。若按全部 280 万文件计算,赔偿金额将超过 70 亿美元。

法院还发布了永久禁令,要求全球范围内的域名注册机构、托管服务商和互联网服务提供商关闭 Anna’s Archive 的十个域名,禁止访问并保存相关证据。判决还要求 Anna’s Archive 在十个工作日内提交合规报告,提供有效的联系方式和管理人员信息,但该网站运营者身份仍不明,是否遵守命令尚不确定。

理论上,Anna’s Archive 可以通过支付全部赔偿金并履行禁令义务,申请解除域名禁令,但这一可能性极低。此外,由于部分域名注册在美国法院管辖范围外,禁令的执行存在难度。

总体来看,此次判决在法律上是音乐产业的重大胜利,但实际追回赔偿款的可能性较小,更多体现为对盗版行为的强力震慑。


HN 热度 302 points | 评论 340 comments | 作者:askl | 15 hours ago #

https://news.ycombinator.com/item?id=47776035

  • Anna’s Archive 发布 Spotify 音乐资源是错误决定,增加了法律风险,且这些音乐大多已在 YouTube 等平台广泛可得。
  • YouTube 未来可能会限制第三方下载工具,使得音乐资源更难获取,Anna’s Archive 的存档因此更有价值。
  • 录制音频流或从免费 Spotify 获取音乐依然可行,不会完全被锁死。
  • 通过追踪域名关闭网站是无效的,Wikipedia 上的链接更新使得访问依然容易。
  • Wikipedia 的域名更新依赖旧域名发布,旧域名不会同时关闭。
  • 可以通过 Tor 洋葱服务发布最新域名列表,提供去中心化且难以审查的访问方式。
  • Wikipedia 作为域名信息发布平台易于访问,但去中心化方式访问不够方便。
  • 更新 Wikipedia 域名信息是否合法不成问题,关键是用户是否能确认新域名的真实性和可信度。
  • Spotify 和其他大科技公司早期也存在内容盗用行为,但成功后通过法律和政策保护自己,阻止他人模仿。
  • YouTube 早期限制视频长度,且 Google Video 曾提供完整电影,YouTube 并非完全开放盗版内容。
  • 过去通过分段图片等方式上传视频内容,类似于 Usenet 的编码模式,后来被 Rapidshare 等服务取代。
  • 大型平台如 Airbnb、Reddit、OpenAI 等都曾借鉴或复制他人内容和数据。
  • Spotify 对 Anna’s Archive 的打击更多是为了向版权方表态,实际影响有限,便利的正版分发始终胜过盗版。

9. OpenSSL 4.0.0 (OpenSSL 4.0.0) #

https://github.com/openssl/openssl/releases/tag/openssl-4.0.0

该网页是 GitHub 上 OpenSSL 项目的版本发布说明页面,具体介绍了 OpenSSL 4.0.0 版本的主要更新内容和变更细节。

OpenSSL 4.0.0 是一个功能性版本,带来了许多重要的新功能和潜在的不兼容改动。主要变更包括:

  • 修正了打印 RSA 密钥数据时多余的前导“00:”问题,统一了十六进制数据的输出宽度。
  • 在 PKCS5_PBKDF2_HMAC API 中加强了下界检查。
  • 增加了对 AKID 验证和 CRL 验证的严格检查。
  • libcrypto 不再通过 atexit()进行全局数据清理,OPENSSL_cleanup()默认在全局析构函数中运行或不运行。
  • ASN1_STRING 结构变为不透明,多个 API 函数签名增加了 const 修饰。
  • 弃用并移除对 SSLv2 和 SSLv3 的支持,SSLv3 自 2015 年起已被弃用。
  • 移除了对引擎(engines)的支持及相关构建选项。
  • 默认禁用对 RFC 8422 中弃用的椭圆曲线和显式 EC 曲线的支持。
  • 移除了旧的 c_rehash 脚本,推荐使用 openssl rehash 命令。
  • 移除了一些已废弃的功能和 API,包括 BIO_f_reliable()、自定义 EVP 方法、固定 SSL/TLS 版本方法等。
  • 取消了对某些旧平台的支持。

新增功能方面:

  • 支持加密客户端 Hello(ECH,RFC 9849)。
  • 支持 RFC 8998 中的 sm2sig_sm3 签名算法、curveSM2 密钥交换组及后量子组 curveSM2MLKEM768。
  • 支持 cSHAKE 函数(SP 800-185 标准)。
  • 新增“ML-DSA-MU”摘要算法。
  • 支持 SNMP 和 SRTP 的密钥派生函数(KDF)。
  • FIPS 自检可以延迟执行,安装 FIPS 模块时可使用-defer_tests 选项。
  • Windows 平台支持静态或动态 VC 运行时链接。
  • TLS 1.2 中支持协商 FFDHE 密钥交换(RFC 7919)。

整体来看,该版本在安全性、兼容性和功能性上均有显著提升,同时移除了多项过时和不安全的特性,推动 OpenSSL 向更现代和安全的方向发展。


HN 热度 275 points | 评论 84 comments | 作者:petecooper | 1 day ago #

https://news.ycombinator.com/item?id=47768788

  • Encrypted Client Hello(ECH)已经可以在部分浏览器和服务器上使用,例如 CloudFlare 和 Firefox 119 版本及以上。
  • Safari 和 iOS/macOS 目前尚未默认支持 ECH,但有实验性选项可供测试。
  • Nginx 1.29 及以上版本支持 ECH,但在主流 Linux 发行版中可能还未普及。
  • ECH 对个人或单一网站服务器的隐私保护有限,因为对手仍能通过 IP 地址识别服务器。
  • ECH 的主要隐私优势体现在大型云服务提供商(如 Cloudflare)共享 IP 地址的场景中。
  • 对于个人用户,可以通过频繁更换服务器 IP 或使用多节点缓存来一定程度上规避 IP 跟踪。
  • ECH 需要配合 DNS-over-HTTPS(DOH)使用,防止 ISP 通过 DNS 窥探访问的 HTTPS 资源记录。
  • 即使使用 ECH,观察者仍能通过 IP 地址推断访问目标,ECH 并不能隐藏服务器的物理位置。
  • Tor 网络通过 Brave 浏览器等方式已实现较为可用的速度,适合隐私需求较高的用户。
  • 支持 ECH 是未来趋势,服务器端应尽早部署以便客户端逐步普及。

10. 谷歌 Gemma 4 原生运行于 iPhone,实现完全离线的 AI 推理 (Google Gemma 4 Runs Natively on iPhone with Full Offline AI Inference) #

https://www.gizmoweek.com/gemma-4-runs-iphone/

本文介绍了谷歌最新的开源 AI 模型 Gemma 4 现已能够在 iPhone 上本地运行,实现完全离线的 AI 推理。这标志着边缘 AI 技术已从未来趋势转变为现实应用。Gemma 4 的 31 亿参数版本在性能上与 Qwen 3.5 的 27 亿参数版本相当,但更值得关注的是其为移动设备优化的 E2B 和 E4B 小型版本,这些版本在速度和资源消耗上更适合实际使用。

用户只需从 App Store 下载谷歌 AI Edge Gallery 应用,即可选择不同模型版本,在设备上直接进行 AI 推理,无需调用 API 或依赖云端。该应用不仅支持文本交互,还集成了图像识别、语音交互和可扩展的技能框架,旨在成为开发者和高级用户进行本地 AI 实验的平台。

技术层面,Gemma 4 利用 iPhone 的 GPU 进行推理,响应速度快且延迟低,显示出消费者硬件已能支持此类工作负载,推动本地 AI 商业化应用。离线运行特别适合对数据隐私有严格要求的企业场景,如现场作业和医疗环境。

总体来看,Gemma 4 在 iPhone 上的成功运行不仅是技术验证,更宣告了本地 AI 时代的到来,谷歌的 Gemma 模型已正式进入市场。


HN 热度 263 points | 评论 167 comments | 作者:takumi123 | 18 hours ago #

https://news.ycombinator.com/item?id=47774971

  • Gemma 4 在 iPhone 上运行时推理过程主要通过 GPU 而非苹果神经引擎(ANE),导致电池消耗较快且不够高效。
  • ANE 设计初衷并非针对大型语言模型(LLM),虽然理论上可以运行 LLM,但需要大量模型转换和硬件调优,实际应用门槛较高。
  • ANE 是一种图执行引擎,使用时需通过特定的 CoreML 管道,且对模型设计有较高要求。
  • 目前 LLM 生态主要围绕 CPU 和 GPU 执行,开发资源较少投入到 ANE 支持上,苹果的 MLX 框架也未支持 ANE。
  • 有项目(如 ANEMLL)尝试在 iPhone 上运行 LLM,仍处于技术演示阶段,距离生产级应用还有较大差距。
  • 苹果计划在 WWDC 发布新框架替代 CoreML,更好支持现代 AI 和 LLM,未来可能改善对 ANE 的支持。
  • Android 端的 Edge Gallery 应用支持 NPU,但需要安装 AICore 测试版,苹果设备上类似支持尚未普及。
  • Google 的 Edge Gallery 应用在 Pixel 手机上也主要使用 GPU,缺乏对 NPU 的支持,显示出厂商对 NPU 的重视程度不足。
  • ANE 对于单个向量的处理效率不高,不适合逐步生成 token 的 LLM 推理,除非使用批量处理策略。
  • 运行 LLM 会显著消耗电池并可能导致设备过热,当前技术仍偏向演示性质,非成熟的生产方案。
  • 文章缺乏具体细节和基准测试数据,内容较为空洞,未能充分展示实际性能和使用体验。
  • 现有 AI 内容检测工具对文章是否由 LLM 生成的判断存在争议,检测准确性和可靠性仍有待验证。
  • 用户对设备后台持续运行 AI 进程持谨慎态度,担心隐私和设备控制权问题。

Hacker News 精彩评论及翻译 #

Stop Flock #

https://news.ycombinator.com/item?id=47773673

I don’t want to stop Flock the company. I want to stop Flock the business model, along with all the other mass surveillance, and the data brokers. If the business models can’t be made illegal, it should at least come with liabilities so high that no sane business would want to hold data that is essentially toxic waste.

Without that, we are quickly spiraling into the dystopia where privacy is gone, and when the wrong person gets access to the data, entire populations are threatened.

bmitch3020

我并不是想阻止Flock这家公司,而是想阻止Flock这种商业模式,以及所有其他的大规模监控和数据经纪业务。如果这些商业模式不能被法律禁止,至少应该承担足够高的法律责任,让任何理智的企业都不愿意持有本质上像有毒废料一样的数据。

如果没有这些措施,我们很快就会陷入一个隐私消失的反乌托邦社会,当错误的人获得这些数据时,整个群体都将受到威胁。


The dangers of California’s legislation to censor … #

https://news.ycombinator.com/item?id=47770910

Personally, I see this as an assault on 3d printing more than any real attempt to regulate guns.

I own several 3d printers. If I wanted to make something resembling a firearm I’d go to home depot WAY before I bothered 3d printing parts. You basically just need a metal tube, and well… a pipe from home depot does that much better than trying to 3d print something much less reliable.

So given we don’t do this regulation for any of the much more reliable ways to create unregistered firearms… what’s special about 3d printers?

So my assumption is immediately that some relatively large lobbying group feels threatened by 3d printing, and is using this as a driver to try to control access and limit business impact.

Either way, this is bad legislation.

horsawlarway

就我个人来看,我觉得这更多是对3D打印技术的打击,而不是真正试图去规范枪支。

我拥有几台3D打印机。如果我想制造类似枪支的东西,我绝对会先去家得宝(Home Depot),而不是费劲用3D打印零件。你基本上只需要一个金属管,而家得宝卖的管子比用3D打印做出来的要好得多,也更可靠。

既然我们并没有对那些更可靠的制造未注册枪支的方式进行监管……那3D打印机有什么特别的呢?

所以我直接怀疑是某个比较大规模的游说团体感受到了3D打印的威胁,借此机会尝试控制使用权限,限制对他们业务的影响。

无论如何,这都是一条糟糕的立法。


Anna’s Archive loses $322M Spotify piracy case wit… #

https://news.ycombinator.com/item?id=47782196

They will never see a single cent from that, AA will continue to rotate domains and nothing was accomplished, except for spotify’s legal team which earned easy money arguing against empty chair in court.

BTW, you can donate and get faster downloads: https://annas-archive.gl/donate

Just donated in honor of this. Up yours spotify!

progbits

他们永远不会因此得到一分钱,AA 会继续更换域名,除了给 Spotify 的法律团队带来轻松赚钱的机会外,什么都没达成。

顺便说一句,你可以捐款来获得更快的下载速度:https://annas-archive.gl/donate

刚刚为了这事捐了款。去你的,Spotify!


Cal.com is going closed source #

https://news.ycombinator.com/item?id=47780751

Drew Breunig published a very relevant piece yesterday that came to the opposite conclusion: https://www.dbreunig.com/2026/04/14/cybersecurity-is-proof-of-work-now.html

Since security exploits can now be found by spending tokens, open source is MORE valuable because open source libraries can share that auditing budget while closed source software has to find all the exploits themselves in private.

If Mythos continues to find exploits so long as you keep throwing money at it, security is reduced to a brutally simple equation: to harden a system you need to spend more tokens discovering exploits than attackers will spend exploiting them.

simonw

Drew Breunig昨天发表了一篇非常相关的文章,得出了相反的结论:https://www.dbreunig.com/2026/04/14/cybersecurity-is-proof-of-work-now.html

由于现在可以通过花费代币来发现安全漏洞,开源变得更加有价值,因为开源库可以共享审计预算,而封闭源代码软件则必须私下自行寻找所有漏洞。

如果只要不断投入资金,Mythos就能持续找到漏洞,那么安全性简化成了一个非常简单的等式:要强化系统,你需要花费的代币数来发现漏洞,比攻击者利用漏洞花费的代币数还要多。


Backpacks got worse on purpose #

https://news.ycombinator.com/item?id=47779540

While I personally find this kind of thing extremely annoying, to me, the main problem is the difficulty of determining quality. The Donut media guys did a (relatively unscientific) video comparing a whole bunch of products from the 50s to modern day across several price points. What they found was that the things that “looked” the same now were simultaneously worse and also much cheaper. They also found that, if inflation adjusted, you get could, in most categories, the same or better quality for the same price. It was just that the brands and names that used to be quality were now usually not as much.

So it is often the case that today, you can get something for cheaper than you ever could in the past (albeit not at a great quality), and if you are willing to pay higher prices (but often about the same as you would have paid in the past), you can still get good or even better quality.

The main issue is that determining which products actually are quality has also gotten harder in many cases.

edit: found the video:

https://www.youtube.com/watch?v=I4C62HC1HSo

MostlyStable

虽然我个人觉得这种事情非常烦人,但对我来说,主要问题是判断质量的难度。Donut Media团队做了一个(相对不那么科学的)视频,比较了从50年代到现代多个价格区间的各种产品。他们发现,那些“看起来”相同的东西,现在往往质量更差而且价格也便宜得多。他们还发现,按通货膨胀调整后,在大多数类别中,你用相同的价格可以买到相同甚至更好的质量。只是以前那些品牌和名字曾经代表的高质量,现在通常已经不再如此。

所以,今天你往往能以比过去更便宜的价格买到东西(当然质量不一定好),如果你愿意支付更高的价格(通常和过去相当),你仍然能买到不错甚至更好的质量。

主要问题在于,辨别哪些产品实际上是高质量的变得更难了。

补充:找到那个视频了:

https://www.youtube.com/watch?v=I4C62HC1HSo


Open Source Isn’t Dead #

https://news.ycombinator.com/item?id=47781248

I have an open source project and started receiving a lot of security vulnerability reports in the last few months. A lot of them are extremely corner cases, but there were some legit ones. They’re all fixed now. Closed source software won’t receive any reports, but it will be exploited with AI. So I definitely agree with the message of this article.

tananaev

我有一个开源项目,最近几个月开始收到很多安全漏洞报告。虽然很多都是非常边缘的情况,但也有一些是真实存在的问题。现在这些问题都已经修复了。闭源软件不会收到任何报告,但却会被人工智能利用进行攻击。因此,我完全同意这篇文章的观点。


Google broke its promise to me – now ICE has my da… #

https://news.ycombinator.com/item?id=47783044

Privacy, technology and actual freedom overlap massively. Stories like this making it to HN are important since many of the people working at Google that had interactions with this, either by creating the tech or being aware of internal policy changes, read HN. Additionally many founders and decision makers in companies read these stories because it hit HN. Knowing that Google will do this changes your legal calculations. Should I trust them to store my company’s data? Will they honor their BAA requirements if they are ditching other promises they made?

People may be tired of seeing stories like this appear on HN, but getting this story exposure to this group is exactly why they need to hit the homepage.

jmward01

隐私、技术和实际自由之间有着大量重叠。像这样的故事能够出现在HN上非常重要,因为许多在谷歌工作、与此事有过交集的人——无论是参与技术开发,还是了解内部政策变动的——都会阅读HN。此外,许多公司的创始人和决策者也会关注这些故事,因为它们能登上HN首页。知道谷歌会这样做,会改变你的法律计算。我还应该信任他们来存储公司的数据吗?如果他们放弃了其他承诺,还会履行他们的BAA(业务伙伴协议)要求吗?

尽管人们可能已经厌倦看到类似故事出现在HN上,但让这类故事曝光给这群人,正是它们需要登上首页的原因。


Do you even need a database? #

https://news.ycombinator.com/item?id=47778855

At some point, don’t you just end up making a low-quality, poorly-tested reinvention of SQLite by doing this and adding features?

z3ugma

到最后,你不就是通过这样做并添加功能,最终做出了一个低质量、测试不足的SQLite的翻版吗?


Saying goodbye to Agile #

https://news.ycombinator.com/item?id=47775068

There’s an interesting phenomenon that Agile (capital A) has exposed me to, and once I saw it due to Agile I’ve seen parallels elsewhere.

In that: if it fails, it is only considered evidence that you were not doing it enough.

The solution can never be at fault, it’s your execution, or your devotion to the process (in this case) that was faulty.

It’s also true for Cloud providers; that they’re not suited for certain tasks is no longer considered an engineering trade-off, it’s that you architected your solution wrong, and the answer is to buy even more into how the platform works.

If your microservices become slow or difficult to debug, it’s never that fatter services could have been preferable, it’s that we didn’t go hard-enough into microservices.

If Austerity is not working as an economic model; the answer isn’t to invest in growth, it’s to cut even more corners.

I feel like I see it all the time.

dijit

有一个有趣的现象是,敏捷(大写的A)让我接触到了,一旦我因为敏捷看到了它,我在别的地方也看到了类似的情况。

那就是:如果失败了,人们只会认为证据表明你做得还不够。

解决方案本身永远不会有问题,问题出在你的执行,或者你对流程(在这个例子中)的投入不够。

云服务提供商也是如此;他们不适合某些任务,不再被视为工程上的权衡,而是认为你设计的方案有问题,解决办法就是更深入地投入理解平台的运作方式。

如果你的微服务变得缓慢或难以调试,问题绝不是胖服务可能更好,而是我们对微服务的应用还不够深入。

如果紧缩政策作为经济模型不起作用,答案也不是去投资增长,而是要更加严格地削减开支。

我觉得我几乎时时刻刻都能看到这种情况。


Anna’s Archive loses $322M Spotify piracy case wit… #

https://news.ycombinator.com/item?id=47776358

In addition to the damages award, Rakoff entered a permanent worldwide injunction

Because apparently U.S. courts and judges can do that. The more this is ignored by third-parties outside of the U.S., the better.

I’m not against international cooperation regarding common rules (I’m rather for), but the current context certainly doesn’t designate the U.S. as a responsible custodian/enforcer of such rules.

Ragnarork

除了赔偿金判决外,拉科夫法官还发布了永久性的全球禁令。

显然,美国的法院和法官是有权这么做的。越多美国以外的第三方忽视这一点,情况就越好。

我并不反对关于通用规则的国际合作(我实际上是支持的),但目前的情况显然并未将美国认定为这些规则的负责任的管理者或执行者。


Dependency cooldowns turn you into a free-rider #

https://news.ycombinator.com/item?id=47774897

Fundamental in the dependency cooldown plan is the hope that other people - those who weren’t smart enough to configure a cooldown - serve as unpaid, inadvertent beta testers for newly released packages.

This is wrong to an extent.

This plan works by letting software supply chain companies find security issues in new releases. Many security companies have automated scanners for popular and less popular libraries, with manual triggers for those libraries which are not in the top N.

Their incentive is to be the first to publish a blog post about a cool new attack that they discovered and that their solution can prevent.

dominicq

依赖冷却计划的根本在于寄希望于其他人——那些没有足够聪明去配置冷却期的人——成为新发布软件包的无偿、无意的测试员。

这种想法在某种程度上是错误的。

这个计划的运作方式是让软件供应链公司发现新版本中的安全问题。许多安全公司都有针对流行和不太流行库的自动扫描工具,对于那些不在前N名的库,则由人工触发扫描。

他们的动力是抢先发布关于他们发现的新攻击及其解决方案能够防止该攻击的博客文章。


Claude Code Routines #

https://news.ycombinator.com/item?id=47769149

Anthropic is really good at releasing features that are almost the same but not exactly the same as other features they released the week before

Eldodi

Anthropic 非常擅长发布那些与他们前一周发布的功能几乎相同但又不完全相同的功能。


Backblaze has stopped backing up OneDrive and Drop… #

https://news.ycombinator.com/item?id=47763678

I guess the problem with Backblaze’s business model with respect to Backblaze Personal is that it is “unlimited”. They specifically exclude linux users because, well, we’re nerds, r/datahoarders exists, and we have different ideas about what “unlimited” means. [1]

This is another example in disguise of two people disagreeing about what “unlimited” means in the context of backup, even if they do claim to have “no restrictions on file type or size” [2].

[1] https://www.reddit.com/r/backblaze/comments/jsrqoz/personal_backup_linux/ [2] https://www.backblaze.com/cloud-backup/personal

azalemeth

我猜Backblaze在其个人版服务的商业模式上的问题在于它是“无限”的。他们专门排除了Linux用户,因为,嗯,我们是极客,r/datahoarders存在,而且我们对“无限”这个词的理解不同。[1]

这其实是另一个关于两个人在备份背景下对“无限”含义理解不同的例子,尽管他们确实声称“对文件类型或大小没有限制”[2]。

[1] https://www.reddit.com/r/backblaze/comments/jsrqoz/personal_backup_linux/
[2] https://www.backblaze.com/cloud-backup/personal


Tell HN: Fiverr left customer files public and sea… #

https://news.ycombinator.com/item?id=47773942

Extremely bad stuff here. Can’t believe it’s been 7 hours now and you can still pull up people’s complete prepared tax returns right from a Google search. This should be a business-ending breach of trust and good practices, but I worry there’s probably a lack of regulatory might or will to make anything happen.

evmaki

这里的情况非常糟糕。真不敢相信已经7个小时了,你依然可以通过谷歌搜索直接查到人们完整的已准备好的报税表。这本该是足以毁掉一家企业信任和良好操作的严重泄露,但我担心可能缺乏足够的监管力度或意愿来采取任何行动。


Backblaze has stopped backing up OneDrive and Drop… #

https://news.ycombinator.com/item?id=47763392

Exclusions are one thing, but I’ve had Backblaze fail to restore a file. I pay for unlimited history.

I contacted the support asking WTF, “oh the file got deleted at some point, sorry for that”, and they offered me 3 months of credits.

I do not trust my Backblaze backups anymore.

klausa

排除情况是一回事,但我曾遇到过 Backblaze 无法恢复文件的情况。我付费使用了无限历史版本。

我联系了客服,想搞清楚到底怎么回事,他们回复说“哦,文件在某个时候被删除了,抱歉”,然后给了我三个月的信用额度补偿。

我现在已经不再信任我的 Backblaze 备份了。


Gas Town: From Clown Show to v1.0 #

https://news.ycombinator.com/item?id=47770999

But no need to wait. At a high level, Gas City is the answer to all your problems. Ha! At least, for certain classes of problem, such as, “How can I bring AI into my company and pass an audit trail,”

The important audit at my company is conducted by the FDA.

I have a feeling when they ask what processes we followed to mitigate any user harm that could be caused by software changes that “I told an AI-mayor in the form of a cartoon fox what to do and he spit out a bunch of vibecode software written by AI-driven virtual cartoon characters” is not among the answers they want to hear.

bayarearefugee

但其实不需要等待。从高层来看,Gas City 是解决你所有问题的答案。哈哈!至少,对于某些类别的问题,比如“我如何将人工智能引入公司并通过审计追踪”,它是有效的。

我公司重要的审计是由FDA进行的。

我感觉当他们问我们采取了什么流程来减轻软件变更可能造成的用户伤害时,回答“我告诉了一个卡通狐狸形象的AI市长该做什么,然后他吐出了一堆由AI驱动的虚拟卡通角色编写的vibecode软件”这句话,不会是他们想听到的答案。