2026-04-20 07:58:10
- 康奈尔德语教师用手动打字机要求学生完成写作以远离AI与线上工具、重拾专注与交流,呼应高校回归纸笔/口试防作弊并引发“考试制 vs 持续考核”的争议。
- Vercel 因第三方 Context.ai 的 Google Workspace OAuth 被攻破而泄露标为“非敏感”的未加密环境变量,黑客自称售卖数据要价200万美元,暴露第三方AI依赖的安全薄弱环节。
- NIST 通过在硅片上三维集成多材料实现芯片级多波长可调谐激光器,显著缩小体积与成本、提升变频与开关效率,助力量子计算、原子钟、生医与通信应用。
- Vercel 披露内部系统遭入侵影响“有限子集客户”,起因为第三方AI工具的 OAuth 泄露并建议客户审计日志与轮换环境变量,凸显对外部服务依赖带来的系统性风险。
- 作者批评 Figma 设计系统过度复杂、真理源回归代码,认为如 Claude Design 的 HTML/JS 工具可降设工摩擦但仍稚嫩,生态或分化为延续Figma与探索型创作两路。
- 美以对伊朗冲突期间预测市场与油期货出现超10亿美元、与事件节点高度同步的押注,疑涉内幕信息且监管滞后,引发对预测市场伦理与腐败风险的争议。
- Notion 被曝公开页面可无认证枚举所有编辑者姓名与邮箱且自2022年来未修复,官方仅考虑移除或代理个人信息,暴露遗留依赖导致的隐私设计缺陷。
- 文章提出 ALGOL、Lisp、ML、Self、Forth、APL、Prolog 七大“原语言”,主张先掌握其范式与核心抽象以加速跨语言迁移并深化对类型、对象、堆栈、向量化与逻辑推理的理解。
- 迪拜一航空公司员工因在私人WhatsApp群组分享爆炸照片被捕,折射阿联酋对通信的深度监控与诱捕执法,引发对隐私和言论自由的担忧。
- 为延长旅行者1号寿命,NASA 关闭低能带电粒子实验以应对RTG电力衰减,优先保留等离子波与磁强计继续获取星际介质数据。
这篇文章报道了康奈尔大学一位德语教师格里特·马蒂亚斯·费尔普斯(Grit Matthias Phelps)采用老式手动打字机进行教学的创新做法。每学期一次,她让学生们使用没有屏幕、没有拼写检查和在线翻译辅助的手动打字机完成德语写作作业,旨在让学生体验数字化之前的写作过程,培养他们独立思考和动手能力。
费尔普斯教授表示,这一做法源于她对学生普遍依赖生成式人工智能和在线翻译工具完成作业的担忧。她希望学生能真正理解写作的意义,而不是简单复制机器生成的内容。她从二手市场收集了几十台手动打字机,设计了“模拟”作业,让学生们远离数字设备,专注于写作本身。
学生们初次接触打字机时感到困惑,发现操作并不简单,需要手动装纸、用力敲击键盘、听打字机的铃声提示换行等。费尔普斯教授强调,这种慢节奏的写作方式让学生们体验到“一次只做一件事”的乐趣和专注感。
此外,学生们发现没有屏幕和通知的干扰,他们更容易集中注意力,写作过程中也更多地与同学交流和讨论,增强了社交互动。这种教学方法不仅是对抗人工智能写作的手段,更是一种让学生重新连接写作本质和课堂体验的尝试。
文章还指出,虽然手动打字机的使用尚未在其他学校广泛推广,但这种回归传统的教学趋势反映了教育界对人工智能带来的挑战的回应,包括更多采用纸笔考试和口头测试等方式防止学生依赖 AI 完成作业。
https://news.ycombinator.com/item?id=47818485
云开发平台 Vercel 近日确认遭遇安全事件,黑客声称已入侵其系统并试图出售被盗数据。Vercel 专注于为开发者提供 JavaScript 框架的托管和部署服务,尤其以 Next.js 框架闻名。此次安全事件影响了部分客户,Vercel 表示其服务未受影响,正在积极调查并与受影响客户合作,同时已通知执法部门。
调查显示,入侵源于第三方 AI 工具 Context.ai 的 Google Workspace OAuth 应用被攻破,攻击者通过一名 Vercel 员工的 Google 账户获得初始访问权限,随后进一步访问了未标记为敏感的环境变量,这些变量未加密存储,导致更多数据泄露。Vercel 强调其所有环境变量均采用加密存储,但存在将部分变量标记为“非敏感”的功能,攻击者利用这一点扩大了访问范围。
Vercel 已更新仪表盘,增强环境变量管理功能,建议客户审查环境变量并启用敏感变量加密。公司确认其开源项目如 Next.js 和 Turbopack 未受影响。
黑客自称“ShinyHunters”在黑客论坛发布消息,称出售包括访问密钥、源代码、数据库数据及内部部署访问权限等信息。该黑客还分享了包含 580 条 Vercel 员工信息的文件及内部仪表盘截图,但真实性尚未独立验证。黑客声称与 Vercel 有联系,并提出 200 万美元的赎金要求。
Vercel CEO Guillermo Rauch 在社交媒体上补充说明了事件细节,强调公司采取多层防护措施保护客户数据,并呼吁客户加强安全防护。事件仍在调查中,相关更新将持续发布。
https://news.ycombinator.com/item?id=47824463
美国国家标准与技术研究院(NIST)科学家开发出了一种新方法,通过在硅晶片上叠加特殊材料,制造出能够处理光子的集成光子芯片。这些芯片尺寸如指甲大小,能够产生多种颜色的激光,标志着将现有庞大且昂贵的激光系统微型化的重要进展。
这种集成光子芯片利用激光、波导、滤波器和开关等光学器件在芯片内部传输和处理信息,有望推动量子计算机、光学原子钟等新兴技术从实验室走向实际应用,影响生物医学、导航和通信等领域。
研究团队采用多层叠加结构,首先在硅晶片上覆盖二氧化硅和锂铌酸盐(能改变光颜色的非线性材料),再加入金属电极以电控光的转换和开关功能。随后叠加了第二种非线性材料五氧化二钽(tantala),能够将单一激光颜色转换成可见光彩虹及多种红外波长,实现多色激光输出。
通过这种三维叠层工艺,研究人员成功将不同材料的优势结合,实现高效的光路控制和颜色转换。每个芯片包含约一万个光子电路,能够输出独特颜色的激光光束。
这一技术突破有望解决目前激光器波长单一、体积大、成本高的问题,使量子技术更便携、更经济,从而加速其在人工智能、量子计算和精密计时等领域的应用发展。
https://news.ycombinator.com/item?id=47819453
https://decipher.sc/2026/04/19/vercel-says-internal-systems-hit-in-breach/
Vercel 是一家广泛使用的云平台,专注于应用开发和部署。该公司近日披露其内部系统遭遇安全入侵,影响了“有限子集的客户”。此次事件于周日曝光,Vercel 已聘请事故响应专家进行调查,并通知了执法部门。
调查显示,入侵源于一个第三方 AI 工具,该工具的 Google Workspace OAuth 应用遭到广泛攻击,可能影响了数百个组织的用户。Vercel 未透露具体受影响的系统和客户数量,但建议客户检查活动日志,注意异常行为,并更换环境变量。同时,建议客户使用其敏感环境变量功能,将 API 密钥等信息标记为敏感,从而以不可读格式存储。
由于入侵源自第三方应用,未来可能会有更多相关安全事件被发现。Vercel 正与受影响客户直接沟通,积极采取措施修复漏洞。该公司提供多种开发和企业服务,部分产品专注于智能代理 AI 工作负载。
文章作者 Dennis Fisher 是一位资深网络安全记者,报道了此次事件的最新进展。
https://news.ycombinator.com/item?id=47824976
https://samhenri.gold/blog/20260418-claude-design/
本文作者分享了对 Claude Design 工具的使用体验及其对设计工具未来发展的看法。随着产品团队规模扩大,设计为了在工程组织中证明自身价值,被推动向系统化发展,Figma 通过引入组件、样式、变量等原语实现这一目标,但其复杂性导致设计系统管理变得繁琐,甚至需要专门角色来维护。
Figma 与代码之间关于“真理源”的争论由来已久。Figma 凭借其封闭且难以程序化处理的格式,虽然赢得了市场,但也因此未能被大语言模型有效学习,未来随着代码对设计的支持增强,设计的“真理源”将逐渐回归代码层面,Figma 复杂的系统将显得过于繁琐和不合理。
作者指出,Figma 自身的设计系统文件极其复杂,变量和组件层层嵌套,调试困难,令人崩溃。未来设计工具将分化为两种形态:一种是像 Figma Make,继续以设计文件为核心,适合已经深度使用 Figma 体系的人;另一种则是像 Claude Design,基于 HTML 和 JavaScript,强调“材料的真实”,设计与代码无缝连接,减少摩擦。
此外,作者预测另一类工具将专注于纯探索和自由创作,不受系统限制,可能是支持手写笔的 iPad 应用或高保真合成工具,突破现有 CSS 效果的限制。
最后,作者对 Figma 和 Sketch 团队提出了建议,鼓励 Figma 吸纳更多人才,Sketch 则应大胆创新,增加更多高级视觉效果,提升竞争力。整体来看,Figma 正面临类似 Sketch 曾经经历的转折点,设计工具的未来将更加多样和开放。
https://news.ycombinator.com/item?id=47818700
https://www.theguardian.com/world/2026/apr/18/iran-war-bets-ethics-concerns
本文报道了在美以对伊朗战争期间,在线博彩市场如 Polymarket 和 Kalshi 出现了大量精准押注,涉及战争重大事件的时间点,导致巨额盈利,引发立法者和专家对内幕交易的担忧。文章指出,这些在线博彩市场已从传统体育赛事扩展到新闻事件,甚至商品期货交易,使得利用内幕信息获利的风险大大增加。
具体案例包括:2 月 27 日美以空袭伊朗前夜,约 150 个账户在 Polymarket 上押注空袭发生,累计投注达 85.5 万美元,其中 16 个账户各获利超过 10 万美元;随后一名匿名用户“Magamyman”在伊朗最高领袖哈梅内伊被以色列空袭刺杀前下注其将被“移除”,获利超过 55 万美元;4 月 7 日特朗普宣布临时停火前,至少 50 个账户押注停火,紧接着油价下跌,相关交易额高达 9.5 亿美元。
此外,油期货市场也出现类似异常交易,3 月 23 日和 4 月 7 日,交易者在特朗普发布与伊朗谈判进展消息前 15 分钟内大量买入,随后油价大幅下跌,带来丰厚回报。专家认为这些交易时间和金额异常,极可能涉及内幕信息。
监管方面,美国商品期货交易委员会(CFTC)正面临执法能力和立法缺失的挑战。CFTC 目前仅有一名委员,且其对预测市场持友好态度。各州政府对在线博彩市场的监管权存在争议,部分州对 Kalshi 提起诉讼,指控其无牌经营。CFTC 已秘密调查部分涉嫌内幕交易的油期货交易,但尚未公开确认。
总体来看,在线预测市场正处于“西部荒野”阶段,监管滞后,内幕交易风险突出,相关机构和立法者正寻求加强监管和执法力度,以防止市场被操纵。
https://news.ycombinator.com/item?id=47818305
https://twitter.com/weezerOSINT/status/2045849358462222720
一位用户在社交平台 X(前身为 Twitter)上发布了关于 Notion 的严重安全漏洞的警告。他指出,所有公共的 Notion 页面都在泄露每位编辑者的电子邮件地址,且这一过程没有任何身份验证、Cookies 或令牌。用户只需发送一个 POST 请求,就能获取页面上每位编辑者的全名、电子邮件和个人资料照片。
该用户提醒,如果某公司的维基页面是公开的,那么该公司的每位员工的电子邮件都有可能被曝光。他提到这一问题早在 2022 年就已被报告,但到 2026 年仍然存在,表明 Notion 在处理这一安全隐患方面没有取得进展。这引发了他对在线安全和数据保护的质疑。
https://news.ycombinator.com/item?id=47824945
https://madhadron.com/programming/seven_ur_languages.html
这篇文章讨论了编程语言的根本分类,称之为“七大编程原语言(ur-languages)”,并指出学习编程语言时理解这些根本语言的基本模式比纠结具体语言更重要。作者列出了七种原语言:ALGOL、Lisp、ML、Self、Forth、APL 和 Prolog。
ALGOL 类语言以顺序执行的赋值、条件和循环为特点,许多主流语言如 C、Java、Python 等都源自此类。它是最古老的原语言,起源于早期计算机编程历史。
Lisp 语言以前缀表达式和列表结构为核心,支持宏系统,允许程序员重新定义语言语义。它起源于数学表达式的自我求值问题,是第二古老的语言,曾在人工智能领域广泛使用。
ML 类语言强调函数作为第一类值,采用 Hindley-Milner 类型系统,所有迭代通过递归实现。该类语言包括 Standard ML、OCaml、Haskell 等,起源于定理证明工具的元语言。
Self 语言是一种面向对象语言,程序由对象组成,通过消息传递实现行为,条件和循环通过对象消息机制实现,体现了纯粹的对象模型。
文章还提到其他原语言,但内容未完全展开。总体来看,作者强调理解这些原语言的基本模式和思维方式,有助于更容易地学习和掌握各种具体编程语言。
https://news.ycombinator.com/item?id=47822486
https://www.lbc.co.uk/article/dubai-police-spied-private-whatsapp-5HjdXwr_2/
该网页报道了一名航空公司员工因在私人 WhatsApp 群组中分享中东冲突引发的炸弹爆炸照片,被迪拜警方逮捕的事件。警方通过电子监控手段进入该私人群聊,获取证据后诱导该员工赴会面地点并实施逮捕。该员工面临包括发布被视为危害国家利益信息的指控,最高刑期为两年,目前仍被拘留。
报道指出,迪拜警方确认他们具备监控私人 WhatsApp 消息的能力,利用电子监控技术追踪、识别并逮捕用户,即使这些信息只在私密群组内交换。伦敦维权组织“被拘留在迪拜”首席执行官 Radha Stirling 呼吁 WhatsApp 等公司对用户隐私保护进行回应,强调如果私密通讯被政府监控并作为逮捕依据,全球用户需了解其数据如何被访问。
文章还提到,阿联酋政府控股的电信公司 Etisalat 和 Du 使安全部门能够监控其网络上的所有通讯。此外,阿联酋还使用以色列开发的 Pegasus 间谍软件,该软件能在用户未主动操作的情况下感染设备,监听通话并读取加密消息。多名游客、航空员工和居民曾因发送、接收或保存相关内容而被拘留。
整体报道揭示了迪拜在国家安全名义下对私人通讯的严密监控及其对个人自由的影响,引发了对隐私权和言论自由的担忧。
https://news.ycombinator.com/item?id=47824068
这篇文章报道了 2026 年 4 月 17 日,美国宇航局(NASA)喷气推进实验室(JPL)工程师远程关闭了“旅行者 1 号”探测器上的低能带电粒子实验仪(LECP),以延长这艘核动力航天器的运行寿命。LECP 自 1977 年旅行者 1 号发射以来几乎持续工作了近 49 年,主要用于测量来自太阳系和银河系的低能带电粒子,包括离子、电子和宇宙射线,提供了关于星际介质结构的重要数据。
由于旅行者 1 号依靠放射性同位素热电发生器供电,每年电力输出减少约 4 瓦,随着时间推移,电力储备变得非常紧张。为了避免探测器因电力不足而自动关闭保护系统,工程师们不得不关闭部分仪器以节省能量,同时确保探测器不会因温度过低导致燃料管线冻结。
此次关闭 LECP 是权衡后的最佳选择,旅行者 1 号仍有两个科学仪器在运行,分别用于监听等离子波和测量磁场,继续从人类从未涉足的星际空间区域传回数据。NASA 团队将继续努力,尽可能延长旅行者探测器的工作时间,保持对星际空间的探索。
https://news.ycombinator.com/item?id=47820531
https://news.ycombinator.com/item?id=47819796
When I did my Computer Science degree the vast majority of courses were 50% final, 30% midterm - even programming exams were hand written, proctored by TAs in class or in the gymnasium - assignments/labs/projects were a small part of your grade but if you didn’t do them the likelihood you’d pass the term exams was pretty darn low.
We already had AI proof education.
throwatdem12311
当我读计算机科学学位时,大多数课程的成绩构成是期末占50%,期中占30%——即使是编程考试也是手写的,由助教在课堂或体育馆监督——作业、实验和项目只占成绩的一小部分,但如果你不做它们,通过学期考试的可能性非常低。
我们已经拥有了防AI的教育。
https://news.ycombinator.com/item?id=47824861
One of the fun features that I developed for Warcraft (the RTS) was to fade the screen to grayscale when the game is paused.
Since the game uses a 256 color palette, it was only necessary to update a few bytes of data (3x256) instead of redrawing the whole screen, so the effect was quick.
I also used this trick when the game stalled due to missing network packets from other players. Initially the game would still be responsive when no messages were received so that you could still interact and send commands. After a few seconds the game would go into paused state with grayscale screen to signify the player that things were stuck. Then several seconds after that a dialog box would show allowing a player to quit the game.
This was much less disruptive than displaying a dialog box immediately on network stall.
netcoyote
我为魔兽争霸(即时战略游戏)开发的一个有趣功能是当游戏暂停时,将屏幕变成灰度。
由于游戏使用的是256色调色板,只需更新少量字节的数据(3x256),而不必重绘整个屏幕,因此这种效果非常快。
当由于其他玩家丢失网络数据包导致游戏卡顿时,我也使用了这个技巧。刚开始当没有收到消息时,游戏仍然是响应的,你仍然可以互动和发出指令。几秒钟后,游戏进入暂停状态,屏幕变成灰度,提示玩家游戏卡住了。然后几秒钟后会弹出一个对话框,允许玩家退出游戏。
这样比在网络卡顿时立即弹出对话框要不那么令人不快。
https://news.ycombinator.com/item?id=47825592
I’ve been part of a response team on a security incident and I really feel for them. However, this initial communication is terrible.
Something happened, we won’t say what, but it was severe enough to notify law enforcement. What floors me is the only actionable advice is to “review environment variables”. What should a customer even do with that advice? Make sure the variable are still there? How would you know if any of them were exposed or leaked?
The advice should be to IMMEDIATELY rotate all passwords, access tokens, and any sensitive information shared with Vercel. And then begin to audit access logs, customer data, etc, for unusual activity.
The only reason to dramatically overpay for the hosting resources they provide is because you expect them to expertly manage security and stability.
I know there is a huge fog of uncertainly in the early stages of an incident, but it spooks me how intentionally vague they seem to be here about what happened and who has been impacted.
toddmorey
我曾参与过一次安全事件响应团队工作,真的很能理解他们的感受。然而,这次的初步通报非常糟糕。
事情发生了,但他们不说具体是什么,只说严重到需要通知执法部门。让我非常震惊的是,唯一可操作的建议竟然是“检查环境变量”。客户到底该怎么根据这个建议行动?确认环境变量还在?怎么判断有没有被泄露或曝光?
正确的建议应该是立即更换所有密码、访问令牌以及任何与Vercel共享的敏感信息。然后开始审计访问日志、客户数据等,查找异常活动。
客户之所以愿意高价支付他们的托管服务,就是因为期望他们能够专业地管理安全和稳定。
我知道事件早期阶段会有很多不确定因素,但他们在这里对发生了什么以及谁受影响的问题如此含糊其辞,反而让我感到不安。
https://news.ycombinator.com/item?id=47820129
Say whatever you want about the merits of prediction markets. But I just don’t see a way those benefits outweigh the societal dangers of these constant reminders that people in or close to power can freely profit from their positions in the ways the rest of the population can’t. There’s always talk about the dangers of disincentivizing job creators, but what happens when a society routinely disincentives job havers in this way? We’re just getting a constant barrage of information telling us that if we show up to our job and simply work as we’re expected that we’re stooges who won’t get ahead. You’ll need to look for your own individual scheme, ethics be damned, if you just want to keep up with the rest of the population. That’s not healthy on an individual level or cumulatively at a societal level.
slg
无论你怎么说预测市场的优点,我就是看不出这些好处能超过它带来的社会危险。因为这种不断提醒人们,处于权力中心或接近权力的人可以自由地利用他们的位置获利,而普通大众却做不到。这总是被拿来谈论的——担心会削弱“创造就业者”的积极性,但当一个社会经常以这种方式削弱“有工作者”的积极性时,会发生什么呢?我们不断被告知,如果你按要求去上班、按部就班地工作,你就是被利用的傀儡,无法取得进步。为了跟上别人,你必须另辟蹊径,甚至不顾道德。这对个人来说不健康,对整个社会来说累计起来也很有害。
https://news.ycombinator.com/item?id=47820262
Everyone talking about magenta and brown, but you can see an illusory color right now even without lasers! https://dynomight.net/colors/ behold, some kind of hyper-turquoise
adzm
大家都在讨论品红色和棕色,但即使没有激光,你现在也能看到一种错觉色!https://dynomight.net/colors/ 看啊,某种超级蓝绿色。
https://news.ycombinator.com/item?id=47816375
“Japan’s liberal land use regulation makes it straightforward to build new neighborhoods next to railway lines, giving commuters easy access to city centers. It also enables the densification of these centers, which means that commuters have more places they want to go.”
This is the most important paragraph in the article. It can’t be overstated how ingenious Japan’s system of zoning is and how much this has benefitted their society in ways we can only dream about here in the West.
ttul
“日本宽松的土地使用管制使得在铁路沿线建设新社区变得简便,为通勤者提供了便捷通达市中心的条件。它也促进了这些市中心的高密度发展,这意味着通勤者有更多想去的地方。”
这是文章中最重要的一段。日本的分区制度有多么巧妙,以及这对他们社会带来的益处,我们在西方只能梦想,绝不能被低估。
https://news.ycombinator.com/item?id=47822491
One of the things that impressed me in Quake (the first one) was the demo recording system. The system was deterministic enough that it could record your inputs/the game state and just play them back to get a gameplay video. Especially given that Quake had state of the art graphics at the time, and video playback on computers otherwise was a low-res, resource intensive affair at the time, it was way cool.
It always surprised me how few games had that feature - though a few important ones, like StarCraft, did - and it only became rarer over the years.
vintermann
《雷神之锤》(第一作)中让我印象深刻的一点是演示录制系统。该系统足够确定性,能够记录你的输入和游戏状态,然后通过回放来生成游戏视频。尤其是考虑到当时《雷神之锤》拥有最先进的图形效果,而计算机上播放视频通常是低分辨率且资源消耗大的事情,这一点非常酷。
令我惊讶的是,拥有这一功能的游戏竟然 so 少,虽然有几款重要的游戏,比如《星际争霸》,具备这个功能——而且随着时间推移,这种功能变得越来越罕见。
https://news.ycombinator.com/item?id=47815983
I moved two servers, one from Linode and the other from DO to Hetzner a few months ago, with similar savings. The best part was that the two servers had tens of different sites running, implemented in different languages, with obsolete libraries, MySQL and Redis instances. A total mess. Well: Claude Code migrated it all, sometimes rewriting parts when the libraries where no longer available. Today complex migrations are much simpler to perform, which, I believe, will increase the mobility across providers a lot.
antirez
几个月前,我将两台服务器从Linode和DO迁移到了Hetzner,节省了差不多的费用。最棒的是,这两台服务器上运行着几十个不同的网站,使用不同的编程语言,依赖过时的库,还有MySQL和Redis实例,整体一团糟。Claude Code帮我完成了所有迁移,有时还会在库不再可用时重写部分代码。如今复杂的迁移变得容易多了,我相信这将极大地提升跨服务商的流动性。
https://news.ycombinator.com/item?id=47818083
agents eat that glue
No wonder they hallucinate :)
grim_io
特工们吃了那种胶水
难怪他们会产生幻觉 :)
https://news.ycombinator.com/item?id=47819584
lol yes. At least in agency world, a common approach in the last X years has been that designers create entire pixel-perfect, component-based sources-of-truth in Figma (which evolve! they aren’t delivered static and complete) – these are also what the client sees and approves, or at the very least they see branded deck slides that incorporate the Figma designs. Anyways, front end then re-implements from Figma into CSS, except it’s usually best-approximation (not pixel-perfect) partially because, despite Figma allowing you to “copy CSS” for an element, it’s unusable, almost inline CSS (and usually not aware of its ascendents and descendents, or any variables you’re maintaining in CSS, or any class hierarchies, etc), and partially because the units of measurement aren’t always identical on either side. You’ll also often have multiple FE devs recreating components independently of each other (as a team effort), which can lead to drift and different implementations, which is fun. Then, depending upon the tech stack, FE might be building these components in something like Storybook [0] as a “front end source of truth”, which then are either directly injected into a React or NextJS app or whatever, or sometimes they’re partially or fully re-implemented again into BE components in the CMS (ex. Sitefinity). Then people ask which one is the source of truth, but really it’s a chain of sources of truth that looks more like the telephone game than a canonical “brand bible”. Then throw in any out-of-the-box future client efforts (say, a promotional landing page hosted outside of the main project) and you may have yet another reimplementation of part of the same design, but in a completely different system.
kevinsync
哈哈,是的。至少在广告公司行业,过去几年常见的做法是设计师们会在Figma中创建完整的像素级精确、基于组件的“唯一真实源”(source-of-truth)(并且是不断演变的!它们不是静态且完整交付的)——客户看到并批准的也是这些设计,或者至少他们会看到包含Figma设计的品牌演示幻灯片。前端开发再从Figma中将设计转换成CSS,不过通常是近似最佳的实现(而不是完全像素级精确),部分原因是尽管Figma允许你“复制CSS”给某个元素,但这些CSS几乎相当于内联样式,基本不可用(而且通常不会考虑其父级和子级元素,或者你在CSS中维护的变量,或任何类的层级结构等),另一方面则是因为两端的单位测量不一定完全一致。你还经常会有多个前端开发人员在团队协作下独立重建组件,这可能会导致设计和实现的偏差,这挺有趣的。然后,根据技术栈,前端可能会在类似Storybook这样的工具中构建这些组件作为“前端唯一真实源”,这些组件随后要么直接注入到React或NextJS等应用中,要么有时会被部分或全部再次重新实现到内容管理系统(CMS)中的后端组件(例如Sitefinity)。然后大家会问哪个才是真正的“唯一真实源”,但实际上这是一个多层“唯一真实源”的链条,更像是传话游戏,而不是真正权威的“品牌圣经”。再加上以后任何现成的客户项目(比如一个托管于主项目外的促销落地页),你可能会看到同一设计的又一次重实现,但完全是在另一个系统里。
https://news.ycombinator.com/item?id=47824272
publishing information deemed harmful to state interests
Is the charge, which I think kind of speaks for itself. Full on: “You embarrassed us, straight to jail.”
In most of the world such photos would be deemed of public interest and shared by the media then we’d reflect on if our routing is safe/correct and make proportional changes for safety. Not a big deal, nobody is fired, life moves on.
I feel like actions like this are going to hurt the UAE themselves, because how can you improve if there is no dialog? No information to even start a dialog? A lot of hard conversations are NOT going to be had because I guess it is a state secret?
Someone1234
发布被认为有害于国家利益的信息
这是指控的内容,我觉得这本身就很明白。完全的意思是:“你让我们丢脸了,直接进监狱。”
在世界大多数地方,这样的照片会被认为是公共利益相关,媒体会分享,然后我们会反思我们的路线是否安全/正确,并做出相应的安全调整。这没什么大不了的,没有人被解雇,生活照旧。
我觉得这样的做法反而会伤害阿联酋自己,因为如果没有对话,怎么可能改进呢?连开始对话的信息都没有?很多艰难的讨论根本不会发生,因为我猜那是国家机密?
https://news.ycombinator.com/item?id=47824358
how can you improve if there is no dialog
The UAE doesn’t have a self-advancement culture, it’s a capital-backed monarchy that imports pretty much all of its research and production; in other words it piggy-backs on the knowledge produced in other societies. There is no advancement through dialog in the country itself.
tremon
如果没有对话,你怎么能进步呢?
阿联酋没有自我提升的文化,它是一个由资本支持的君主制国家,几乎所有的研究和生产都依赖进口;换句话说,它是借助其他社会产生的知识发展起来的。这个国家内部没有通过对话实现进步。
https://news.ycombinator.com/item?id=47818333
For a fair comparison you need to look at the total cost, because 4.7 produces significantly fewer output tokens than 4.6, and seems to cost significantly less on the reasoning side as well.
Here is a comparison for 4.5, 4.6 and 4.7 (Output Tokens section):
4.7 comes out slightly cheaper than 4.6. But 4.5 is about half the cost:
Notably the cost of reasoning has been cut almost in half from 4.6 to 4.7.
I’m not sure what that looks like for most people’s workloads, i.e. what the cost breakdown looks like for Claude Code. I expect it’s heavy on both input and reasoning, so I don’t know how that balances out, now that input is more expensive and reasoning is cheaper.
On reasoning-heavy tasks, it might be cheaper. On tasks which don’t require much reasoning, it’s probably more expensive. (But for those, I would use Codex anyway ;)
andai
为了公平比较,你需要关注总成本,因为4.7产生的输出标记明显少于4.6,并且推理部分的成本似乎也显著更低。
这里是4.5、4.6和4.7的比较(输出标记部分):
4.7的成本略低于4.6。但4.5的成本大约只有一半:
值得注意的是,推理成本从4.6到4.7几乎减少了一半。
我不确定对于大多数人的工作负载来说这意味着什么,比如Claude Code的成本构成如何。我预计它在输入和推理两方面的成本都较重,所以现在输入成本变高而推理成本下降,不知道整体平衡如何。
对于推理密集型任务来说,可能会更便宜。对于不需要太多推理的任务,可能会更贵。(不过对于那些任务,我无论如何都会使用Codex;)
https://news.ycombinator.com/item?id=47823550
From 1988-91, I was a volunteer teacher in Africa. I lived in a hut without running water or electricity, and I had a subscription to Byte.
There was also almost nothing to read, so when my monthly issue of Byte appeared (2-3 months later than most people would receive it), I devoured that thing. I would read it literally cover to cover, including all those ads, several times.
I wasn’t (then) working in IT, so a lot of the content (like Steve Ciarcia’s Circuit Cellar) went way over my head but it didn’t matter, I read it anyway, often by the light of my kerosene lantern. I learned a huge amount: object-oriented programming, this new thing called the Internet (capitalized back then, and before the WWW), and how Jerry Pournelle was a self-important jerk (but boy, did I envy the toys he got to play with!).
This was the age of big, fold-out Gateway 2000 ads, 20MB hard drives, and Turbo Pascal kicking other compilers’ butts.
I would read the magazine, then write out programs (in BASIC, the only language I had learned at that point). On my monthly trips to the capital city I would go to a local NGO and in exchange for helping with their IT issues they would let me play (i.e type out my programs and try to get them working) on their computers.
gramie
1988年至1991年间,我在非洲做志愿教师。我住在没有自来水和电的茅屋里,订阅了一份Byte杂志。
几乎没有什么东西可读,所以当我每月的Byte杂志(比大多数人晚两三个月才收到)到来时,我如饥似渴地读它。我几乎会从头到尾读,包括所有广告,而且不止一次。
那时我还没从事IT工作,所以很多内容(比如Steve Ciarcia的Circuit Cellar)我都听不懂,但没关系,我还是读了,常常是在煤油灯的灯光下。我学到了很多东西:面向对象编程,这个后来被称为互联网的新事物(当时还是大写的,而且还没有WWW),还有Jerry Pournelle是个自以为是的混蛋(不过,我真羡慕他能玩到那些“玩具”!)。
那是大型折叠式Gateway 2000广告盛行的时代,20MB的硬盘,以及Turbo Pascal横扫其他编译器的年代。
我会读杂志,然后用BASIC写程序(这是我当时唯一学过的语言)。每个月我去首都的时候会到一家当地的非政府组织,帮他们解决IT问题,作为交换,他们允许我使用他们的电脑(也就是把程序打出来并尝试让它们运行)。
https://news.ycombinator.com/item?id=47819716
I used it today to take a look at my previously built design system with Logos, branding, fonts, and everything else. After a lot of annoying tweaking back and forth, finally, I got something that was satisfactory.
Then I looked at the usage and it said I had used 95% of my Claude design usage for the week!
This isn’t a real tool. This is a plaything, if that’s what they’re providing as examples.
mickdarling
我今天用它查看了我之前建立的设计系统,包括标志、品牌、字体以及其他所有内容。经过反复烦人的调整,最后我得到了一个满意的结果。
然后我查看使用情况,发现我这周已经使用了95%的Claude设计额度!
这不是真正的工具。如果他们提供的例子就是这样,那这更像是个玩具。
https://news.ycombinator.com/item?id=47822869
It wasn’t really that much to do with determinism. Quake uses a client-server network model all the time, even when you’re only playing a local single-player game. What the demo recording system does is capture all of the network packets that are being sent from the server to the client. When playing back a demo, all the game has to do is run a client and replay the packets that it originally received from the server. It’s a very elegant system that naturally flows out of the rather forward-looking decision to build the entire engine around a robust networking model.
ndepoel
这其实和确定性关系不大。《雷神之锤》一直使用客户端-服务器网络模型,即使你只是玩本地单人游戏。演示录像系统所做的就是捕捉服务器发送给客户端的所有网络数据包。在回放演示时,游戏只需运行一个客户端并重放它最初从服务器接收到的数据包。这是一个非常优雅的系统,自然而然地体现了当初围绕一个强大的网络模型构建整个引擎的前瞻性决策。
https://news.ycombinator.com/item?id=47820811
And the men that had spent longer looking after babies showed the largest drops in testosterone. Those that shared a bed with their infants also had lower levels.
Dad here. Maybe…it’s the lack of sleep? Involved fathers tend to have less sleep.
syntaxing
那些花更多时间照顾婴儿的男性,睾酮水平下降得最大。和婴儿同床的那些男性睾酮水平也较低。
作为一个爸爸,可能是……缺乏睡眠的原因?积极参与育儿的父亲通常睡眠时间较少。
https://news.ycombinator.com/item?id=47817640
we don’t want a hard dependency on another multi-billion dollar company just to write software
One of two main reasons why I’m wary of LLMs. The other is fear of skill atrophy. These two problems compound. Skill atrophy is less bad if the replacement for the previous skill does not depend on a potentially less-than-friendly party.
ahartmetz
我们不希望为了编写软件而不得不强依赖另一家市值数十亿美元的大公司。
这是我对大型语言模型持谨慎态度的两个主要原因之一。另一个原因是害怕技能退化。这两个问题相互叠加。如果新技能的替代不依赖于可能不太友好的第三方,技能退化的问题就没那么严重。
https://news.ycombinator.com/item?id=47811597
So, a few things, some of which others have touched on:
Fil-C is slower and bigger. Noticeably so. If you were OK with slower and bigger then the rewrite you should have considered wasn’t to Rust in the last ten years but to Java or C# much earlier. That doesn’t invalidate Fil’C’s existence, but I want to point that out.
You’re still writing C. If the program is finished or just occasionally doing a little bit of maintenance that’s fine. I wrote C for most of my career, it’s not a miserable language, and you are avoiding a rewrite. But if you’re writing much new code Rust is just so much nicer. I stopped writing any C when I learned Rust.
This is runtime safety and you might need more. Rust gives you a bit more, often you can express at compile time things Fil-C would only have checked at runtime, but you might need everything and languages like WUFFS deliver that. WUFFS doesn’t have runtime checks. It has proved to its satisfaction during compilation that your code is safe, so it can be executed at runtime in absolute safety. Your code might be wrong. Maybe your WUFFS GIF flipper actually makes frog GIFs purple instead of flipping them. But it can’t crash, or execute x86 machine code hidden in the GIF, or whatever, that’s the whole point.
tialaramex
所以,有几点想说,其中一些别人也提到了:
Fil-C 更慢且体积更大,非常明显。如果你能接受更慢更大的话,那么你在过去十年考虑重写的对象,应该不是 Rust,而是更早的 Java 或 C#。这并不否定 Fil-C 的存在价值,但我想指出这一点。
你仍然在写 C 语言。如果程序已经完成或只是偶尔做一点维护,那没问题。我职业生涯中大部分时间都写 C,它并不是一门糟糕的语言,而且你也避免了重写。但如果你写很多新代码,Rust 会好得多。我学会 Rust 后就不再写任何 C 了。
这是关于运行时安全的问题,而你可能需要更多。Rust 提供了更多的安全保障,很多事情可以在编译时表达,而 Fil-C 只能在运行时检查,但你可能需要所有这些保障,像 WUFFS 这样的语言就能做到。WUFFS 没有运行时检查。它在编译期间证明了你的代码是安全的,因此运行时可以绝对安全地执行。你的代码可能有错。也许你的 WUFFS GIF 翻转器实际上是让青蛙 GIF 变成紫色而不是翻转它们。但它不会崩溃,也不会执行 GIF 中隐藏的 x86 机器码,这才是关键。
https://news.ycombinator.com/item?id=47825660
Seriously. Why am I reading about this here and not via an email? I’ve been a paying customer for over a year now. My online news aggregator informs me before the actual company itself does?
birdsongs
说真的,为什么我要在这里看到这些信息,而不是通过电子邮件收到通知?我已经是付费用户一年多了。连我用的在线新闻聚合器都比公司官方先告诉我消息?
https://news.ycombinator.com/item?id=47811870
Like the original Grammarly, I think this can be useful for business writing because these tools help you get to the point. Many students are rewarded for using flowery language in school essays, but if you’re composing an email or writing a design doc, just optimize for reading time and clarity.
But for general use, I think this is misguided. The problem with LLM output is not that it’s using em dashes or words such as “crucial”. It’s that most LLM articles on LinkedIn or on personal blogs just take a one-sentence prompt and dress it up into a lot of pointless words, wasting everyone’s time: “I had a shower thought and I asked a chatbot to write five pages of text about it.” I don’t need prettier words, I need there to be far fewer of them?
On the flip side, if you’re a human and actually have something of consequence to say, “delve” all you want.
chromacity
像原版的Grammarly一样,我认为这对商务写作很有用,因为这些工具帮助你直截了当地表达观点。许多学生在学校作文中因为使用华丽的语言而获得好评,但如果你是在写电子邮件或设计文档,最好还是优化阅读时间和清晰度。
但在一般使用上,我觉得这是误入歧途。大语言模型生成内容的问题不在于它用了破折号或“关键”这样的词,而是大多数大语言模型在LinkedIn或个人博客上的文章,只是根据一句话的提示堆砌了许多无意义的赘词,浪费大家的时间:“我有个灵感,于是让聊天机器人写了五页文字。”我不需要更漂亮的词汇,我需要的是用词更少。
另一方面,如果你是真正有人生要事要说的人,想“深入探讨”尽管去吧。
https://news.ycombinator.com/item?id=47815349
This explanation is relatively reductive when it comes to its criticism of computational geometry.
The thing with computational geometry is, that its usually someone else’s geometry , i.e you have no control over its quality or intention. In other words, whether two points or planes or lines actually align or align within 1e-4 is no longer really mathematically interesting because its all about the intention of the user : does the user think these planes overlap?.
This is why most geometry kernels (see open cascade) sport things like “fuzzy boolean operations” [0]) that lean into epsilons. These epsilons mask the error-prone supply chain of these meshes that arrive in your program by allowing some tolerance.
Finally, the remark “There are many ways of solving this problem” is also overly reductive, everyone reading here should really understand that this is a topic that is being actively researched right now in 2026 , hence there are currently no blessed solutions to this problem, otherwise this research would not be needed. Even more so, to some extent this problem is fundamentally unsolvable depending on what you mean by “solvable”, because your input is inexact not all geometrical operations are topologically valid, hence an “exact” or let alone “correct along some dimension” result cannot be achieved for all (combination of) inputs.
[0] https://dev.opencascade.org/content/fuzzy-boolean-operations
vouwfietsman
对于计算几何的批评,这个解释较为简化。
计算几何的问题在于,几何通常是别人的,也就是说你无法控制其质量或意图。换句话说,两个点、平面或直线是否真的对齐,或者在1e-4的误差范围内对齐,已经不再是纯粹的数学兴趣点,因为这完全取决于用户的意图:用户是否认为这些平面是重叠的?
这也是为什么大多数几何核(参见Open Cascade)采用诸如“模糊布尔运算”[0]之类的方法,依赖于一定的容差。这些容差掩盖了由于网格数据来源复杂导致的误差,通过允许一定的容忍度来解决这个问题。
最后,提到“有很多解决该问题的方法”也过于简化,阅读这里的每个人都应清楚,2026年这个话题仍在积极研究中,因此目前并不存在公认的最终解决方案,否则根本无需继续研究。更重要的是,从某种程度上讲,这个问题本质上是无法完全解决的,这取决于你对“解决”一词的定义,因为输入本身并不精确,并非所有几何操作在拓扑上都是有效的,因此无法对所有(组合)输入得到“精确的”或至少“在某个维度上正确的”结果。
[0] https://dev.opencascade.org/content/fuzzy-boolean-operations
2026-04-19 08:41:31
- 作者将多服务从 DigitalOcean 迁至 Hetzner,大幅降本并提速,按降 TTL、rsync、MySQL 复制与反代切换等步骤实现零停机并完成 CentOS7→AlmaLinux 9.7 升级。
- smolvm 提供亚秒级冷启动、单文件打包与默认隔离网络的便携虚拟机,旨在以类容器易用性取代 Docker,并关注 k3s 与未来直播迁移等能力。
- 月球尘埃极细尖锐且与氧接触迅速反应散发似火药气味,致“月球花粉症”等刺激风险,未来任务需更强过滤、密封与除尘。
- 社区对比显示升级至 Opus 4.7 后平均请求体积与成本统计上升约三成,同时强制自适应思考让输出更短引发质量争议且无法关闭。
- Kdenlive 2025 年多次更新并规划 26.04 功能,用户称其功能强与门槛低但稳定性受质疑,部分更偏好更简洁且略稳的 Shotcut。
- 日本铁路的领先源于企业结构与土地/交通政策协同(含私铁“轨道+地产”模式),并以严禁路边停车和购车需车位证明等制度支撑高密度公共出行。
- 该区间计算器以不相交区间并集进行运算并采用全精度向外舍入,能正确处理含零除法与函数逆等传统区间算术难题。
- iTerm2 因 SSH 集成误信终端转义致本地命令被拼接执行,甚至“cat readme.txt”即可触发 RCE,补丁未入稳定版提醒谨慎查看不受信文本。
- B-52 的星象跟踪仪采用机电角度计算机以齿轮、电机与同步器实现三角运算,将星历转为本地方位与高度以驱动自动锁星并输出导航定位。
- Amiga Graphics Archive 收藏展示 Amiga 图形与技术史料,并对 68000 系列“16/32 位”称谓与架构特性提供背景讨论。
https://isayeter.com/posts/digitalocean-to-hetzner-migration/
这篇文章详细介绍了作者将服务器从 DigitalOcean 迁移到 Hetzner 的全过程,重点强调了迁移过程中实现零停机时间的策略和技术细节。作者因土耳其里拉贬值导致美元计价的基础设施费用大幅上涨,决定寻找性价比更高的服务器,最终选择了 Hetzner 的 AX162-R 服务器,月费用从 1432 美元降至 233 美元,每年节省约 1.4 万美元,同时硬件配置更强大。
迁移涉及的系统包括 30 个 MySQL 数据库(248GB 数据)、34 个 Nginx 虚拟主机、GitLab EE、Neo4j 图数据库、Supervisor 后台任务管理、Gearman 任务队列及多个活跃的移动应用。旧服务器运行 CentOS 7,迁移时升级到 AlmaLinux 9.7 以获得更好的安全支持。
迁移策略分为六个阶段:1)在新服务器上完整安装并配置所有服务,确保配置一致;2)使用 rsync 同步网站文件;3)通过 MySQL 主从复制实现数据库实时同步,避免停机;4)降低 DNS 记录 TTL,加快切换速度;5)将旧服务器的 Nginx 配置改为反向代理,保证 DNS 切换期间请求无中断;6)切换 DNS 指向新服务器,旧服务器保留一周后关闭。
数据库迁移是最复杂的部分,作者使用 mydumper/myloader 工具利用多线程并行导出导入,极大缩短了时间。迁移过程中遇到 MySQL 从 5.7 升级到 8.0 带来的 mysql.user 表结构不匹配问题,通过强制升级和删除 sys 数据库解决。设置复制时遇到重复键错误,表明数据导出分两步完成导致冲突,具体解决方案未详细说明。
整体迁移过程保证了服务持续可用,避免了传统迁移中常见的停机风险,且显著降低了成本,提高了性能。作者建议对于稳定运行的工作负载,考虑专用服务器替代云服务,以获得更优的价格性能比。
https://news.ycombinator.com/item?id=47815774
https://github.com/smol-machines/smolvm
该网页介绍了 smolvm,这是一个命令行工具,用于本地管理和运行定制的 Linux 虚拟机,具备亚秒级冷启动、跨平台支持(macOS 和 Linux)以及弹性内存使用等特点。用户可以将状态化虚拟机打包成单个文件(.smolmachine),实现跨平台的快速恢复。
主要功能包括:
安装方式包括通过脚本安装或从 GitHub Releases 下载。示例命令展示了如何运行命令、交互式使用虚拟机、限制网络访问、打包 Python 环境以及管理持久虚拟机等操作。该工具适合沙箱运行不可信代码、打包便携环境和安全开发等多种场景。
https://news.ycombinator.com/item?id=47808268
https://www.esa.int/Science_Exploration/Human_and_Robotic_Exploration/The_toxic_side_of_the_Moon
该网页是欧洲航天局(ESA)官方网站的内容汇总页面,涵盖了 ESA 的组织介绍、成员国信息、科学探索、空间安全、应用项目以及技术支持等多个方面。
页面首先介绍了 ESA 作为欧洲通往太空的门户,致力于推动欧洲航天能力的发展,并确保航天投资惠及欧洲及全球公民。随后列出了 ESA 的 23 个成员国,展示了 ESA 与各国国家机构的合作。
在科学与探索板块,介绍了太阳系探索、空间科学、人类与机器人探测任务,以及著名航天员名单和多个重要航天任务,如 Juice、Euclid、Webb、Solar Orbiter 等。页面还包含最新的科学新闻和视频,如火星火山灰扩散、月球与地球的美景,以及国际空间站上的 3D 金属打印技术突破。
空间安全部分重点介绍了保护地球生命和轨道基础设施的措施,包括小行星防御、空间碎片管理、空间天气监测等。相关任务如 Hera 小行星探测和 Flyeye 自动小行星观测望远镜也有详细报道。
应用板块展示了利用航天技术服务地球的项目,如地球观测、气象、卫星导航(Galileo、EGNOS)、安全通信及商业化平台。最新动态包括卫星展示、云和气溶胶观测卫星 EarthCARE 的媒体邀请等。
技术支持与发展部分涵盖了航天器制造、测试中心、设计设施、先进概念团队以及航天运输系统(Ariane、Vega、Space Rider)等内容。页面还介绍了 ESA 的地面站、操作系统及最新的技术新闻和活动。
整体来看,该网页内容丰富,涵盖 ESA 的组织结构、成员国合作、科学探索成果、空间安全策略、应用项目进展及技术支持,旨在全面展示 ESA 在推动欧洲及全球航天事业中的多方面努力和最新动态。
https://news.ycombinator.com/item?id=47808913
https://tokens.billchambers.me/leaderboard
该网页展示了社区对比 Opus 4.6 和 Opus 4.7 两个版本在实际请求中的匿名请求令牌(token)变化情况。页面通过 425 次提交的平均数据,显示了请求令牌数量和请求成本均有约 37.4% 的增长,平均请求大小从 369 增加到 495。
页面列出了最近 50 次匿名对比的详细数据,包括每次提交的 ID、请求令牌变化百分比、请求成本变化百分比以及具体的成本数值。数据表明,绝大多数请求在升级到 Opus 4.7 后,令牌数量和成本都有不同程度的提升,部分请求成本增长甚至超过 50%。
整体来看,网页主要用于展示社区用户在使用 Opus 4.6 与 4.7 版本时,令牌使用量和成本的变化趋势,帮助用户了解新版本在实际应用中的资源消耗情况。页面还提供了提交请求的匿名 ID,确保数据的匿名性和透明度。
https://news.ycombinator.com/item?id=47816960
https://kdenlive.org/news/2026/state-2026/
该网页是关于 Kdenlive 视频编辑软件 2025 年的发展总结及未来规划的详细报告。2025 年,Kdenlive 团队在持续开发、协作和社区支持下取得了显著进展,重点在于新功能添加、界面优化、性能提升和稳定性保障。
主要发布版本包括:
未来计划包括即将发布的 26.04 版本,将支持监视器镜像、动画过渡预览及自动调整过渡时长等新功能,提升多显示器协作体验。此外,还将支持批量调整剪辑播放速度、直接从时间线导入剪辑、始终以鼠标位置缩放时间线和为序列生成音频缩略图。
路线图中提到将继续完善 MLT 多媒体框架,计划支持 10/12 位色彩、播放优化和 OpenFX 特效,重构字幕系统,开发高级修剪工具。关键帧系统也在重构中,将引入 Dopesheet 功能,实现多效果参数的独立关键帧管理。
团队方面,2025 年有 38 位贡献者参与代码贡献,其中约半数为首次贡献者,核心团队由 8 名活跃成员组成。团队还举办了多次线下冲刺活动,如阿姆斯特丹和柏林冲刺,讨论技术改进、产品管理和未来规划。
此外,团队正在努力使 Kdenlive 支持微软 Visual Studio 编译,以便未来能通过微软商店发布,并在 Windows 持续集成中运行单元测试。
整体来看,Kdenlive 在 2025 年实现了功能创新与稳定性提升的平衡,社区活跃,未来发展方向明确,致力于为用户提供更高效、灵活和专业的视频编辑体验。
https://news.ycombinator.com/item?id=47815118
https://worksinprogress.co/issue/why-japan-has-such-good-railways/
这篇文章探讨了日本铁路系统为何如此出色,并指出其成功主要归功于良好的公共政策,而非文化因素。日本铁路占乘客出行总里程的 28%,远超法国、德国和美国。日本铁路网络由多家私营公司组成,其中最大的 JR 东日本载客量超过除中国和印度外的所有国家铁路系统总和。
文章回顾了日本铁路的发展历程:铁路于 1872 年引入日本,最初国有化为日本国铁(JNR),但仍允许私人铁路存在。战前,日本私营电气铁路快速发展,逐渐从城市电车升级为重轨城际铁路,这些私营铁路至今仍活跃,尤其在东京、大阪和名古屋等大都市圈。1988 年,日本国铁被拆分为六个区域性铁路公司,形成了日本铁路集团(JR)。
日本铁路的另一个显著特点是“铁路引领城市发展”的商业模式。铁路公司不仅经营铁路,还涉足房地产、商业、医疗、娱乐等多个领域,通过多元化经营捕获铁路带来的溢价价值。例如,东急公司不仅运营铁路,还拥有住宅、办公楼、医院、超市和娱乐设施,形成了完整的城市生态系统。这种模式最早由阪急铁路在 1950 年代开创,推动了城市的整体发展。
总体来看,日本铁路系统的成功在于合理的企业结构、土地利用政策、交通法规、优质的私有化模式和有效监管,这些政策经验具有全球借鉴意义。文化因素虽被普遍认为影响日本铁路表现,但文章强调,真正的关键是制度设计和公共政策。
https://news.ycombinator.com/item?id=47815395
https://victorpoughon.github.io/interval-calculator/
该网页介绍了一个名为“区间计算器”的工具,由 Victor Poughon 开发,支持对区间及区间并集进行算术运算。区间表示一组连续的数值,例如[a, b]表示从 a 到 b 的所有数。区间并集则是多个不相交区间的集合,如[a, b] U [c, d]。
区间并集算术是对传统区间算术的扩展,优势在于它在包含零的区间除法中仍然封闭,能处理更复杂的运算。例如,2 除以[-2, 1]的结果是[-∞, -1] U [2, +∞]。该方法保证了从输入区间中任意选取实数代入表达式,结果必定落在输出区间内,适合表示不确定性。
网页详细介绍了区间计算器的语法和用法,包括区间、并集、加减乘除、指数运算及多种数学函数(如对数、三角函数、绝对值等)。支持常数如 π 和无穷大,且允许区间嵌套和区间边界的算术运算。
该工具还提供了全精度模式,利用 IEEE 754 双精度浮点数的外向舍入,确保计算结果区间包含真实值,解决了浮点数精度问题。全精度模式下,输入数字被解释为包含最接近浮点值的最小区间,输出显示完整小数位;关闭时,输入为零宽度区间,输出保留四位有效数字。
网页还提及了该计算器的开源性质,鼓励用户反馈问题并支持开发者。未来计划包括拆分全精度模式设置、增加历史结果变量、支持区间交集运算、优化并集运算优先级及支持空并集输入等功能。
https://news.ycombinator.com/item?id=47812341
https://blog.calif.io/p/mad-bugs-even-cat-readmetxt-is-not
本文介绍了 iTerm2 终端模拟器中的一个严重安全漏洞,该漏洞允许通过执行“cat readme.txt”命令导致任意代码执行。iTerm2 的 SSH 集成功能通过一个名为 conductor 的远程脚本与本地终端通信,使用终端转义序列作为协议载体。然而,漏洞在于 iTerm2 错误地信任了来自终端输出的 conductor 协议消息,攻击者可以伪造这些消息,使 iTerm2 误以为与真实的 conductor 会话通信。
攻击原理是,恶意文件中包含伪造的 DCS 2000p 和 OSC 135 终端序列,诱使 iTerm2 启动 conductor 协议流程,并发送命令。攻击者设计的 sshargs 参数被用作后续命令的一部分,最终导致 iTerm2 将恶意代码作为本地命令执行。利用该漏洞的 PoC 文件包括一个恶意脚本和一个包含伪造协议消息的文本文件,用户在特定目录下执行“cat readme.txt”时触发漏洞。
该漏洞的根本原因是 PTY(伪终端)机制的混淆,iTerm2 将本应发送给远程 conductor 的命令错误地发送到了本地 shell,导致恶意代码被执行。漏洞于 2026 年 3 月底被报告并在次日修复,但修复尚未推送到稳定版本,存在一定的安全风险窗口。
文章还提及了披露时间的争议,认为在补丁未广泛部署前公开漏洞可能带来风险,呼吁更合理的披露策略。整体来看,该漏洞揭示了终端模拟器在处理复杂协议时的信任边界问题,提醒用户和开发者关注终端安全。
https://news.ycombinator.com/item?id=47809190
https://www.righto.com/2026/04/B-52-star-tracker-angle-computer.html
本文介绍了 B-52 轰炸机上用于星象导航的电机机械角度计算机——Angle Computer。早在 GPS 普及之前,飞机主要依靠天文导航,通过观测星星、太阳或行星的位置来确定航向和位置。天文导航虽然准确且不易被干扰,但手动操作复杂耗时。1960 年代初,B-52 配备了自动星象跟踪系统,利用 Angle Computer 进行三角函数计算,实现自动导航。
Angle Computer 内部结构复杂,通过机械装置模拟“天球”,指针代表星星位置,通过同步电机读取方位角和高度角,向导航系统传输数据。该计算机是 Astro Compass 系统的一部分,Astro Compass 能自动锁定星星,提供精确到十分之一度的航向信息,并辅助导航员通过“位置线”技术确定飞机位置。
Astro Compass 系统包括安装在机身顶部的 Astro Tracker 光学设备,带有稳定平台和旋转棱镜,确保望远镜准确指向目标星星。系统由 19 个部件组成,包括放大器、计算机和控制面板,导航员通过主控面板输入时间、星体位置等数据,调整旋钮选择参数。星体数据来源于美国政府出版的《空中天文年鉴》,该年鉴提供太阳、行星、月亮及恒星的精确位置。
文章还介绍了天文导航中的坐标转换问题。星体位置以全球坐标系表示,但导航系统需要本地坐标系中的方位角和高度角,这涉及复杂的球面三角计算。通过计算导航三角形,系统将天文数据转换为飞机所在位置的角度信息,辅助导航员进行精确定位。整个系统体现了当时电机机械技术在航空导航中的创新应用。
https://news.ycombinator.com/item?id=47817132
该网页是一个专注于 Commodore Amiga 家用电脑图形作品的档案和展示网站。Amiga 于 1985 年发布,凭借其复杂的定制芯片,具备当时无可比拟的图形处理能力,使得许多其他个人电脑无法实现的图形效果成为可能。网站收录了大量使用 Amiga 制作或为 Amiga 设计的图形作品,包括艺术作品、游戏画面、标志、出版物和场景作品。
网站内容涵盖多个专题和文章,如显示技术、游戏公司、屏幕模式等,帮助用户深入了解 Amiga 图形的技术背景和发展。页面还列出了多个更新记录,展示了近年来不断添加的珍贵图像资源,包括来自不同艺术家和杂志的作品,以及色彩循环动画等特殊技术的应用。
此外,网站提供了社交媒体链接,方便用户关注最新动态。所有展示的图像版权归原作者所有,网站也欢迎用户反馈和建议。整体来看,该网站是 Amiga 图形爱好者和研究者的重要资源库,既保存了历史,也展示了丰富的视觉艺术成就。
https://news.ycombinator.com/item?id=47813566
https://news.ycombinator.com/item?id=47817610
We dropped Claude. It’s pretty clear this is a race to the bottom, and we don’t want a hard dependency on another multi-billion dollar company just to write software
We’ll be keeping an eye on open models (of which we already make good use of). I think that’s the way forward. Actually it would be great if everybody would put more focus on open models, perhaps we can come up with something like the “linux/postgres/git/http/etc” of the LLMs: something we all can benefit from while it not being monopolized by a single billionarie company. Wouldn’t it be nice if we don’t need to pay for tokens? Paying for infra (servers, electricity) is already expensive enough
dakiol
我们放弃了Claude。很明显这是一场向底线竞赛,我们不想在写软件时对另一家数十亿美元的公司产生强烈依赖。
我们会继续关注开源模型(我们已经在很好地利用它们)。我认为这才是未来的方向。其实如果每个人都能更多关注开源模型,那会非常棒,也许我们能打造出类似于“Linux/Postgres/Git/HTTP等”那样的LLM(大型语言模型),让我们都能受益,同时不被某个亿万富翁公司垄断。如果不用为代币付费,那该多好?基础设施(服务器、电力)的费用已经够贵了。
https://news.ycombinator.com/item?id=47811531
I am this very term teaching 18-year-old students 6502 assembly programming using an emulated Apple II Plus. They’ve had intro to Python, data structures, and OO programming courses using a modern programming environment.
Now, they are programming a chip from the seventies using an editor/assembler that was written in 1983 and has a line editor, not a full-screen one.
We had a total of 10 hours of class + lab where I taught them about assembly language and told them about the registers, instructions, and addressing modes of the chip, memory map and monitor routines of the Apple, and after that we went and wrote a few programs together, mostly using the low-resolution graphics mode (40x40): a drawing program, a bouncing ball, culminating in hand-rolled sprites with simple collision detection.
Their assignment is to write a simple program (I suggested a low-res game like Snake or Tetris but they can do whatever they want provided they tell me about it and I okay it), demo their program, and then explain to the class how it works.
At first they hated the line editor. But then a very interesting thing happened. They started thinking about their code before writing it. Planning. Discussing things in advance. Everything we told them they should do before coding in previous classes, but they didn’t do because a powerful editor was right there so why not use it?…
And then they started to get used to the line editor. They told me they didn’t need to really see the code on the screen, it was in their head.
They will of course go back to modern tools after class is finished, but I think it’s good for them to have this kind of experience.
apricot
本学期我正在教18岁的学生使用模拟的Apple II Plus进行6502汇编编程。他们之前学过Python入门、数据结构和面向对象编程课程,使用的是现代编程环境。
现在,他们要用一个上世纪七十年代的芯片编程,使用的是1983年编写的编辑器/汇编器,这个编辑器是行编辑器,而不是全屏编辑器。
我们总共有10小时的课程和实验时间,我教他们汇编语言,讲解芯片的寄存器、指令和寻址方式,Apple的内存映射和监控例程。之后我们一起写了几个程序,主要用的是低分辨率图形模式(40x40):一个绘图程序,一个弹跳球,最终实现了手工绘制的精灵和简单的碰撞检测。
他们的作业是写一个简单的程序(我建议像贪吃蛇或俄罗斯方块这样的低分辨率游戏,但他们可以自由发挥,只要告诉我并获得批准),演示他们的程序,然后向全班解释程序的工作原理。
一开始他们很讨厌行编辑器。但随后发生了一件非常有趣的事。他们开始在写代码前思考代码,开始做计划,提前讨论。这些都是我们之前课程里告诉他们应该在编码前做的事情,但因为有强大的编辑器支持,他们之前从没这么做过,想着反正有编辑器,为什么不直接用呢?……
然后他们慢慢适应了行编辑器。告诉我其实不需要一直看屏幕上的代码,代码都在他们脑子里。
课后他们当然会回到现代工具上,但我觉得让他们有这种经历是很好的。
https://news.ycombinator.com/item?id=47809790
I recall an article from a long time ago that basically said “astronauts report” the moon smells like spent gunpowder and outer space smell like… I think it was ozone.
What they were actually reporting was the smell of the airlocks after they returned from their excursions. The moon has no atmosphere, so it has been accumulating dust from billions of years of asteroid impacts that have never come in contact with oxygen. Many of the chemicals in the dust are oxidative and so when it is exposed to air for the first time it rapidly oxidizes just like gunpowder!
And I think the outer space report was from space walks, and the explanation was that the first time the airlock itself was exposed to hard vacuum, the surfaces of the airlock would have a reaction that left a scent of ozone.
corysama
我记得很久以前有一篇文章,大致内容是“宇航员报告”月球闻起来像用过的火药味,太空闻起来像……我记得是臭氧味。
他们实际上报告的是从月球活动回来后空气锁里的气味。月球没有大气层,因此积累了数十亿年来陨石撞击产生的尘埃,这些尘埃从未接触过氧气。尘埃中的许多化学物质是氧化性的,所以当它首次接触空气时,就像火药一样迅速氧化!
我认为关于太空的报告是来自太空行走,解释是空气锁第一次暴露在真空中时,空气锁表面发生了反应,留下一种臭氧的气味。
https://news.ycombinator.com/item?id=47807801
Two things:
I like the rolling Moon animation very much.
This seems like a clever way of getting talent involved during a budget squeeze, presumably with the hope that some of those they attract will still be around after this congress and the agency can stabilize once again. I guess it’s also a neat kind of try-before-you-buy for both sides. NASA is prestigious and one of the very few places one could do purely science-focused aerospace engineering, but it’s still a government job under all the gold leaf and atomic robots.
EDIT: Good Lord, I get the cynicism but at least someone at NASA HR is trying new things to keep the lights on.
scrumper
两点:
我非常喜欢那个滚动的月亮动画。
这似乎是一种在预算紧缩期间让人才参与进来的聪明方法,估计也希望借此吸引到的一些人能够在本届国会结束后依然留下来,帮助机构再次稳定。我猜这也是双方都能“先试用后购买”的一种不错方式。NASA很有声望,是为数不多可以专注于纯科学航天工程的地方之一,但毕竟它仍然是一个政府工作,尽管外面铺满了金箔和“原子机器人”。
补充:天哪,我理解这种愤世嫉俗,但至少NASA的人力资源部门有人在尝试新办法保持运转。
https://news.ycombinator.com/item?id=47807926
This tweet shows it as a percentage of US GDP:
https://x.com/paulg/status/2045120274551423142
Makes it a little less dramatic. But also shows what a big **’n deal the railroads were!
timmg
这条推文显示了作为美国GDP百分比的数据:
https://x.com/paulg/status/2045120274551422
这样看起来没那么夸张了。但也显示了铁路当时是多么重要的大事!
https://news.ycombinator.com/item?id=47810518
At the time of writing, the fix has not yet reached stable releases.
Why was this disclosed before the hole was patched in the stable release?
It’s only been 18 days since the bug was reported to upstream, which is much shorter than typical vulnerability disclosure deadlines. The upstream commit ( https://github.com/gnachman/iTerm2/commit/a9e745993c2e2cbb30b884a16617cd5495899f86 ) has way less information than this blog post, so I think releasing this blog post now materially increases the chance that this will be exploited in the wild.
Update: The author was able to develop an exploit by prompting an LLM with just the upstream commit, but I still think this blog post raises the visibility of the vulnerability.
KerrickStaley
截至发稿时,修复尚未推送到稳定版本。
为什么在稳定版本修复漏洞之前就公布了这个问题?
从漏洞报告给上游开始到现在才过去18天,这远远少于典型漏洞公开的时间期限。上游的提交(https://github.com/gnachman/iTerm2/commit/a9e745993c2e2cbb30b884a16617cd5495899f86)提供的信息远不如这篇博客详细,所以我认为现在发布这篇博客实际上大大增加了该漏洞在实际环境中被利用的风险。
更新:作者仅凭上游提交内容,利用大型语言模型就能开发出漏洞利用代码,但我仍然认为这篇博客提高了该漏洞的曝光度。
https://news.ycombinator.com/item?id=47807499
LLMs exist on a logaritmhic performance/cost frontier. It’s not really clear whether Opus 4.5+ represent a level shift on this frontier or just inhabits place on that curve which delivers higher performance, but at rapidly diminishing returns to inference cost.
To me, it is hard to reject this hypothesis today. The fact that Anthropic is rapidly trying to increase price may betray the fact that their recent lead is at the cost of dramatically higher operating costs. Their gross margins in this past quarter will be an important data point on this.
I think the tendency for graphs of model assessment to display the log of cost/tokens on the x axis (i.e. Artificial Analysis’ site) has obscured this dynamic.
louiereederson
大型语言模型(LLMs)存在于一个对数性能/成本的前沿线上。目前还不清楚Opus 4.5及以上版本是否代表了这一前沿线上的一个层级跃升,还是仅仅处于该曲线上的某个位置,尽管性能更高,但推理成本的回报正在迅速递减。
对我来说,今天很难否定这个假设。Anthropic迅速提高价格的事实,可能暴露出他们近期领先地位是以显著更高的运营成本为代价的。他们上个季度的毛利率将是一个重要的数据点。
我认为,模型评估图通常在x轴上展示成本/令牌的对数(例如Artificial Analysis网站),这掩盖了这一动态。
https://news.ycombinator.com/item?id=47805326
This is one of those stories, just like the SR-71 “ground speed check” story, that every single time I see it posted I just have to read the entire thing again. I love it.
jasongill
这是那种故事,就像SR-71“地面速度检测”的故事一样,每次看到有人发出来,我都必须把全文再读一遍。我非常喜欢它。
https://news.ycombinator.com/item?id=47815131
Is there any constant more misused in compsci than ieee epsilon? :)
It’s defined as the difference between 1.0 and the smallest number larger than 1.0. More usefully, it’s the spacing between adjacent representable float numbers in the range 1.0 to 2.0.
Because floats get less precise at every integer power of two, it’s impossible for two numbers greater than or equal to 2.0 to be epsilon apart. The spacing between 2.0 and the next larger number is 2*epsilon.
That means abs(a - b) <= epsilon is equivalent to a == b for any a or b greater than or equal to 2.0. And if you use < then the limit will be 1.0 instead.
Epsilon is the wrong tool for the job in 99.9% of cases.
hmry
在计算机科学中,还有哪个常数比IEEE的epsilon被误用得更多的吗?:)
它被定义为1.0和比1.0稍大的最小数之间的差值。更有用的是,它表示在1.0到2.0范围内相邻可表示浮点数之间的间距。
因为浮点数在每个2的整数次幂处精度都会降低,所以对于大于或等于2.0的两个数,不可能相差一个epsilon。2.0和下一个更大的数之间的间距是2倍的epsilon。
这意味着对于任何大于或等于2.0的a或b,abs(a - b) <= epsilon 相当于 a == b。如果使用 <,则限制将变为1.0。
在99.9%的情况下,epsilon都是不合适的工具。
https://news.ycombinator.com/item?id=47808326
Hello, I’m building a replacement for docker containers with a virtual machine with the ergonomics of containers + subsecond start times.
I worked in AWS previously in the container space + with firecracker. I realized the container is an unnecessary layer that slowed things down + firecracker was a technology designed for AWS org structure + usecase.
So I ended up building a hybrid taking the best of containers with the best of firecracker.
Let me know your thoughts, thanks!
binsquare
你好,我正在构建一个用虚拟机替代Docker容器的方案,兼具容器的易用性和亚秒级启动时间。
我之前在AWS从事容器相关工作,也接触过Firecracker。我意识到容器是一个不必要的层,反而会拖慢速度,而Firecracker是为AWS的组织结构和使用场景设计的技术。
所以我最终打造了一个混合方案,结合了容器和Firecracker的优点。
欢迎告诉我你的看法,谢谢!
https://news.ycombinator.com/item?id=47808702
On Notes on the Synthesis of Form, Alexander defines design as the rationalization of the forces that define a problem. You’ll won’t find a better definition. But people tend to think design is the synthesis and its results. This misunderstanding of the role of design and the designer is responsible for all the unfit designs we encounter on a daily basis. Anyone equipped with a synthesis tool and feeling empowered to quickly and cheaply generate forms will almost inevitably become blind to the very nature of the underlying problems they set to solve. They’ll be fitting the problem to the available forms. They’ll skip the understanding, the conversations, the conflicts and disagreements, and happily and wrongly assume a design problem can be solved hermetically, in isolation. They’ll think quality is a factor of aesthetics, when in truth, aesthetics is an effect; nevertheless these effects is all they’ll have control over, as it’s all the tool can do. The tool will hinder their ability to be rational; to see the inner structures; to find the hidden but essential semantics; to create the ontologies that’ll support not only the immediate synthesis, but that will sustain the evolution of the design over its lifetime. They’ll be denied the enlightenment that comes with gradual, slow construction; the only place and moment where innovative ideas reveal themselves. They’ll be impoverished and confuse output with agency. I feel sorry for anyone that will think using tools equals doing design, because of the truly marvelous human experiences that they’ll miss, and that could never be replaced by the shallow pride of empty achievement.
pilgrim0
在《形式的综合笔记》中,亚历山大将设计定义为对定义问题的各种力量进行合理化。你找不到比这更好的定义。但人们往往认为设计就是综合及其结果。这种对设计及设计师角色的误解,是我们每天遇到各种不合适设计的根源。任何掌握综合工具并觉得自己能够快速且廉价地生成形式的人,几乎不可避免地会对他们试图解决的根本问题的本质视而不见。他们会将问题套用到现有的形式上。他们会跳过理解、交流、冲突和分歧,错误且愉快地认为设计问题可以孤立地、密封地解决。他们会认为质量是美学的一个因素,而实际上美学是一种效果;然而这些效果却是他们唯一能控制的,因为这正是工具所能做到的。该工具将阻碍他们理性思考的能力;阻止他们洞察内在结构;发现隐藏但关键的语义;构建不仅支持当前综合,还能维持设计在整个生命周期中演进的本体论。他们将失去随着缓慢而渐进的构建过程而来的启迪;这是创新思想得以显现的唯一时空。他们将陷入贫乏,混淆产出与能动性。我为那些以为使用工具就等同于做设计的人感到遗憾,因为他们将错过许多真正美妙的人类体验,而这些体验永远无法被空洞成就感的浅薄自豪所替代。
https://news.ycombinator.com/item?id=47808070
NASA Force technologists inside the systems that power American spaceflight, aeronautics, and scientific discovery.
Am I an idiot or does their leading sentence make absolutely no sense?
tiberone
NASA的技术专家们在支撑美国航天飞行、航空以及科学探索的系统内部工作。
我是笨了吗,还是他们的开头句子完全没有意义?
https://news.ycombinator.com/item?id=47817240
Japan is one of the only countries to have privatized parking. In Europe and North America, vast quantities of parking space is socialized: municipalities own the streets and allow people to park on them at low or zero cost. Initially with the intention of encouraging the provision of more parking spaces, Japan made it illegal to park on public roads or pavements without special permission. Before someone buys a car, they must prove that they have a reserved night-time space on private land, either owned or leased.
This is got to be a huge factor. Making everyone pay for “free parking” through inefficient use of space is such a waste. I strongly recommend everyone to read Donald Shoup’s “The High Price of Free Parking”.
vantassell
日本是少数几个实现停车位私有化的国家之一。在欧洲和北美,大量的停车空间是社会化的:市政当局拥有街道,允许人们以低价或免费在街上停车。日本最初是为了鼓励提供更多停车位,才规定未经特别许可,不得在公共道路或人行道上停车。在买车之前,必须证明自己拥有一个私人土地上的夜间停车位,或是拥有或租赁的。
这一定是一个很大的因素。让所有人都为“免费停车”付费,却通过低效的空间利用浪费资源,实在太可惜了。我强烈推荐大家阅读唐纳德·舒普的《免费停车的高昂代价》。
https://news.ycombinator.com/item?id=47802834
I can’t notice any difference to 4.6 from 3 weeks ago, except that this model burns way more tokens, and produces much longer plans. To me it seem like this model is just the same as 4.6 but with a bigger token budget on all effort levels. I guess this is one way how Anthropic plans to make their business profitable.
During the past weeks of lobotomized opus, I tried a few different open weight models side by side with “opus 4.6” on the same issue. The open weights outperformed opus 4.6, and did it way faster and cheaper. I tried the same problem against Opus 4.7 today and it did manage to find one additional edge case that is not critical, but should be logged. So based on my experience, the open weight models managed to solve the exact problem I needed fixed, while Opus 4.7 seem to think a bit more freely at the bigger picture. However Opus 4.7 also consumed way more tokens at a higher price, so the price difference was 10-20x higher on Opus compared to the open weights models. I will use Opus for code review and minor final fixes, and let the open weights models do the heavy lifting from now on. I need a coding setup I can rely on, and clearly Anthropic is not reliable enough to rely on.
Why pay 200$ to randomly get rug-pulled with no warning, when I can pay 20$ for 90% of the intelligence with reliable and higher performance?
EmanuelB
我看不出这版4.6和三周前有什么区别,唯一不同的是这个模型消耗了更多的token,生成了更长的计划。对我来说,这个模型似乎和4.6没啥两样,只是增加了所有努力层级的token预算。我猜这可能是Anthropic想让他们的业务变得盈利的一种方式。
在过去几周使用被阉割的opus期间,我在同一问题上尝试了几款不同的开源权重模型与“opus 4.6”作对比。开源权重模型表现得比opus 4.6更好,且速度更快、成本更低。今天我用同样的问题测试了Opus 4.7,它确实找到了一个额外的边缘案例,虽然不关键,但应该被记录下来。所以根据我的经验,开源模型解决了我需要修复的那个具体问题,而Opus 4.7似乎在更宏观的层面上思考得更自由。但Opus 4.7消耗了更多的token,价格也更高,因此在价格上,Opus比开源权重模型贵了10到20倍。我会用Opus来做代码审查和一些小的最终修正,让开源权重模型从现在起承担繁重的工作。我需要一个可以依赖的编码环境,很明显Anthropic还不够可靠,不能成为依赖对象。
为什么我要花200美元,却可能毫无预警地被“割韭菜”,而我20美元就能获得90%的智能水平,而且性能更稳定更高效呢?
https://news.ycombinator.com/item?id=47802484
Open source creates a useful urgency: when your code is public, you assume it will be examined closely, so you invest earlier and more aggressively in finding and fixing issues before attackers do.
This should be the mentality of every company doing open source.Great points made.
dhruv3006
开源带来了有益的紧迫感:当你的代码是公开的,你会假设它会被仔细审查,因此你会更早、更积极地投入到发现和修复问题中,防止攻击者先行利用。
这应该是每个做开源的公司的心态。观点很棒。
https://news.ycombinator.com/item?id=47815642
Kdenlive hits the perfect sweet spot for me. It’s much more capable than basic editors like iMovie, but doesn’t have the overwhelming learning curve (or steep hardware requirements) of DaVinci Resolve. Like others have mentioned, pairing it with OBS for screen recording and Audacity for audio makes for an incredibly powerful, 100% FOSS media creation stack. It’s amazing to see how far open-source video editing has come.
visiohex
Kdenlive 对我来说正好达到了完美的平衡点。它比像 iMovie 这样基础的编辑软件功能强大得多,但又没有 DaVinci Resolve 那样令人望而生畏的学习曲线(或高硬件要求)。正如其他人提到的,将它与 OBS 进行屏幕录制和 Audacity 用于音频录制相结合,构成了一个极其强大且完全开源的媒体创作工具链。看到开源视频编辑发展到现在的程度,真是令人惊叹。
https://news.ycombinator.com/item?id=47808894
This is a really verbose way to say that using generative AI has a detrimental effect on the user because one deprives themselves of the learning experience.
bauerd
这句话长篇大论地说明了使用生成式人工智能对用户有害,因为这样会剥夺他们学习的机会。
https://news.ycombinator.com/item?id=47808004
For my agency this won’t replace Figma or designers. It’s just a really useful tool to express yourself and communicate intent.
Before these tools, when a client wanted a specific section built, we’d spend hours hunting references across the web. The output always ended up feeling like a mesh of 2-3 sites, never fully unique. Then we’d burn more time explaining the intent to the client’s designers and devs, usually with multiple rounds because words don’t convey layout well.
Now we throw a quick mockup together in Claude or Lovable and send it. The designer gets the idea in 30 seconds instead of a 45-minute call, then pushes it further with their own taste and the client’s branding.
It’s not replacing designers. Most clients don’t know what they want until they see it. These tools collapse that feedback loop from weeks to minutes, so the designer actually spends their time on the parts that need human taste, not on decoding a vague brief.
Growtika
对我的代理机构来说,这不会取代Figma或设计师。它只是一个非常有用的工具,帮助表达自己和传达意图。
在有这些工具之前,当客户想要建造某个特定部分时,我们会花费数小时在网上寻找参考资料。结果总是感觉像是拼凑了2-3个网站,永远无法做到完全独特。然后我们还得花更多时间向客户的设计师和开发人员解释意图,通常要经过多轮,因为文字无法很好地传达布局。
现在我们只需在Claude或Lovable里快速做个草图并发送。设计师在30秒内就能理解想法,而不是一通45分钟的电话,然后他们用自己的品味和客户的品牌进一步完善。
这并不是取代设计师。大多数客户直到看到效果才知道自己想要什么。这些工具把反馈周期从几周缩短到几分钟,让设计师真正把时间花在需要人类审美的部分,而不是解读模糊的需求说明。
https://news.ycombinator.com/item?id=47815482
Thank you Michael Rabin for your excellent work. Rest in Peace.
Rabin Fingerprinting is one of my favorites of his contributions. It’s a “rolling hash” that allows you to quickly compute a 32-bit (or larger) hash at every byte offset of a file. It is used most notably to do file block matching/deduplication when those matching blocks can be at any offset. It’s tragically underappreciated.
I’ve been meaning to write up a tutorial as part of my Galois Field series. Someday..
Thank you again!
xorvoid
感谢迈克尔·拉宾的卓越贡献。愿他安息。
拉宾指纹算法是他贡献中我最喜欢的之一。这是一种“滚动哈希”,能够让你快速计算文件中每一个字节偏移位置的32位(或更大)的哈希值。它最著名的应用是用于文件块匹配/去重,特别是当匹配的块可以出现在任意偏移位置时。这个算法非常优秀,但却被严重低估了。
我一直打算作为我的伽罗瓦域系列的一部分写一篇教程。总有一天会写的……
再次感谢您!
https://news.ycombinator.com/item?id=47809177
They had these kinds of programs for a long time, but many of the engineers were vilified and the programs disbanded as soon as this administration took office. I’m not sure why someone would sign up to work for a government that has no respect for its employees (or a company for that matter) if they already have gainful employment.
In fact, a bunch of NASA labs were recently closed where folks with this exact skillset could do these exact jobs. Why re-post under a different skin and expect a different result?
sailfast
这类项目已经存在很长时间了,但许多工程师被污蔑,这些项目在本届政府上任后很快就被解散了。我不明白如果有人已经有稳定工作,为什么还会选择去为一个不尊重员工(或者说公司)的政府工作。
事实上,最近关闭了很多NASA实验室,那些具备这类技能的人本可以在那里做这类工作。为什么要换个名义重新发布招聘,期待会有不同的结果呢?
https://news.ycombinator.com/item?id=47811382
GDP adjustments are warranted, but it is more stark than both the estimates suggest.
The megaprojects of the previous generations all had decades long depreciation schedules. Many 50-100+ year old railways, bridges, tunnels or dams and other utilities are still in active use with only minimal maintenance
Amortized Y-o-Y the current spends would dwarf everything at the reported depreciation schedule of 6(!) years for the GPUs - the largest line item.
manquer
GDP的调整是合理的,但比这两个估算所显示的更为明显。
上一代的大型项目都有几十年的折旧周期。许多有着50到100年以上历史的铁路、桥梁、隧道或水坝及其他公用设施仍在使用,仅需很少的维护。
按年摊销,目前的支出按照报告中GPU折旧期仅6年(!)计算,将远远超过所有其他项目。
https://news.ycombinator.com/item?id=47801287
You rarely see anything more than a couple hundred bucks a month. There are notable exceptions, but unfortunately a lot of those notable exceptions are scammy, spammy business models.
I suspect this is largely sampling bias.
I host meetups for indie founders, and several attendees earn their living through solo businesses. When I go to conferences like Microconf, I meet lots more.
The problem with measuring financial success by who posts about it on HN is:
The more someone is making at their solo business, the less they want to blab about it and attract competitors.
The people earning at the low end are more desperate for people to see what they’re doing so they can pick up new customers, so they’re more likely to talk about their work.
The more successful founders are busier and spend less time posting on HN.
mtlynch
你很少会看到有人每月收入超过几百美元。虽然有一些显著的例外,但不幸的是,其中很多例外都是欺诈性、垃圾邮件式的商业模式。
我怀疑这很大程度上是抽样偏差。
我主持独立创始人的聚会,几位参与者靠个人业务谋生。每当我参加像Microconf这样的会议时,我会遇到更多这样的人。
用谁在HN上发布内容来衡量财务成功存在的问题是:
个人业务收入越高的人,越不愿意大肆宣扬,避免吸引竞争者。
收入较低的人更渴望有人关注他们的工作,以便吸引新客户,因此他们更可能谈论自己的工作。
更成功的创始人更忙,花在HN上的时间更少。
https://news.ycombinator.com/item?id=47818861
You’d have to be spectacularly stupid to bet on these kinds of things without having insider knowledge, because you ought to know good and damn well by now that the people with insider knowledge are DEFINITELY betting on them.
beaviskhan
如果没有内部消息而去赌这种事情,那你得蠢到家了,因为你现在应该非常清楚,有内部消息的人绝对在下注。
https://news.ycombinator.com/item?id=47817057
Combined with the announcement that they’re killing the old Kindles as well…this is 100% about preventing people from liberating DRM from their books. Full stop. They are closing each and every remaining hole.
AdmiralAsshat
结合他们宣布淘汰老款Kindle的消息来看……这100%是为了防止人们破解他们书籍中的数字版权管理(DRM)。毫无疑问。他们正在关闭每一个剩余的漏洞。
2026-04-18 08:05:01
- OpenAI 升级 Codex 为可操控电脑、并行多任务与插件齐备的通用代理,潜力巨大但仍面临与大厂竞争、用户体验与安全风险等挑战。
- Anthropic 推出 Claude Design 将 AI 融入协同设计与交付流程,提升效率之余也引发关于界面同质化与个性化权衡的讨论。
- 阿西莫夫《最后的问题》引发对不确定性的思考,而讨论聚焦于不同文化与当下 LLM 在拒答、表达不确定与真实推理上的不足。
- 广告监控体系可大规模交易可反匿名的精准定位数据,带来严重隐私与国家安全风险,亟需联邦禁售与架构级隐私改造。
- Claude 4.7 更细粒度分词略提指令遵循却显著增加英文与代码场景的 token 与成本、加速上下文与缓存消耗并更易触发限速。
- 轻量 Qwen 在趣味 SVG 插图中更灵活有趣而 Opus 更注重物理合理,体现两者在图形生成偏好与取舍上的差异。
- 拟议法案强制设备级年龄验证并向应用暴露状态,或将操作系统变成全国性身份闸门、侵蚀匿名与隐私且数据保护含糊。
- “被动收入”神话让创业者脱离用户与产品、迷信速成与课程套利,九成速成店铺速败而真正杠杆在可规模化好产品与长期服务。
- 官方 Clojure 纪录片集中呈现语言理念与生态,也折射出业界对 REPL 工作流与语言特性的误解与实践分歧。
- 通过刷量与账号矩阵“制造趋势”的隐形营销正淹没真实声音,情感与理性社群皆易被操纵而公众在识破与默许间摇摆。
https://openai.com/index/codex-for-almost-everything/
OpenAI 发布了 Codex 的重大更新,提升了这款每周服务超过 300 万开发者的智能助手的能力。新版 Codex 不仅能协助编写代码,还能操作电脑上的各种应用程序,实现点击、输入等操作,支持多任务并行,极大方便了前端开发、应用测试等场景。
新增的内置浏览器功能允许用户直接在网页上添加注释,便于前端和游戏开发的精准指令传达。Codex 还集成了 gpt-image-1.5 图像生成模型,支持结合截图和代码生成产品概念、设计草图和游戏视觉素材。
此次更新还推出了 90 多个新插件,涵盖 JIRA、CircleCI、GitLab、微软办公套件等工具,增强了 Codex 跨应用获取上下文和执行操作的能力。软件开发生命周期的支持也更完善,新增 GitHub 代码评审、多个终端标签页、远程开发环境 SSH 连接等功能,并支持多种文件格式的预览和任务计划管理。
Codex 的自动化功能得到扩展,能够保存和复用对话上下文,支持长期任务的自动唤醒和继续执行。预览版记忆功能使其能记住用户偏好和历史信息,提升任务完成效率和质量。Codex 还能主动推荐工作内容,结合项目、插件和记忆,帮助用户优先处理待办事项。
目前这些功能已向登录 ChatGPT 的 Codex 桌面应用用户开放,个性化和记忆功能将在企业、教育及欧洲和英国用户中陆续推出。电脑操作功能初期支持 macOS,未来将扩展至更多地区。OpenAI 鼓励开发者将 Codex 应用于更广泛的工作流程中,助力软件开发的各个环节更加高效顺畅。未来,Codex 将继续深化与开发工具和工作流程的融合,推动人工智能在软件开发中的广泛应用。
https://news.ycombinator.com/item?id=47796469
https://www.anthropic.com/news/claude-design-anthropic-labs
Anthropic Labs 推出了全新产品 Claude Design,这是一款基于其最强视觉模型 Claude Opus 4.7 的设计协作工具,现已面向 Claude Pro、Max、Team 和 Enterprise 订阅用户开放研究预览。Claude Design 旨在帮助设计师和非设计背景的团队成员快速生成和完善视觉作品,如设计稿、原型、演示文稿等。
该工具支持从文本描述、图片、文档或代码库导入设计素材,自动应用团队的设计系统以保证风格一致。用户可以通过对具体元素的内联评论、直接编辑文本或使用调节控件实时调整设计细节,并能将修改应用到整个项目中。设计作品支持组织内共享和协作,且可导出为多种格式,包括 Canva、PDF、PPTX 和独立 HTML 文件。
Claude Design 广泛应用于制作真实感原型、产品线框图、设计探索、演示文稿及市场营销素材等场景,极大提升了设计效率和团队协作体验。设计完成后,用户还能一键将设计交付给 Claude Code 进行开发,实现从设计到生产的无缝衔接。
Anthropic 计划未来进一步拓展 Claude Design 的集成能力,使其能与更多团队常用工具连接。Canva 联合创始人 Melanie Perkins 和多位行业设计师、产品经理对 Claude Design 的创新性和高效性给予了高度评价,认为其显著简化了复杂设计的制作流程,加快了从创意到成品的转化速度。企业管理员可在组织设置中启用该功能。用户可访问 claude.ai/design 开始使用。
https://news.ycombinator.com/item?id=47806725
https://hex.ooo/library/last_question.html
这篇文章是科幻作家艾萨克·阿西莫夫的短篇小说《最后的问题》。故事开始于 2061 年,人类首次踏入太空,借助超级计算机 Multivac 实现了太阳能的广泛利用,彻底摆脱了煤炭和铀的能源限制。主人公亚历山大·阿德尔和伯特兰·卢波夫是 Multivac 的技术人员,他们对这台庞大计算机的运作有一定了解。
两人在庆祝太阳能利用成功时,展开了关于宇宙能源和熵增问题的讨论。卢波夫指出,太阳和所有恒星终将耗尽能量,宇宙会走向热寂,能量不会永远存在。阿德尔则希望未来能有办法逆转熵增,恢复太阳的活力。两人打赌向 Multivac 提出了“是否能在不消耗净能量的情况下恢复太阳”的问题,结果 Multivac 回答“数据不足,无法给出有意义的答案”。
故事随后转向未来,描写了人类在星际旅行中的情景,暗示人类文明继续探索宇宙,但关于宇宙终极命运的问题依然悬而未决。小说通过对能源、熵和宇宙终极命运的探讨,反映了人类对未来科技和宇宙奥秘的思考与探索。
https://news.ycombinator.com/item?id=47804965
https://www.lawfaremedia.org/article/it-is-time-to-ban-the-sale-of-precise-geolocation
本文讨论了美国广告技术监控系统 Webloc 所带来的国家安全和隐私风险,强调了限制精准地理位置数据收集和销售的必要性。Webloc 由 Cobweb Technologies 开发,现由 Penlink 销售,能够访问全球多达 5 亿移动设备的定位和用户数据。报告揭示了该系统如何通过 GPS 和 Wi-Fi 定位频繁追踪个人设备,甚至能精确定位设备在不同国家的具体位置,细节令人不安。
Webloc 的客户包括美国国土安全部、移民与海关执法局、军方以及多个州和地方执法机构。举例说明,图森警方利用该工具追踪一名涉嫌多次盗窃的嫌疑人,显示其强大的调查能力。Webloc 是 Penlink 旗下主打产品 Tangles 的附加功能,Tangles 主要用于网络和社交媒体调查,能够分析公开数据,建立目标档案,追踪社交关系和活动。两者结合后,可以在无需授权的情况下,将匿名设备标识与社交媒体账户关联,带来更大隐私风险。
文章指出,这些强大工具应受到严格授权和监管,防止滥用。除了国内隐私保护问题,地理位置数据的广泛流通也构成国家安全隐患,因为外国情报机构同样能利用这些数据进行情报活动。Penlink 的海外客户包括匈牙利和萨尔瓦多的执法机构,显示此类数据的国际流通性。
值得注意的是,弗吉尼亚州近期通过了禁止销售精准地理位置数据的法律,成为应对该问题的积极尝试,但作者认为联邦层面更全面的立法仍然迫切需要,以保护公民隐私和国家安全。
此外,文章简要提及了安全公司 Gambit 发布的一份报告,揭示了黑客如何利用人工智能工具加速网络攻击和犯罪活动,具体案例涉及墨西哥政府机构的数据泄露,显示 AI 在网络安全威胁中的日益重要角色。
https://news.ycombinator.com/item?id=47806304
https://www.claudecodecamp.com/p/i-measured-claude-4-7-s-new-tokenizer-here-s-what-it-costs-you
这篇文章详细测量了 Anthropic 最新模型 Claude 4.7 相较于 4.6 版本在分词器(tokenizer)上的变化及其带来的代价和收益。官方文档称 4.7 版本的分词器会产生 1.0 到 1.35 倍的 token 数量,但作者实测技术文档和实际代码内容中,token 数量增加了约 1.45 倍,远超官方预期。这意味着在相同价格和配额下,用户的最大上下文窗口更快被消耗,缓存前缀的成本更高,速率限制更早触发。
作者通过两个实验验证了代价和收益。代价方面,使用 Anthropic 提供的免费 token 计数接口,对比了 4.6 和 4.7 在多种真实和合成内容上的 token 数量。结果显示,英文和代码内容 token 数增加较多(1.20 到 1.47 倍),而中文、日文等 CJK 字符及符号变化极小(约 1.01 倍)。这表明 4.7 版本对英文和代码采用了更细粒度的分词策略,导致单位 token 包含的字符数减少。
关于收益,Anthropic 宣称 4.7 版本在指令遵循上更为“字面”和精准,尤其是在低努力水平下不再自动泛化指令。作者使用 IFEval 基准测试了两版模型在严格和宽松指令遵循上的表现,发现 4.7 在严格模式下有约 5 个百分点的提升,表现更准确,但提升幅度有限,且样本量较小,不能完全确定效果大小。
文章还通过一个典型的 Claude Code 长会话示例,计算了 4.7 版本因 token 数增加带来的成本上涨。会话中缓存读取成本和输出成本是主要开销,4.7 版本的 token 增多使得整体成本显著增加。
总结来看,Claude 4.7 通过更细粒度的分词提升了模型对指令的精确遵循能力,但代价是 token 数量显著增加,导致使用成本和速率限制压力加大。用户需权衡更好指令遵循与更高成本之间的关系。
https://news.ycombinator.com/item?id=47807006
https://simonwillison.net/2026/Apr/16/qwen-beats-opus/
本文是 Simon Willison 于 2026 年 4 月 16 日发布的一篇博客文章,内容围绕他用笔记本电脑运行的两款大型语言模型(LLM)——阿里巴巴的 Qwen3.6-35B-A3B 和 Anthropic 的 Claude Opus 4.7——生成“骑自行车的鹈鹕”图像的对比测试展开。
作者指出,虽然这个“骑自行车的鹈鹕”测试本质上是一个玩笑,意在讽刺不同模型之间的比较难度和荒谬性,但从早期到现在,模型生成的图像质量与模型整体实用性之间存在一定的正相关关系。最初的模型生成的图像质量较差,而最新的模型如 Gemini 3.1 Pro 甚至能生成可用的插图。
在这次测试中,作者认为 Qwen3.6-35B-A3B 生成的鹈鹕图像明显优于 Claude Opus 4.7,后者在自行车车架部分出现了错误。即使在调整 Claude 模型的思考级别后,结果仍未有明显改善。作者还用“骑独轮车的火烈鸟”这一备选测试进一步验证,Qwen 模型同样表现更好,并且生成的 SVG 代码中带有幽默的注释。
尽管作者对 Qwen 模型表现出一定的认可,但他也坦言,21GB 量化版本的 Qwen 模型不一定比 Anthropic 最新的专有模型更强大或实用。然而,如果仅仅需要生成“骑自行车的鹈鹕”的 SVG 插图,当前在笔记本电脑上运行的 Qwen3.6-35B-A3B 是更好的选择。
文章最后强调,这个测试更多是对模型比较的幽默表达,而非严肃的性能评测。
https://news.ycombinator.com/item?id=47796830
https://reclaimthenet.org/us-bill-mandates-on-device-age-verification
这篇文章介绍了由美国众议员乔什·戈特海默于 2026 年 4 月 13 日提出的一项法案——《家长决定法案》(Parents Decide Act,H.R. 8250)。该法案要求苹果、谷歌及所有操作系统供应商在美国销售的新设备上,必须对用户进行年龄验证,用户在设置新设备时必须提供出生日期。此举意味着所有用户,包括成年人,都必须通过年龄验证才能使用设备。
文章指出,这项法案表面上是为了保护儿童安全,防止未成年人绕过年龄限制访问不适宜内容,但实际上它建立了一个覆盖全国的身份验证系统,由两家大型私营公司管理,涉及所有设备用户的身份信息。这不仅是儿童保护,更是对所有用户隐私和匿名性的重大侵蚀。
法案要求操作系统提供一个机制,允许应用开发者访问用户的年龄验证信息,以便判断用户是否符合特定年龄限制。这意味着苹果和谷歌将成为整个美国应用生态系统的年龄验证中介,操作系统层面将成为内容控制的关口,可能限制用户访问某些内容。
文章强调,这种基于身份验证的内容控制系统可能被用于限制新闻报道、政治评论、抗议信息等内容,未来的监管者可以根据需要决定谁能访问哪些信息,严重影响言论自由和第一修正案保护的匿名阅读权。
此外,法案对数据保护的规定非常模糊,主要依赖联邦贸易委员会(FTC)在事后制定具体规则,缺乏明确的数据保存期限、最小化原则和二次使用限制,也没有详细说明如何验证家长或监护人的身份。整体来看,法案授权建立一个尚未设计完善的监控系统,可能带来广泛的隐私和自由风险。
https://news.ycombinator.com/item?id=47801991
https://www.joanwestenberg.com/the-passive-income-trap-ate-a-generation-of-entrepreneurs/
这篇文章由 JA Westenberg 撰写,标题为《“被动收入”陷阱吞噬了一代创业者》。作者通过一个卖玉石面部按摩滚轮的年轻人的故事,揭示了许多年轻创业者误入“被动收入”理念的误区。该年轻人通过阿里巴巴低价进货,利用 Shopify 开设网店,靠 Facebook 广告推广,但因物流缓慢、客户服务敷衍,五个月亏损 800 美元,最终失败。
文章指出,“被动收入”从一个理财术语演变成一种救世主般的信仰,许多人将其视为摆脱传统工作的终极目标,梦想着通过建立无需持续参与的系统来实现财务自由。然而,这种思维导致创业者忽视了客户需求和产品质量,最终产生大量失败的网店和低质量内容。
作者强调,真正的杠杆效应存在于能够规模化的优质产品和服务中,如软件和出版业,而“被动收入”运动混淆了“打造可持续好产品”与“搭建任何能自动赚钱的机制”的区别。许多所谓的被动收入项目实际上是通过操纵广告和 SEO,制造大量无价值的内容和虚假推荐,破坏了互联网信息质量。
文章还提到,2019 至 2021 年间,Shopify 新开店铺激增,但 90% 在一年内失败,反映出大量创业者缺乏真正经营和服务客户的意愿。作者批评了被动收入课程泛滥,导致许多有潜力的人才浪费时间在短期项目和骗局上,未能建立真实的技能和事业。
总结来看,文章警示创业者不要盲目追求“被动收入”,应注重产品质量、客户需求和长期经营,避免陷入表面光鲜但实质空洞的创业陷阱。
https://news.ycombinator.com/item?id=47799120
https://clojure.org/about/documentary
该网页主要介绍了编程语言 Clojure 的相关内容,包括其起源、理念、社区和生态系统。Clojure 是一种基于 JVM 的 Lisp 方言,强调函数式编程、不可变数据结构和并发编程,拥有动态开发和运行时多态等特性。
网页中提到了 Clojure 的纪录片,讲述了其从一个执着的想法到成为全球大型金融科技公司核心技术栈的历程,展示了语言的价值观和社区影响力。纪录片得到了 Nubank 的支持。
此外,页面列出了 Clojure 发展的基础研究论文,如关于可变状态、持久化数据结构和软件事务内存(STM)的关键论文,以及影响 Clojure 设计的重要书籍和 Rich Hickey 的多场演讲,帮助理解语言设计理念和实践经验。
网页还介绍了重要的相关公司和项目,如 Cognitect、Nubank 和 Datomic,以及丰富的社区资源和历史档案。Clojure 的多种运行时环境也被提及,包括 ClojureScript(编译为 JavaScript)、ClojureCLR(运行于.NET CLR)和其他衍生项目。
针对不同用户需求,页面推荐了多种入门路径,如官方安装指南、Babashka 快速脚本、前端开发的 ClojureScript、移动开发的 ClojureDart,以及 Python 用户通过 libpython-clj 调用 Python 库的方案。编辑器方面,推荐了 VS Code 的 Calva 插件,支持交互式 REPL 和结构化编辑。
最后,网页提供了 Clojure 相关术语的简明解释,帮助读者理解 Lisp、REPL、函数式编程、持久化数据结构、STM 等核心概念,并列出了 Clojure 的社交媒体和社区活动信息,鼓励用户参与和关注未来的会议与发展。
https://news.ycombinator.com/item?id=47798345
https://techcrunch.com/2026/04/16/everything-we-like-is-a-psyop/
这篇文章探讨了现代娱乐和创业领域中广泛使用的“制造趋势”营销手段。以乐队 Geese 为例,作者指出他们的流行部分是由营销公司 Chaotic Good 通过大量虚假社交媒体账号制造的虚假热度。这种策略通过大量发布内容和评论,模拟歌曲或产品的流行趋势,影响公众的认知和舆论。
文章进一步揭示,这种营销方式不仅限于音乐行业,年轻创业者也在模仿这一套路。例如,时尚应用 Phia 的创始人通过雇佣大量大学生在各自账号上发布关于应用的视频,制造大量内容以吸引用户关注。类似地,许多知名主播和艺人也利用大量账号发布剪辑,扩大影响力。
Chaotic Good 等营销公司甚至购买大量手机,运营成百上千的社交账号,系统性地操控网络舆论和趋势,令普通用户难以分辨真实与虚假。文章还提到,这种现象与“死互联网理论”相呼应,即大量网络内容由机器人生成,真实用户声音被淹没。
此外,文章提及韩国女团 Katseye 的案例,她们的成名过程被 Netflix 纪录片《Pop Star Academy》揭示,展示了娱乐公司如何将年轻艺人塑造成商业工具,尽管过程残酷,但观众仍能感受到艺人们的成长和努力。
总体来看,文章批判了当下娱乐和创业领域中虚假营销泛滥的现象,同时也反映出公众对这种“制造的流行”既感到失望又无奈接受的复杂心态。
https://news.ycombinator.com/item?id=47800738
https://news.ycombinator.com/item?id=47807009
I reckon something like this has only been possible to develop because of how homogenous the internet has become in terms of design ever since the glass effect and drop-shadows took over in Web 2.0 and Twitter Bootstrap entered the scene.
You’ll get a competent UI with little effort but nothing truly unique or mind-blowing.
Impressive technology, but that old skool artisanal weirdness of yore only becomes more valuable and nostalgic.
ljm
我认为只有因为互联网在设计上变得如此同质化,自从玻璃效果和投影效果在Web 2.0盛行,以及Twitter Bootstrap的出现,才有可能开发出这样的东西。
你可以轻松获得一个称职的用户界面,但却不会有什么真正独特或令人惊叹的东西。
技术很令人印象深刻,但那种旧时工匠式的奇特风格反而变得更有价值、更让人怀念。
https://news.ycombinator.com/item?id=47805837
INSUFFICIENT DATA FOR MEANINGFUL ANSWER
Boy, it sure would be nice if real LLMs were capable of giving an answer like that.
CGMthrowaway
数据不足,无法给出有意义的答案。
说实话,如果真正的语言模型能给出这样的回答,那可真是太好了。
https://news.ycombinator.com/item?id=47796844
I’ve been running this on my laptop with the Unsloth 20.9GB GGUF in LM Studio: https://huggingface.co/unsloth/Qwen3.6-35B-A3B-GGUF/blob/main/Qwen3.6-35B-A3B-UD-Q4_K_S.gguf
It drew a better pelican riding a bicycle than Opus 4.7 did! https://simonwillison.net/2026/Apr/16/qwen-beats-opus/
simonw
我一直在笔记本电脑上用 LM Studio 运行 Unsloth 20.9GB 的 GGUF 模型:https://huggingface.co/unsloth/Qwen3.6-35B-A3B-GGUF/blob/main/Qwen3.6-35B-A3B-UD-Q4_K_S.gguf
它画了一只骑自行车的鹈鹕,比 Opus 4.7 画得还好!https://simonwillison.net/2026/Apr/16/qwen-beats-opus/
https://news.ycombinator.com/item?id=47795073
We re-uploaded Gemma4 4 times - 3 times were due to 20 llama.cpp bug fixes, which we helped solve some as well. The 4th is an official Gemma chat template improvement from Google themselves, so these are out of our hands. All providers had to re-fix their uploads, so not just us.
For MiniMax 2.7 - there were NaNs, but it wasn’t just ours - all quant providers had it - we identified 38% of bartowski’s had NaNs. Ours was 22%. We identified a fix, and have already fixed ours see https://www.reddit.com/r/LocalLLaMA/comments/1slk4di/minimax_m27_gguf_investigation_fixes_benchmarks/. Bartowski has not, but is working on it. We share our investigations always.
For Qwen3.5 - we shared our 7TB research artifacts showing which layers not to quantize - all provider’s quants were not optimal, not broken - ssm_out and ssm_* tensors were the issue - we’re now the best in terms of KLD and disk space - see https://www.reddit.com/r/LocalLLaMA/comments/1rgel19/new_qwen3535ba3b_unsloth_dynamic_ggufs_benchmarks/
On other fixes, we also fixed bugs in many OSS models like Gemma 1, Gemma 3, Llama chat template fixes, Mistral, and many more.
It might seem these issues are due to us, but it’s because we publicize them and tell people to update. 95% of them are not related to us, but as good open source stewards, we should update everyone.
danielhanchen
我们重新上传了 Gemma4 四次——其中三次是因为 20 个 llama.cpp 的 bug 修复,我们也帮助解决了一些。第四次是 Google 官方对 Gemma 聊天模板的改进,所以这部分不在我们控制范围内。所有提供商都不得不重新修复上传的内容,所以不仅仅是我们。
关于 MiniMax 2.7——存在 NaN 问题,但不仅仅是我们的,所有量化提供商都有这个问题——我们发现 Bartowski 的 38% 文件中有 NaN,我们的是 22%。我们找到了解决方案,并且已经修复了我们的版本,详情见:https://www.reddit.com/r/LocalLLaMA/comments/1slk4di/minimax_m27_gguf_investigation_fixes_benchmarks/。Bartowski 还没有修复,但正在努力中。我们总是分享我们的调查结果。
关于 Qwen3.5——我们公开了 7TB 的研究资料,指出哪些层不应该被量化——所有提供商的量化方案都不是最优的,但也不是坏的——问题出在 ssm_out 和 ssm_* 张量上——我们现在在 KLD 和磁盘空间方面表现最好,详情见:https://www.reddit.com/r/LocalLLaMA/comments/1rgel19/new_qwen3535ba3b_unsloth_dynamic_ggufs_benchmarks/
在其他修复方面,我们还修正了许多开源模型的 bug,比如 Gemma 1、Gemma 3、Llama 聊天模板的修复、Mistral 以及更多。
虽然这些问题看起来像是我们的错,但其实是因为我们公开了它们并提醒大家更新。其中 95% 的问题和我们无关,但作为优秀的开源维护者,我们有责任让大家都保持更新。
https://news.ycombinator.com/item?id=47807176
There’s no shame in being homogenous and obvious, though.
If I’m building out an internal tool for, say, a hospital lawyer to search through malpractice lawsuits, I want my tool to be the most familiar, obvious, least-surprising UI/UX possible. Just stay out of the way and do what it’s supposed to do.
The trick is, of course, that the human is still responsible for knowing when homogenous is fine, or when there’s real value in the presentation. If you’re making a website for, say, a VST plugin for musicians, your site may need to have a little more “pizzazz” to make your product more attractive to the target audience.
mjr00
同质化和明显的设计没有什么可羞耻的。
如果我正在为医院的律师构建一个内部工具,用来搜索医疗事故诉讼案例,我希望我的工具界面是最熟悉、最直观、最不让人感到意外的UI/UX。只要不过多干扰,完成它应该做的事就行。
当然,关键在于,人还是要判断什么时候同质化设计是可行的,什么时候展示上有实际价值。比如,如果你是在为音乐人做一个VST插件的网站,你的网站可能需要更多“亮点”来让产品对目标用户更有吸引力。
https://news.ycombinator.com/item?id=47807024
There is no such thing as anonymized location data when you have the location of something where and when they sleep and work.
It’s a rhetorical fiction the ad industry tells itself.
rockskon
当你掌握某物何时何地睡觉和工作的位置信息时,就不存在所谓的匿名位置数据。
这是广告行业自欺欺人的一种修辞虚构。
https://news.ycombinator.com/item?id=47798721
Just reading the comments here it’s amazing how many people seemingly don’t know that Claude Desktop and Cowork basically already does all of this. Codex isn’t pioneering these features, it’s mostly just catching up.
woeirua
光看这里的评论就很惊讶,居然有那么多人似乎不知道Claude Desktop和Cowork基本上已经实现了这些功能。Codex并不是这些功能的开创者,它大多数只是赶上了别人的步伐。
https://news.ycombinator.com/item?id=47794345
I hope people realize that tools like caveman are mostly joke/prank projects
This seems to be a common thread in the LLM ecosystem; someone starts a project for shits and giggles, makes it public, most people get the joke, others think it’s serious, author eventually tries to turn the joke project into a VC-funded business, some people are standing watching with the jaws open, the world moves on.
embedding-shape
我希望大家能意识到,像caveman这样的工具大多是开玩笑或恶作剧性质的项目。
这似乎是大型语言模型生态系统中的一个常见现象;有人为了好玩儿开始一个项目,公开发布后,大多数人明白这是个玩笑,其他人却当真了,作者最终试图将这个玩笑项目变成一个获得风险投资的商业项目,有些人目瞪口呆地旁观,世界依旧在前进。
https://news.ycombinator.com/item?id=47794755
This comment thread is a good learner for founders; look at how much anguish can be put to bed with just a little honest communication.
Oops, we’re oversubscribed.
Oops, adaptive reasoning landed poorly / we have to do it for capacity reasons.
Here’s how subscriptions work. Am I really writing this bullet point?
As someone with a production application pinned on Opus 4.5, it is extremely difficult to tell apart what is code harness drama and what is a problem with the underlying model. It’s all just meshed together now without any further details on what’s affected.
lanyard-textile
这个评论区对创业者来说是很好的学习材料;看看仅凭一点诚实的沟通,就能解决多少痛苦。
哎呀,我们超额认购了。
哎呀,自适应推理的效果不好/我们因为容量原因必须这么做。
订阅是怎么运作的。我真的在写这个要点吗?
作为一个在Opus 4.5上运行生产应用的人,很难区分到底是代码框架的问题还是底层模型的问题。现在这些都混在一起了,没有任何关于受影响内容的更多细节。
https://news.ycombinator.com/item?id=47804684
Politicians will do any draconian measure to help kids except try and improve the lives of their parents so that they can actually dedicate time to parenting. Making it slightly harder to access the internet fixes nothing. What if instead of having the largest prison population in the world our government supported communities that make raising good children possible? Our society needs to lose this urge to diagnose each other and provide some forceful treatment and instead set sights on providing the pre-conditions for everyone to prosper and lead their version of a fulfilling life. Only then will we have functional, healthy children. I quite like what the mayor of Baltimore has been doing to revitalize his city and it seems to be leading to actual change there if you want a good example: https://m.youtube.com/watch?v=XQs59YY-e2I&pp=ygUXY2hhbm5lbCA1IGJyYW5kb24gc2NvdHQ%3D
snaking0776
政治家们会采取任何严厉的措施来帮助孩子,除了尝试改善他们父母的生活状况,使父母能够真正投入时间来抚养孩子。让上网变得稍微困难一点解决不了任何问题。如果我们的政府不是拥有世界上最大的监狱人口,而是支持那些能够让养育好孩子成为可能的社区,那会怎样?我们的社会需要摆脱互相诊断并强制治疗的冲动,转而着眼于提供每个人繁荣发展的前提条件,让每个人都能过上自己认为充实的生活。只有这样,我们才会有功能正常、健康的孩子。我相当喜欢巴尔的摩市长为了振兴城市所做的努力,如果你想看一个好例子,可以看看这段视频:https://m.youtube.com/watch?v=XQs59YY-e2I&pp=ygUXY2hhbm5lbCA1IGJyYW5kb24gc2NvdHQ%3D
https://news.ycombinator.com/item?id=47794908
They’ve increased their cybersecurity usage filters to the point that Opus 4.7 refuses to work on any valid work, even after web fetching the program guidelines itself and acknowledging “This is authorized research under the [Redacted] Bounty program, so the findings here are defensive research outputs, not malware. I’ll analyze and draft, not weaponize anything beyond what’s needed to prove the bug to [Redacted].
I will immediately switch over to Codex if this continues to be an issue. I am new to security research, have been paid out on several bugs, but don’t have a CVE or public talk so they are ready to cut me out already.
Edit: these changes are also retroactive to Opus 4.6. I am stuck using Sonnet until they approve me or make a change.
johnmlussier
他们增加了网络安全使用过滤器,以至于Opus 4.7即使在从网络上获取了程序指南并确认“这是[已屏蔽]赏金计划下的授权研究,所以这里的发现是防御性研究成果,不是恶意软件。我将分析并起草报告,不会超出证明漏洞所需的范围进行武器化”后,仍然拒绝处理任何有效的工作。
如果这个问题继续存在,我会立即转向Codex。我是安全研究的新手,已经因几个漏洞获得了报酬,但还没有CVE或公开演讲,所以他们已经准备把我排除在外。
补充说明:这些更改对Opus 4.6也同样适用。我只能使用Sonnet,直到他们批准我或做出改变。
https://news.ycombinator.com/item?id=47796824
<tin foil hat>
I swear OpenAI has 2-3 unannounced releases ready to go at any time just so they can steal some thunder from their competitors when they announce something
</tin foil hat>
incognito124
<阴谋论>
我发誓OpenAI随时都有2到3个未公布的新产品准备好上线,他们这样做只是为了在竞争对手发布新东西时抢夺关注度。
</阴谋论>
https://news.ycombinator.com/item?id=47793749
I’m not sure how much I trust Anthropic recently.
This coming right after a noticeable downgrade just makes me think Opus 4.7 is going to be the same Opus i was experiencing a few months ago rather than actual performance boost.
Anthropic need to build back some trust and communicate throtelling/reasoning caps more clearly.
endymion-light
我最近不太确定有多信任Anthropic。
紧接着明显的性能下降让我觉得Opus 4.7可能和几个月前我用过的Opus没什么区别,而并非真正的性能提升。
Anthropic需要重建一些信任,并且更清楚地说明限流和推理能力的限制原因。
https://news.ycombinator.com/item?id=47794330
I’m not sure why this announcement has generated so much irritation in the comments– Cloudflare has been transitioning from “DDoS protection” to “AWS competitor” for many years now, and this is just their alternative to AWS SES.
It’s an email sender that you can access through an API, or directly through Workers. For those who haven’t been keeping up over the years, Workers is their product for running code on Cloudflare’s platform directly (an AWS Lambda competitor, more or less) and they’ve been trying to make it the centerpiece of an ecosystem where you deploy your code to their platform and get access to a variety of tools: databases, storage, streaming, AI, and now email sending. All of this is stuff that AWS has had for years, but some people like Cloudflare more (I certainly do).
One thing that surprised me is the price– Cloudflare’s cloud offerings are usually much cheaper, and I’ve saved plenty of money by migrating from AWS S3 to Cloudflare’s R2. This new offering is 3x the AWS price, though. Weird. Anyway, most small companies don’t send enough email for it to matter.
But getting back to the consensus in the comments here: I’m not sure why people think that they’ll be worse about policing spam than AWS SES, Azure Email, etc.
Meekro
我不明白为什么这个公告会在评论区引起这么多不满——Cloudflare多年来一直在从“DDoS防护”转型为“AWS竞争对手”,这只是他们针对AWS SES的替代方案。
这是一个可以通过API访问的邮件发送服务,或者直接通过Workers来使用。对于那些这些年没有跟进的人来说,Workers是他们的产品,可以直接在Cloudflare平台上运行代码(某种程度上类似AWS Lambda),他们一直试图把它打造成一个生态系统的核心,你可以把代码部署到他们的平台,并获得各种工具的访问权限:数据库、存储、流媒体、AI,现在还有邮件发送。所有这些都是AWS多年来就拥有的功能,但有些人更喜欢Cloudflare(我当然也是)。
有一点让我感到惊讶的是价格——Cloudflare的云服务通常便宜得多,我通过从AWS S3迁移到Cloudflare的R2节省了不少钱。但这个新服务的价格是AWS的三倍,有点奇怪。不过大多数小公司发送的邮件量不会多到影响费用。
回到评论区的共识:我不明白为什么大家觉得Cloudflare在反垃圾邮件管理上会比AWS SES、Azure Email等做得更差。
https://news.ycombinator.com/item?id=47793564
Their negative effects are much more vast, subtle, and cultural. You could say many of the broad and widespread mental issues we have in the US is the result of automobiles leading to suburbanization and thus isolation of people. It has created an expensive barrier of entry for existing in society and added a ton of friction to doing anything and everything, especially with people. That’s not even getting into the climate effects.
The upsides of automobiles generally all exist outside of the ‘personal automobile’, i.e. logistics. These upsides and downsides don’t need to coexist. We could reap the benefits without needing to suffer for it, but here we are.
armonster
它们的负面影响更加广泛、细微且具有文化层面。可以说,美国许多普遍且广泛的心理问题,都是由于汽车导致的郊区化,从而使人们孤立。汽车制造了一个昂贵的社会进入门槛,并且大大增加了做任何事情,尤其是与人交往的摩擦。这还没有涉及气候影响。
汽车的优点通常存在于“个人汽车”之外,比如物流。这些优点和缺点并不需要共存。我们本可以享受这些好处而不必承受其带来的痛苦,但现实就是如此。
https://news.ycombinator.com/item?id=47789694
A non-trivial minority of the time, they don’t support IPv4 either!
growse
在相当一部分情况下,它们连IPv4也不支持!
2026-04-17 07:54:59
- EFF 称谷歌未按承诺通知用户即向 ICE 交出参与抗议者的账户元数据,可能侵害言论权并已被投诉为欺骗性行为。
- Anthropic 发布的 Claude Opus 4.7 强化编程与多模态但“自适应思考”饱受质疑、关闭后更稳,且以与 4.6 相同定价在多平台上线。
- 阿里开源 MoE 模型 Qwen3.6-35B-A3B 以更强编码与多模态能力对标更大模型、可广泛使用,但稳定性与复杂结构细节仍有限且需注意显存配置。
- 日本麦当劳为符合法规真实呈现并更清晰展示食材,菜单照片刻意将汉堡面包与配料略微错位摆放且禁止使用 AI 生成。
- 陪审团裁定 Live Nation/Ticketmaster 非法垄断或引发拆分与整改,业界呼吁以荷兰式拍卖和限制转让等手段遏制黄牛并改善竞争。
- 文章批评 Ollama 在开源合规与技术透明上失信且性能不佳并复杂化生态,尽管上手易用,但社区更建议直接使用及时更新的 llama.cpp 等替代。
- 作者警示 LLM 将加剧虚假与服务劣化并侵蚀思考能力,主张抵制与监管、谨慎限用且仅在受控场景取其利,并反思教育与社会结构变迁。
- Darkbloom 宣称用闲置苹果硅设备提供端到端加密的私有推理并让设备主获利且成本更低,但实际需求、收益、磨损与规模化成本备受质疑。
- Cloudflare 推出与 Workers 深度集成的邮件路由与发送及代理能力(自动配置 SPF/DKIM/DMARC 等),但价格高于 AWS SES 且滥用与投递声誉令人担心。
- 因在客户端暴露且未限权的浏览器密钥被滥用,用户 13 小时内 Gemini 账单暴涨 5.4 万欧元,凸显预算提醒滞后与缺乏硬性上限,谷歌称已推限额与密钥限制并建议预付费。
https://www.eff.org/deeplinks/2026/04/google-broke-its-promise-me-now-ice-has-my-data
这篇文章讲述了 Amandla Thomas-Johnson 的经历,他是一名持学生签证在美国攻读博士的学生。2024 年 9 月,他曾短暂参加了一场支持巴勒斯坦的抗议活动。2025 年 4 月,美国移民与海关执法局(ICE)向谷歌发出行政传票,要求提供他的账户数据。谷歌在未通知他、也未给予他挑战传票的机会的情况下,于次月将其信息交给了 ICE,违反了谷歌近十年来承诺的用户数据披露前通知政策。
谷歌的通知政策中有少数例外情况,如法院的禁令,但这些并不适用于 Thomas-Johnson 的案件。尽管 ICE 请求谷歌不要通知他,但这并非法院强制要求。电子前沿基金会(EFF)因此向加州和纽约的检察长提交了投诉,要求调查谷歌的欺骗性商业行为。
Thomas-Johnson 描述了他在美国的经历:因参加抗议被联邦政府盯上,被迫躲藏三个月,联邦特工曾上门搜查,朋友也在机场被盘问。他以为离开美国后就脱离了美国当局的控制,但事实并非如此。几周后,他在瑞士日内瓦收到谷歌的邮件,告知其账户数据已被交给国土安全部,但这封邮件并未给他提前申诉的机会。
律师获得的传票显示,ICE 主要索取了订阅者信息,如 IP 地址、物理地址、登录时间等,虽然没有内容信息,但这些数据足以构建详细的监控档案,暴露个人隐私。文章强调,技术公司庞大的数据储备与国家权力结合,可能导致难以察觉和挑战的任意调查。
Thomas-Johnson 表达了被联邦政府调查的恐惧和不安,担心自己是否成为了被标记的对象,未来是否会受到更多审查,甚至影响到他的旅行和报道工作。他质疑自己能否追究责任。
文章最后更新补充了谷歌通知政策的例外情况说明,确认这些例外不适用于 Thomas-Johnson 的案件。文章还关联了相关隐私、言论自由和匿名性议题。
https://news.ycombinator.com/item?id=47782570
https://www.anthropic.com/news/claude-opus-4-7
该网页主要介绍了 Anthropic 公司最新发布的人工智能模型 Claude Opus 4.7。该模型在软件工程领域表现显著提升,尤其擅长处理复杂、长时间运行的任务,能够自我校验输出结果,执行指令更精准。Opus 4.7 在视觉能力上也有大幅提升,支持更高分辨率的图像识别,能够更有创意地完成专业任务,如界面设计、幻灯片制作和文档生成。
网页还提到,Opus 4.7 在网络安全方面进行了能力调整,配备了自动检测和阻止高风险请求的安全措施,旨在为未来更强大的模型发布积累经验。安全专业人员可以通过新的网络安全验证计划合法使用该模型进行漏洞研究和渗透测试。
Opus 4.7 已在多个平台上线,包括 Claude 产品、API、Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry,定价与前一版本 Opus 4.6 保持一致。
网页中引用了多位技术专家和合作伙伴的评价,普遍认为 Opus 4.7 在编码能力、逻辑推理、多模态理解和长时间任务执行方面有显著进步。它不仅提升了开发效率,还能更好地处理异步工作流和复杂问题,表现出更强的自主性和创造力。该模型在金融、法律、生命科学等多个领域展现出优异的应用潜力,帮助用户实现更高效、更可靠的工作流程。
https://news.ycombinator.com/item?id=47793411
https://qwen.ai/blog?id=qwen3.6-35b-a3b
Qwen3.6-35B-A3B 是一款开源的稀疏混合专家模型(MoE),具有 350 亿个总参数和仅 30 亿个活跃参数。这款模型在高效性的基础上,提供了卓越的编码能力,明显超越了其前身 Qwen3.5-35B-A3B,并与更大规模的密集模型(如 Qwen3.5-27B 和 Gemma4-31B)相抗衡。Qwen3.6-35B-A3B 还支持多模态思维和非思维模式,当今最多功能性的开源模型之一。
Qwen3.6-35B-A3B 在众多任务和模态下的评估结果显示:
Qwen3.6-35B-A3B 具有良好的代理编码能力,可以与流行的第三方编码助手(如 OpenClaw、Claude Code 和 Qwen Code)无缝集成,以优化开发工作流程并实现高效、上下文感知的编码体验。
模型支持 “preserve_thinking” 性,可以在代理任务中保留前面的思考内容。用户可以通过设置环境变量并使用示例代码来进行 API 调用。
Qwen3.6-35B-A3B 是一款强大的开源模型,凭借其出色的编码能力和多模态推理能力,成为开发者和研究人员的重要工具。随着它的开源发布,用户可以自由下载、使用和改进这款模型,推动人工智能的发展。
https://news.ycombinator.com/item?id=47792764
https://www.mcdonalds.co.jp/en/menu/burger/
该网页是日本麦当劳的官方菜单页面,提供了详细的餐品分类和价格信息。菜单分为多个部分,包括特色产品、汉堡、套餐、配菜、饮料、儿童套餐、早餐、夜间菜单(Yoru Mac)、甜点和 McCafé 咖啡系列。早餐供应时间为早上 10:30 之前,常规菜单从 10:30 开始,夜间菜单从下午 5 点开始。
页面列出了各类产品及其价格,例如早餐的鸡肉塔塔鸡块、蛋麦满分、香肠麦满分等,常规菜单中的巨无霸、照烧汉堡、鱼柳包、麦辣鸡腿堡等,夜间菜单则提供加量版的汉堡选择。价格均为含税价,且堂食和外带价格相同。
此外,页面说明了菜单价格可能因特殊地点或外送服务有所不同,部分产品并非所有餐厅均有供应。还特别提示了过敏原和营养信息的获取方式,过敏原信息覆盖日本食品标签标准中的主要成分。用户可通过官方 App 进行英文点餐,部分餐厅也提供英文菜单。
页面还介绍了麦当劳的移动点餐服务,方便顾客快速获取新鲜餐品。最后,页面包含版权信息及浏览器兼容性提示,建议使用 Google Chrome 浏览器以获得最佳体验。
https://news.ycombinator.com/item?id=47785738
Live Nation Entertainment Inc.在一场具有里程碑意义的反垄断审判中败诉,此案揭示了该公司在现场演出行业的垄断地位,并可能导致这家美国最大的演唱会推广和票务销售公司被拆分。经过为期六周的曼哈顿审判,联邦陪审团裁定 Live Nation 非法垄断现场演出市场,并对音乐会门票收取过高费用。
审判过程中,音乐行业的多位知名人士以及 Live Nation 首席执行官 Michael Rapino 出庭作证。此次判决是对 Live Nation 多年监管审查的结果,反映出监管机构对其市场支配地位的持续关注和担忧。
该判决不仅对 Live Nation 的业务模式构成重大挑战,也可能对整个现场演出行业产生深远影响,促使市场竞争环境发生变化,保护消费者权益,防止票价被人为抬高。
https://news.ycombinator.com/item?id=47783713
https://sleepingrobots.com/dreams/stop-using-ollama/
这篇文章详细揭露了 Ollama 作为本地大型语言模型(LLM)运行工具的争议和问题。Ollama 最初因方便用户运行 llama.cpp 模型而流行,但其背后的技术主要依赖于 Georgi Gerganov 在 2023 年开发的开源项目 llama.cpp。文章指出,Ollama 在很长时间内未对 llama.cpp 进行应有的版权和技术来源声明,甚至未遵守 MIT 开源许可的基本要求,导致社区强烈不满。
文章还揭示,Ollama 在 2025 年中期放弃了 llama.cpp 的推理引擎,转而使用自研的基于 ggml 的后端,但该自研版本存在多种 bug 和性能劣势,反而不如原版 llama.cpp 稳定和高效。社区测试显示,llama.cpp 的运行速度显著快于 Ollama。
此外,Ollama 在模型命名上存在误导行为,例如将 DeepSeek 发布的精简版模型误标为完整版,导致用户误解模型性能,损害了模型开发者的声誉。社区多次反馈未获解决。
2025 年 7 月,Ollama 发布了闭源的桌面应用程序,违背了其最初的开源形象,且未明确许可,令社区质疑其透明度和诚信。
最后,文章批评 Ollama 引入了额外的 Modelfile 配置文件,重复了开源 GGUF 模型格式已解决的配置问题,增加了不必要的复杂度。
总体来看,文章认为 Ollama 在技术透明度、社区责任和产品质量方面存在严重不足,建议用户选择更开源、稳定和高效的替代方案。
https://news.ycombinator.com/item?id=47788385
https://aphyr.com/posts/420-the-future-of-everything-is-lies-i-guess-where-do-we-go-from-here
这篇文章题为《未来的一切都是谎言,我想:我们将何去何从?》,作者探讨了人工智能特别是大型语言模型(LLM)对社会、文化和个人生活的深远影响。文章开头通过类比汽车对城市结构和社会生活的巨大改变,引导读者思考 AI 技术可能带来的类似变革。
作者表达了对当前 AI 技术泛滥带来的负面影响的担忧,包括虚假信息泛滥、服务质量下降、隐私和安全问题、工作岗位流失等。他指出,许多领域的核心技能如阅读、思考和写作正受到大型语言模型的冲击,自己也未使用 LLM 辅助写作,强调保持独立思考和手工完成任务的重要性。
文章呼吁读者拒绝依赖 AI 生成的内容,积极抵制低质量信息,推动对 AI 企业的严格监管,反对对 AI 数据中心的税收优惠,并鼓励形成工会以抵制强制使用 AI 工具。同时,作者建议 AI 从业者认真反思自己的角色,甚至提出“应该辞职”的激烈观点,以减缓 AI 技术的快速发展,争取更多时间应对潜在风险。
尽管对现有 AI 技术持批判态度,作者也承认在某些受控场景下,AI 工具仍有实用价值,例如辅助编写特定代码。他强调使用时需谨慎,避免带来安全和技术债务问题。
文章最后感谢多位朋友的讨论和反馈,介绍了自己的写作过程,体现出对深度思考和严谨表达的坚持。整体上,这是一篇对 AI 未来充满忧虑但又理性审视的深度分析,呼吁社会各界共同面对和管理 AI 带来的挑战。
https://news.ycombinator.com/item?id=47792718
Darkbloom 是一个去中心化的推理网络,旨在利用闲置的苹果硅芯片设备进行人工智能推理计算。当前 AI 计算市场存在多层加价,从 GPU 制造商到大型云服务商再到 API 提供商,最终用户支付的价格远高于实际硬件成本。与此同时,超过 1 亿台苹果设备大部分时间处于闲置状态,未被充分利用。Darkbloom 通过直接连接这些闲置设备与计算需求,降低了推理成本,且运营者无法窥视推理数据,保障隐私安全。
对于用户,Darkbloom 提供了兼容 OpenAI 的 API,支持聊天、图像生成和语音转文字,推理成本约为传统集中式服务的一半,且所有请求均端到端加密。对于硬件拥有者,利用闲置的苹果设备参与网络运营,可以获得推理收入,电力成本极低,利润率高达 90% 以上。
Darkbloom 解决的核心难题是信任和隐私保护。通过四层独立验证的安全机制,包括端到端加密、硬件密钥验证、操作系统级别的运行时保护以及响应的硬件签名,确保运营者无法访问用户数据,满足企业级安全需求。
该平台实现了 OpenAI 兼容的 API 接口,支持流式传输、函数调用、图像生成和语音转写等功能,支持多种大型模型,包括多专家模型(MoE)和最先进的编码模型。成本方面,Darkbloom 的推理费用比现有集中式服务低 50% 以上,且无平台抽成,运营者可保留全部收入。
运营者只需安装命令行工具或未来的 macOS 菜单栏应用,即可轻松参与。根据不同设备和使用场景,运营者年收入预估从数百美元到上万美元不等。Darkbloom 不仅提供了技术实现,还发布了详细的研究论文,涵盖架构设计、安全模型和经济模型。
总之,Darkbloom 通过将闲置苹果设备转化为安全、低成本的 AI 推理资源,打破了传统 AI 计算市场的垄断结构,实现了用户降本增效和硬件拥有者收益最大化的双赢局面。
https://news.ycombinator.com/item?id=47788542
https://blog.cloudflare.com/email-for-agents/
Cloudflare 发布了其电子邮件服务的公开测试版,旨在为开发者和应用提供完整的双向电子邮件解决方案。电子邮件作为最普及的通信接口,无需定制聊天应用或 SDK,任何人都能通过邮箱与应用或代理交互。Cloudflare Email Service 包括邮件路由和邮件发送功能,支持开发者在 Cloudflare Workers 中直接发送事务性邮件,无需管理 API 密钥或秘密信息。
该服务自动配置 SPF、DKIM 和 DMARC 记录,确保邮件认证和高效投递,避免被标记为垃圾邮件。结合已有的免费邮件路由功能,开发者可以在 Cloudflare 平台内接收、处理并回复邮件,实现完整的邮件工作流。
Cloudflare 还推出了 Agents SDK,支持构建以邮件为核心的智能代理。代理能够异步处理邮件,执行复杂任务并回复,区别于只能即时响应的聊天机器人。代理通过地址解析实现邮件路由,无需单独邮箱,状态持久化依赖 Durable Objects,保证会话上下文和历史保存。安全机制通过 HMAC-SHA256 签名防止邮件伪造,确保回复准确路由到对应代理实例。
此外,Cloudflare 提供了 MCP 服务器、Wrangler CLI 命令和开发技能,方便各种环境中的代理发送邮件,支持本地或远程运行的智能代理系统。整体上,Cloudflare Email Service 为开发者提供了构建邮件原生智能代理的完整工具链和基础设施。
https://news.ycombinator.com/item?id=47792593
该网页内容主要讨论了用户在启用 Firebase AI Logic 后,出现的 Gemini API 异常高额账单问题。用户 zanbezi 描述了他们在启用该功能后,短时间内出现了超过 5.4 万欧元的异常费用,且这些费用并非真实用户行为导致,而是自动化流量引起。尽管设置了预算和异常费用提醒,但因延迟通知,最终费用仍大幅增加。用户尝试与 Google Cloud 支持沟通,但费用被认定为有效使用,未获账单调整。
Google 官方代表 Logan Kilpatrick 回应,介绍了目前 Gemini API 的多项防护措施,包括账单账户限额、项目消费上限以及逐步禁用无 API 限制的浏览器密钥等。建议避免在客户端代码中暴露 API 密钥,并强调新生成的密钥默认仅限于 Gemini API 使用。Google 正在推广预付费账单模式,帮助开发者更好控制支出。官方鼓励用户通过邮件联系以获得进一步支持。
整体来看,网页内容聚焦于 Gemini API 使用中出现的安全和费用控制问题,提供了官方的解决方案和建议,同时呼吁开发者加强密钥管理和消费监控,避免类似高额账单事件再次发生。
https://news.ycombinator.com/item?id=47791871
https://news.ycombinator.com/item?id=47789617
And still, in the year of our lord 2026, GitHub does not support IPv6.
https://github.com/orgs/community/discussions/10539
rtdq
然而,到了公元2026年,GitHub仍然不支持IPv6。
https://news.ycombinator.com/item?id=47786655
OP, I love not just that you noticed this, but that you thought to post it here too. HN is the best.
rappatic
楼主,我不仅喜欢你注意到了这一点,更喜欢你还想到在这里分享。HN是最棒的。
https://news.ycombinator.com/item?id=47796353
“Again, we are not doing this because we want this to be the future. It is not because we want to expand to chain AI-run retail stores across the world. It is not for economic opportunity.
We’re doing this because we believe this future is coming regardless, and we’d rather be the ones running it first while monitoring every interaction, analyzing the traces, benchmarking how much autonomy an AI can responsibly hold.”
I always enjoy how these AI companies try to take a moral high ground. When someone doesn’t want something to be the future, usually, their instinct is not to try to be the first person doing that exact thing. If you don’t want this to be the future than why don’t you spend your time building a future you do want? Supporting people that want more AI regulation to stop this? Literally anything else.
Just be honest, you think this is the future and you do in fact want to be first doing it to be in a position to make alot of money. Do you think people don’t know what and ad is when they see one?
class3shock
“我们并不是因为想让这成为未来才这么做。也不是因为想在全球开设AI运营的连锁零售店。更不是为了经济利益。
我们这么做是因为我们相信这种未来无可避免地会到来,我们宁愿成为最先运行它的人,同时监控每一次互动,分析痕迹,评估AI能负责任地拥有多少自主权。”
我总是很喜欢这些AI公司试图占据道德制高点的样子。当有人不希望某事成为未来时,通常他们的本能不是去做第一个做那件事的人。如果你不希望这成为未来,那为什么不花时间去打造你真正想要的未来呢?支持那些希望加强AI监管以阻止这种情况的人?任何其他事情也行。
说实话,你们认为这就是未来,也确实想成为第一个做这件事的人,好占据一个能赚很多钱的位置。你们难道以为人们看到广告时不知道那是什么吗?
https://news.ycombinator.com/item?id=47794768
I’m finding the “adaptive thinking” thing very confusing, especially having written code against the previous thinking budget / thinking effort / etc modes: https://platform.claude.com/docs/en/build-with-claude/adaptive-thinking
Also notable: 4.7 now defaults to NOT including a human-readable reasoning token summary in the output, you have to add “display”: “summarized” to get that: https://platform.claude.com/docs/en/build-with-claude/adaptive-thinking#summarized-thinking
(Still trying to get a decent pelican out of this one but the new thinking stuff is tripping me up.)
simonw
我觉得“自适应思维”这个概念非常令人困惑,尤其是在我之前针对旧版的思维预算 / 思维努力等模式写代码之后:https://platform.claude.com/docs/en/build-with-claude/adaptive-thinking
还有一点值得注意的是:4.7版本现在默认不包含可读的人类推理令牌摘要,如果想要这个功能,需要添加 “display”: “summarized”:https://platform.claude.com/docs/en/build-with-claude/adaptive-thinking#summarized-thinking
(我还在努力让它生成一个不错的鹈鹕图像,但新的思维机制让我很迷惑。)
https://news.ycombinator.com/item?id=47787118
YouTube now lets you turn off Shorts
No it doesn’t. If you were hoping it would mean you don’t see shorts when you visit the Youtube home page, that’s not what this is. I just tried the thing mentioned in the article– set my Shorts time limit to 0 minutes. What it does is make it so if you click a short from somewhere the short plays, but then if you try to swipe to the next one it hits you with the “You reached your short limit”. If you then return to the home page you still see Shorts.
savanaly
YouTube现在允许你关闭Shorts
其实并没有。如果你希望这意味着你在访问YouTube主页时不会看到Shorts,那就错了。我刚试了文章里提到的方法——把Shorts的时间限制设为0分钟。结果是,如果你从某处点击一个Short,视频还是会播放,但如果你尝试滑动看下一个Short,就会弹出“你已达到Short观看上限”的提示。然后如果你返回主页,仍然能看到Shorts内容。
https://news.ycombinator.com/item?id=47792484
We had a budget alert (€80) and a cost anomaly alert, both of which triggered with a delay of a few hours
By the time we reacted, costs were already around €28,000
The final amount settled at €54,000+ due to delayed cost reporting
So much for the folks defending these three companies that refused to provide hard spending cap (“but you can set the budget”, “you are doing it wrong if you worry about billing”, “hard cap it’s technically impossible” etc.)
benterix
我们设置了一个预算警报(80欧元)和一个费用异常警报,两者都延迟了几个小时才触发。
等我们反应过来时,费用已经接近28,000欧元。
由于费用报告延迟,最终结算金额超过了54,000欧元。
那些为这三家公司辩护的人真是无语,这三家公司拒绝提供硬性支出上限(“但你可以设置预算”、“如果你担心账单,那就是你用错了方式”、“硬性上限技术上不可能”等等)。
https://news.ycombinator.com/item?id=47787273
The First Amendment applies to everyone on US soil, not just citizens. That’s settled law. The government can revoke visas for legitimate immigration violations, but it’s not allowed to use immigration machinery as a pretext to punish political expression. That’s exactly what they are doing. It looks like the courts will eventually put an end to this [0] but it won’t reverse the damage that’s already been done.
I’m generally receptive to point the finger at Google’s intentions but in their defense, administrative subpoenas frequently include non disclosure orders. Google’s own transparency policies have always carved out (industry standard) exceptions for cases where they’re legally prohibited from notifying.
[0] https://evrimagaci.org/gpt/judge-rebukes-trump-over-student-deportation-crackdown-505576
Jimmc414
第一修正案适用于所有在美国境内的人,而不仅仅是公民。这是既定法律。政府可以因合理的移民违规行为吊销签证,但不能利用移民机制作为惩罚政治表达的借口。这正是他们正在做的事情。看起来法院最终会制止这一做法,但已经造成的伤害无法逆转。
我通常愿意质疑谷歌的意图,但为他们辩护的是,行政传票通常包含保密令。谷歌自身的透明度政策一直对法律禁止其通知的案件保留了(业界标准的)例外条款。
https://news.ycombinator.com/item?id=47793653
Quick everyone to your side projects. We have ~3 days of un-nerfed agentic coding again.
TIPSIO
快,大家赶紧去做自己的副项目。我们又有大约三天未削弱的智能代理编码时间了。
https://news.ycombinator.com/item?id=47793523
Addressing the usual few complaints folks always bring up:
This is from the separate independent team that works on Thunderbird, not Firefox, so there isn’t any resource contention happening there
Thunderbird is revenue positive, and this potentially gives that team another revenue stream to be even more self-sustaining through charging companies
Businesses definitely want to control the AI they’re using (especially with RAGs of their own data) instead of just throwing it at their LLM vendor and hoping for the best
People on HN are fond of asserting that their own POV is the only one. Imagine that there is such a thing as a person in charge of choosing technologies for organizations, and that you’re such a person. That’s who this is for.
anildash
针对大家常提的几个抱怨:
这是由独立于 Firefox 的团队负责开发 Thunderbird 的,所以不会存在资源争抢的问题。
Thunderbird 是盈利的,这项功能可能为该团队带来新的收入来源,使其通过向公司收费而更加自给自足。
企业肯定希望掌控自己使用的 AI(尤其是针对自身数据的检索增强生成模型),而不是把数据直接交给大型语言模型供应商,然后抱有侥幸心理。
HN 上的人们喜欢断言自己的观点是唯一正确的。请设想确实存在一个负责为组织选择技术的人,而你就是这样的人。这就是为这种人设计的功能。
https://news.ycombinator.com/item?id=47786264
Head of Thunderbird project here.
Our scheduling tool, Thunderbird Appointment, will always be open source.
Repo here: https:// github.com/thunderbird/appointment
Come talk to us and build with us. We’ll help you replace Cal.com
ryanleesipes
我是Thunderbird项目负责人。
我们的排期工具Thunderbird Appointment将永远保持开源。
代码库在这里:https://github.com/thunderbird/appointment
欢迎来和我们交流,一起开发。我们会帮你取代Cal.com。
https://news.ycombinator.com/item?id=47786422
I just want to note how fast this page is.
806kB transferred. 766ms to finished. I hit the DFW AWS CloudFront pop from here.
Similar page for BK https://www.burgerking.co.jp/menu
31MB transferred. 6.5s to finished. Hits the DEN pop (but it’s a “miss”).
I am in Colorado. uBlock is on.
Even if you don’t count the 7.5MB of fonts on the BK page, that’s wild.
tbeseda
我只想说这页面加载速度有多快。
传输了806KB,766毫秒完成。我从这里连接到了达拉斯沃斯堡的AWS CloudFront节点。
汉堡王的类似页面 https://www.burgerking.co.jp/menu
传输了31MB,花了6.5秒完成。连接到了丹佛节点(但这是一次“未命中”)。
我人在科罗拉多,uBlock广告拦截器开启。
即使不算汉堡王页面上7.5MB的字体文件,这也太离谱了。
https://news.ycombinator.com/item?id=47788769
I have a hard time believing their numbers. If you can pay off a mac mini in 2-4 months, and make $1-2k profit every month after that, why wouldn’t their business model just be buying mac minis?
kennywinker
我很难相信他们的数据。如果你能在2-4个月内还清一台Mac mini的费用,并且之后每个月还能赚1000到2000美元的利润,为什么他们的商业模式不直接去买Mac mini呢?
https://news.ycombinator.com/item?id=47784711
When I saw Jensen’s talk about how Openclaw surpassed React and Linux in terms of GitHub stars within a few months, I knew the whole thing was manufactured bot hype.
No one can tell me a compelling use case. The whole thing seems designed around getting people to burn more tokens.
redact207
当我看到Jensen谈到Openclaw在几个月内在GitHub星标数量上超过了React和Linux时,我就知道这完全是人为制造的机器人炒作。
没人能给我讲出一个有说服力的使用案例。整个东西看起来就是为了让人们消耗更多代币而设计的。
https://news.ycombinator.com/item?id=47793859
I hope people realize that tools like caveman are mostly joke/prank projects - almost the entirety of the context spent is in file reads (for input) and reasoning (in output), you will barely save even 1% with such a tool, and might actually confuse the model more or have it reason for more tokens because it’ll have to formulate its respone in the way that satisfies the requirements.
Tiberium
我希望大家能明白,像caveman这样的工具大多是开玩笑或恶作剧性质的项目——几乎所有的计算时间都花在了文件读取(输入)和推理(输出)上,使用这样的工具你几乎节省不到1%的时间,反而可能会让模型更困惑,或者因需要以满足要求的方式来构造回答而导致推理所需的token更多。
https://news.ycombinator.com/item?id=47791093
I got a human being at Google to look into my problem and take action after sending a police report to Google‘s legal department certified mail return receipt along with a letter describing how someone was impersonating me and my business using a Gmail address in an attempt to commit fraud.
Yes, it was a pain to take all of these steps and it probably took about 3 hours but it was absolutely necessary considering there was no avenue for me to shut down this person otherwise.
ilamont
我联系了谷歌的一位员工,让他调查我的问题并采取行动。我向谷歌的法律部门寄送了经认证的挂号邮件回执,附上了一封说明有人冒充我及我的业务并使用Gmail地址试图进行欺诈的信函。
是的,采取这些步骤确实很麻烦,大概花了我三个小时,但考虑到我别无他法关闭这个人的账号,这绝对是必要的。
https://news.ycombinator.com/item?id=47793771
Opus 4.7 uses an updated tokenizer that improves how the model processes text. The tradeoff is that the same input can map to more tokens—roughly 1.0–1.35× depending on the content type.
caveman[0] is becoming more relevant by the day. I already enjoy reading its output more than vanilla so suits me well.
[0] https://github.com/JuliusBrussee/caveman/tree/main
cupofjoakim
Opus 4.7 使用了更新的分词器,改进了模型处理文本的方式。代价是相同的输入可能会映射到更多的标记,大约是1.0到1.35倍,具体取决于内容类型。
caveman[0] 日益受到关注。我已经更喜欢阅读它的输出,而不是原版的,所以这对我来说很合适。
[0] https://github.com/JuliusBrussee/caveman/tree/main
https://news.ycombinator.com/item?id=47783055
This story is the one that finally pushed me to leave google. I moved off my ~20 year old Google account and deleted everything off their services including almost a decade of Google photos. I cancelled my Google one subscription for extra space. I’m now self hosting what I can and paying proton mail for everything else. I refuse to allow a company that will hand over data at the request of an administrative warrant to hold my data.
jfoworjf
这个事件最终促使我离开了谷歌。我放弃了使用近20年历史的谷歌账号,并删除了他们服务上的所有内容,包括接近十年的谷歌照片。我取消了谷歌One增加存储空间的订阅。现在我尽量自己托管数据,其他的都交给Proton Mail付费使用。我拒绝让一个会在行政令要求下交出数据的公司保管我的数据。
https://news.ycombinator.com/item?id=47793692
Too late, personally after how bad 4.6 was the past week I was pushed to codex, which seems to mostly work at the same level from day to day. Just last night I was trying to get 4.6 to lookup how to do some simple tensor parallel work, and the agent used 0 web fetches and just hallucinated 17K very wrong tokens. Then the main agent decided to pretend to implement tp, and just copied the entire model to each node…
buildbot
太晚了,个人来说,经过上周4.6表现糟糕之后,我转向了codex,感觉它每天的表现大致都差不多。就在昨晚,我试图让4.6查找如何做一些简单的张量并行工作,结果代理没有调用任何网络搜索,却胡乱生成了1.7万个非常错误的词元。然后主代理决定假装实现张量并行,结果竟然把整个模型都复制到了每个节点上……
https://news.ycombinator.com/item?id=47783737
The linked Google policy states:
We won’t give notice when legally prohibited under the terms of the request.
The post states that his lawyer has reviewed the subpoena, but doesn’t mention whether or not it contained a non-disclosure order. That’s an important detail to address if the claim is that Google acted against its own policy.
eurleif
链接的谷歌政策中写道:
在法律禁止通知的请求条款下,我们不会发出通知。
该帖子提到他的律师已经审查了传票,但没有说明传票是否包含了保密令。如果声称谷歌的行为违反了其自身政策,这一点是一个重要细节需要说明。
https://news.ycombinator.com/item?id=47786185
This looks bad for Microsoft. They added a Copilot button to all their products but it doesn’t do much more than open a chat side panel.
I recently tried Claude Cowork for PowerPoint and I was stunned by the content as well as design quality of the deck it produced. That’s a threat for Microsoft because now you don’t need the editing tools of PowerPoint, AI replaces it, so all you need is the presentation mode of PowerPoint.
Copilot for Excel is useless. Ask it what is in cell A1 and it can’t answer. I am looking forward to trying ChatGPT for Excel.
lateforwork
这对微软来说很不利。他们在所有产品中都添加了一个Copilot按钮,但它除了打开一个聊天侧边栏之外几乎没什么用。
我最近试用了Claude Cowork的PowerPoint插件,对它生成的内容和设计质量感到震惊。这对微软来说是一个威胁,因为现在你不需要PowerPoint的编辑工具,AI取代了它,所以你只需要PowerPoint的演示模式。
Excel的Copilot毫无用处。问它A1单元格里是什么,它都答不上来。我很期待尝试ChatGPT版的Excel。
2026-04-16 07:40:43
- Flock Safety 的 AI 车牌与车辆指纹监控快速扩张,虽能辅助侦查却伴随无令检索、跨域共享、偏见与误拦等风险,呼吁以社区建设替代泛化监控。
- 作者依据 CCPA 向 Flock 要求删除家人数据被以“数据由客户控制”为由拒绝,凸显其合规灰区与个人难以行使删除权的问题。
- 与其被厚重教材劝退,不如用 Crenshaw 与 Nanopass 方法先动手做小型编译器,实践后再系统补理论。
- 作者在洛杉矶自然历史博物馆记录矿物之美,引发对“上帝睡在矿物中”这一美学与灵性隐喻的讨论与分歧。
- VF 通过并购后在中低端背包上刻意降质并收窄保修,使寿命缩短与单位使用成本上升以驱动重复购买。
- Piotr Wozniak 主张遵循生理节律的自由睡眠、拒绝闹钟与稳定作息,用“时钟+沙漏”模型与策略提升记忆、学习与健康。
- 关闭源代码无法阻挡 AI 自动化攻击,需将持续低成本的 AI 安全测试融入开发流程,以 AI 抵御 AI 并保持开源透明。
- Anna’s Archive 因发布 Spotify 资源被缺席判赔 3.22 亿美元并遭全球禁令与域名冻结,但匿名与跨境执行使其更具震慑意义。
- OpenSSL 4.0.0 移除旧协议与引擎、强化校验并新增 ECH/SM2/SM3 等,且 ECH 在部分生态可用但对单一服务器隐私收益有限。
- Gemma 4 已能在 iPhone 本地离线运行但主要依赖 GPU 非 ANE,能效与发热不佳更偏演示,生态与基准仍待完善。
介绍了 Flock Safety 公司推广的 AI 监控摄像头系统及其引发的隐私和法律问题。Flock 摄像头不仅能识别车牌,还能通过颜色、车型、车身损伤、轮胎类型甚至车贴位置等特征,创建“车辆指纹”,实现对车辆的精准追踪。系统还能分析车辆之间的关联,追踪车辆的行驶路线和频繁出现的地点,形成详细的移动和社交网络数据库。执法部门可在无需搜查令的情况下访问这些数据,存在滥用风险,如堪萨斯一警察曾利用该系统非法跟踪前女友。
该系统在美国迅速普及,已有超过 3,000 个执法和政府机构使用,覆盖超过 10 万台摄像头,且扩展速度快,缺乏公众监督。Flock 摄像头引发了严重的第四修正案隐私权争议,法院已多次判定类似的无差别监控行为违宪,但由于 Flock 是私营企业,其数据收集和销售存在法律灰色地带。隐私不仅关乎隐藏不法行为,更是个人自由和尊严的保障。专家警告,这种大规模监控系统一旦被滥用,可能成为压制异见和侵犯公民自由的工具。
此外,Flock 系统加剧了执法中的种族偏见,例如伊利诺伊州 Oak Park 地区通过 Flock 摄像头发现被拦截的司机中 84% 为黑人,而该地黑人仅占 21%。商业利益也是推动该系统扩散的重要因素,Flock 与执法机构合作,鼓励企业和社区管理组织共享监控数据,扩大监控范围,甚至有社区在公共道路安装摄像头引发争议。
总体来看,Flock Safety 的 AI 监控技术虽声称能提升公共安全,但缺乏有效监管,存在侵犯隐私、滥用权力和加剧社会不公的风险。真正的公共安全应来自社区投资,而非无处不在的监控和数据追踪。
https://news.ycombinator.com/item?id=47772012
https://honeypot.net/2026/04/14/i-wrote-to-flocks-privacy.html
这是一篇博客文章,作者 Kirk Strauser 讲述了他向 Flock Safety 公司提交请求,要求根据加州消费者隐私法案(CCPA)删除其个人及家庭成员的相关数据,但遭到了拒绝。Flock Safety 回复称,他们只是为客户提供数据处理服务,数据的所有权和控制权属于客户,因此无法直接满足作者的删除请求,建议作者联系使用 Flock Safety 服务的组织。
Flock Safety 在回复中还说明了其数据收集和隐私政策:他们作为服务提供商,按照客户合同处理数据,不出售或用于自身商业目的;使用车牌识别技术收集的是公开可见的车辆特征图像,不涉及敏感个人信息;客户使用这些数据主要用于安全管理和协助破案;默认数据保留期限为 30 天,客户可根据法律或政策调整。
作者认为 Flock Safety 的回应在法律上存在争议,认为该公司作为数据收集和处理方,应当遵守 CCPA 的规定,正在考虑是否寻求法律帮助。文章还附带了与隐私相关的其他内容链接。
https://news.ycombinator.com/item?id=47768813
https://prog21.dadgum.com/30.html
这篇文章讨论了现代编程,特别是编写编译器的学习过程。作者指出,许多关于编译器的书籍内容过于庞杂和复杂,导致初学者难以入门,甚至产生“编译器难写”的误解。文章推荐了 Jack Crenshaw 在 1988 年开始的系列教程《Let’s Build a Compiler!》,该系列以简单易懂的方式讲解了 Turbo Pascal 类编译器的构建,适合初学者,但缺少内部程序表示(如抽象语法树)的内容。
作者进一步介绍了适合高级语言(如 Python、Ruby、Erlang、Haskell、Lisp)使用的编译器设计方法,强调这些语言便于创建和操作树形数据结构。特别推荐了 Sarkar、Waddell 和 Dybvig 的论文《A Nanopass Framework for Compiler Education》,提出将编译器设计为多个简单转换步骤的理念,每个步骤独立处理输入输出,代码示例使用动态类型的 Scheme 语言。
文章建议初学者先尝试写几个编译器,再考虑是否需要深入阅读经典的《龙书》或其他权威书籍,暗示这些书籍并非学习编译器的唯一途径。作者本人是有多年游戏设计经验的程序员,文中还提及其其他相关技术文章和资源。
https://news.ycombinator.com/item?id=47776796
https://wchambliss.wordpress.com/2026/03/03/god-sleeps-in-the-minerals/
该网页是一个名为“Chamblissian”的公共博客页面,发布了一篇题为“God sleeps in the minerals”(上帝睡在矿物中)的文章。文章内容主要介绍了作者在洛杉矶县自然历史博物馆“Unearthed: Raw Beauty”展览中拍摄的矿物照片,表达了对矿物之美的赞赏。
文章发布于 2026 年 3 月 3 日,归类为“未分类”。页面下方有 19 条评论,评论内容多样,有读者表达了对文章的赞美,也有一些读者提出疑问“这是什么?”,还有部分评论涉及对标题中“上帝睡在矿物中”这一表达的不同看法,有人认为这是诗意的表达,象征矿物之美带有神圣气息,也有人表示不认同甚至反感。
此外,有评论引用了 Paramahansa Yogananda 的一句话:“God sleeps in the minerals, dreams in the flowers, awakens in the animals, and in man knows that He is awake”,进一步阐释了标题的寓意。
总体来看,网页主体是一篇以矿物美学为主题的博客文章,结合作者的现场拍摄和个人感悟,激发了读者的多样讨论。
https://news.ycombinator.com/item?id=47778475
https://www.worseonpurpose.com/p/your-backpack-got-worse-on-purpose
这篇文章讲述了 VF Corporation 如何通过收购和整合多个知名背包品牌,导致这些品牌的产品质量下降的过程。VF Corporation 最初是一家女性内衣制造商,后来通过收购 JanSport、The North Face、Eastpak、Kipling 和 Eagle Creek 等背包品牌,控制了美国超过 55% 的背包市场。
文章指出,过去这些品牌之间的竞争促使它们保持高质量标准,但被同一家公司收购后,竞争消失,品牌开始为了利润目标普遍降低产品质量。具体表现为使用更低密度的面料、替换高品质的 YKK 拉链为廉价替代品、减少缝线密度等,这些变化在外观上难以察觉,但大幅降低了背包的耐用性。
此外,VF Corporation 保留了高端产品线的质量,但在入门级和中端产品上故意降低质量,形成了明显的市场分层。消费者往往无法区分不同质量的产品,只凭品牌名称购买,品牌信誉被用来销售低质产品。
文章还揭示了品牌的保修政策实际上限制了消费者的权益,保修只覆盖材料和工艺缺陷,不包括正常磨损,而产品设计寿命缩短使得常见的损坏不被视为缺陷。消费者反馈称,保修更换的产品质量甚至不如原先的旧包。
作者通过成本与使用寿命的对比指出,便宜且寿命短的背包实际上单位使用成本更高,但这种模式对 VF Corporation 有利,因为它带来重复购买和持续收入。文章最后提到,VF Corporation 已开始出售部分背包品牌,表明这些品牌已成为利润优化的资产,而非公司核心业务。
总结来看,文章揭示了大型企业通过收购、削减成本和降低产品质量,利用品牌信誉谋取利润的商业模式,提醒消费者警惕品牌背后的真实情况。
https://news.ycombinator.com/item?id=47777209
https://super-memory.com/articles/sleep.htm
这篇文章由 Dr Piotr Wozniak 撰写,聚焦于睡眠与学习、记忆及创造力之间的关系,旨在为需要高质量睡眠以提升学习和创造力的人群提供实用指导。文章基于神经生理学的最新研究,尽管睡眠科学仍在快速发展,作者总结了一些已被广泛认可的睡眠基本原理,并提出了实际应用建议。
文章首先阐述了睡眠的重要性,包括睡眠对大脑“垃圾清理”、保护和修复的作用,强调缺乏睡眠的严重后果。接着介绍了睡眠的两个核心组成部分:昼夜节律(生物钟)和睡眠的稳态调节机制,并用“时钟与沙漏”的比喻帮助理解。
随后,文章详细探讨了如何实现良好睡眠的“公式”,包括自由运行睡眠(free running sleep)的概念及其在治疗失眠和睡眠相位障碍中的应用。作者还分析了睡眠时间安排对大脑工作的影响,强调应避免闹钟干扰,减轻睡眠惯性,并讨论了轮班工作和时差反应对健康的影响。
文章还深入介绍了各种睡眠习惯和障碍,如延迟睡眠相位综合症(DSPS)、提前睡眠相位综合症(ASPS)、婴儿睡眠问题、失眠和嗜睡症等,并提供了相应的解决策略。特别强调了昼夜节律的稳定性对健康睡眠的重要性。
关于午睡,文章指出午睡有益于大脑功能和创造力,破除多种关于午睡的误区,详细说明了最佳午睡时间和规则。还介绍了多相睡眠(polyphasic sleep)的概念及其科学挑战,列举了历史上一些著名多相睡眠者及其睡眠模式。
整体而言,文章系统地整合了睡眠科学的理论与实践,提供了丰富的睡眠优化建议,适合关注睡眠质量以提升学习效率和创造力的读者参考。
https://news.ycombinator.com/item?id=47776557
https://www.strix.ai/blog/cal-com-is-closing-its-code-due-to-ai-threats
这篇文章讨论了 Cal.com 宣布将其核心代码库从开源转为闭源的决定及其背后的原因。Cal.com 的 CEO 认为,人工智能已经使得漏洞发现和利用几乎零成本,公开代码反而增加了安全风险。
Strix 作为一个开源的自主 AI 安全代理项目,表达了对 Cal.com 团队的尊重,并分享了他们与 Cal.com 合作发现并负责披露漏洞的经历。Strix 认可 AI 改变了安全环境,但不同意通过关闭源代码来应对 AI 驱动的安全威胁。
文章指出,现代 AI 工具能够通过黑盒和灰盒测试,动态交互和分析系统漏洞,无需访问代码库,因此关闭源代码无法阻止 AI 攻击者。依赖“安全通过模糊”策略在自动化攻击面前是失败的,因为内部团队难以比得上 24/7 不间断的 AI 攻击。
真正的解决方案是利用 AI 防御 AI,将安全测试自动化并集成到开发流程中,实现持续的、低成本的安全验证。通过 AI 自动尝试利用新代码和基础设施变更,提升防御效率。
作者强调,开源并未消亡,透明度依然是增强安全的关键。Strix 保持开源,致力于为开发者提供自主安全代理工具,帮助抵御 AI 黑客攻击。文章最后邀请读者免费试用 Strix,体验持续的 AI 驱动安全测试。
https://news.ycombinator.com/item?id=47780712
https://torrentfreak.com/annas-archive-loses-322-million-spotify-piracy-case-without-a-fight/
Spotify 及多家主要唱片公司,包括环球音乐(UMG)、索尼和华纳,联合对 Anna’s Archive 提起诉讼,获得了 3.22 亿美元的缺席判决。Anna’s Archive 是一家知名的影子图书馆元搜索引擎,帮助用户查找盗版书籍及相关资源。去年 12 月,该网站宣布备份了 Spotify 的音乐数据,震惊了音乐行业。虽然最初只发布了 Spotify 的元数据,没有实际音乐,但这已引起了行业高度警觉。
Spotify 及唱片公司迅速提起诉讼,要求关闭该网站。法院通过初步禁令,要求域名注册机构暂停多个 Anna’s Archive 的域名,尽管该网站随后注册了多个备用域名。诉讼压力促使网站移除了 Spotify 相关的种子文件列表和部分音乐文件,但运营者希望以此换取行业撤诉未果。最终,因被告未出庭,法院判决支持原告,判处 3.22 亿美元赔偿。
判决细节显示,音乐公司依据版权法对约 150 个作品索赔,每件作品最高赔偿 15 万美元,Spotify 基于数字版权管理(DMCA)反规避条款对 12 万个音乐文件索赔 2500 美元,合计超过 3.22 亿美元。若按全部 280 万文件计算,赔偿金额将超过 70 亿美元。
法院还发布了永久禁令,要求全球范围内的域名注册机构、托管服务商和互联网服务提供商关闭 Anna’s Archive 的十个域名,禁止访问并保存相关证据。判决还要求 Anna’s Archive 在十个工作日内提交合规报告,提供有效的联系方式和管理人员信息,但该网站运营者身份仍不明,是否遵守命令尚不确定。
理论上,Anna’s Archive 可以通过支付全部赔偿金并履行禁令义务,申请解除域名禁令,但这一可能性极低。此外,由于部分域名注册在美国法院管辖范围外,禁令的执行存在难度。
总体来看,此次判决在法律上是音乐产业的重大胜利,但实际追回赔偿款的可能性较小,更多体现为对盗版行为的强力震慑。
https://news.ycombinator.com/item?id=47776035
https://github.com/openssl/openssl/releases/tag/openssl-4.0.0
该网页是 GitHub 上 OpenSSL 项目的版本发布说明页面,具体介绍了 OpenSSL 4.0.0 版本的主要更新内容和变更细节。
OpenSSL 4.0.0 是一个功能性版本,带来了许多重要的新功能和潜在的不兼容改动。主要变更包括:
新增功能方面:
整体来看,该版本在安全性、兼容性和功能性上均有显著提升,同时移除了多项过时和不安全的特性,推动 OpenSSL 向更现代和安全的方向发展。
https://news.ycombinator.com/item?id=47768788
https://www.gizmoweek.com/gemma-4-runs-iphone/
本文介绍了谷歌最新的开源 AI 模型 Gemma 4 现已能够在 iPhone 上本地运行,实现完全离线的 AI 推理。这标志着边缘 AI 技术已从未来趋势转变为现实应用。Gemma 4 的 31 亿参数版本在性能上与 Qwen 3.5 的 27 亿参数版本相当,但更值得关注的是其为移动设备优化的 E2B 和 E4B 小型版本,这些版本在速度和资源消耗上更适合实际使用。
用户只需从 App Store 下载谷歌 AI Edge Gallery 应用,即可选择不同模型版本,在设备上直接进行 AI 推理,无需调用 API 或依赖云端。该应用不仅支持文本交互,还集成了图像识别、语音交互和可扩展的技能框架,旨在成为开发者和高级用户进行本地 AI 实验的平台。
技术层面,Gemma 4 利用 iPhone 的 GPU 进行推理,响应速度快且延迟低,显示出消费者硬件已能支持此类工作负载,推动本地 AI 商业化应用。离线运行特别适合对数据隐私有严格要求的企业场景,如现场作业和医疗环境。
总体来看,Gemma 4 在 iPhone 上的成功运行不仅是技术验证,更宣告了本地 AI 时代的到来,谷歌的 Gemma 模型已正式进入市场。
https://news.ycombinator.com/item?id=47774971
https://news.ycombinator.com/item?id=47773673
I don’t want to stop Flock the company. I want to stop Flock the business model, along with all the other mass surveillance, and the data brokers. If the business models can’t be made illegal, it should at least come with liabilities so high that no sane business would want to hold data that is essentially toxic waste.
Without that, we are quickly spiraling into the dystopia where privacy is gone, and when the wrong person gets access to the data, entire populations are threatened.
bmitch3020
我并不是想阻止Flock这家公司,而是想阻止Flock这种商业模式,以及所有其他的大规模监控和数据经纪业务。如果这些商业模式不能被法律禁止,至少应该承担足够高的法律责任,让任何理智的企业都不愿意持有本质上像有毒废料一样的数据。
如果没有这些措施,我们很快就会陷入一个隐私消失的反乌托邦社会,当错误的人获得这些数据时,整个群体都将受到威胁。
https://news.ycombinator.com/item?id=47770910
Personally, I see this as an assault on 3d printing more than any real attempt to regulate guns.
I own several 3d printers. If I wanted to make something resembling a firearm I’d go to home depot WAY before I bothered 3d printing parts. You basically just need a metal tube, and well… a pipe from home depot does that much better than trying to 3d print something much less reliable.
So given we don’t do this regulation for any of the much more reliable ways to create unregistered firearms… what’s special about 3d printers?
So my assumption is immediately that some relatively large lobbying group feels threatened by 3d printing, and is using this as a driver to try to control access and limit business impact.
Either way, this is bad legislation.
horsawlarway
就我个人来看,我觉得这更多是对3D打印技术的打击,而不是真正试图去规范枪支。
我拥有几台3D打印机。如果我想制造类似枪支的东西,我绝对会先去家得宝(Home Depot),而不是费劲用3D打印零件。你基本上只需要一个金属管,而家得宝卖的管子比用3D打印做出来的要好得多,也更可靠。
既然我们并没有对那些更可靠的制造未注册枪支的方式进行监管……那3D打印机有什么特别的呢?
所以我直接怀疑是某个比较大规模的游说团体感受到了3D打印的威胁,借此机会尝试控制使用权限,限制对他们业务的影响。
无论如何,这都是一条糟糕的立法。
https://news.ycombinator.com/item?id=47782196
They will never see a single cent from that, AA will continue to rotate domains and nothing was accomplished, except for spotify’s legal team which earned easy money arguing against empty chair in court.
BTW, you can donate and get faster downloads: https://annas-archive.gl/donate
Just donated in honor of this. Up yours spotify!
progbits
他们永远不会因此得到一分钱,AA 会继续更换域名,除了给 Spotify 的法律团队带来轻松赚钱的机会外,什么都没达成。
顺便说一句,你可以捐款来获得更快的下载速度:https://annas-archive.gl/donate
刚刚为了这事捐了款。去你的,Spotify!
https://news.ycombinator.com/item?id=47780751
Drew Breunig published a very relevant piece yesterday that came to the opposite conclusion: https://www.dbreunig.com/2026/04/14/cybersecurity-is-proof-of-work-now.html
Since security exploits can now be found by spending tokens, open source is MORE valuable because open source libraries can share that auditing budget while closed source software has to find all the exploits themselves in private.
If Mythos continues to find exploits so long as you keep throwing money at it, security is reduced to a brutally simple equation: to harden a system you need to spend more tokens discovering exploits than attackers will spend exploiting them.
simonw
Drew Breunig昨天发表了一篇非常相关的文章,得出了相反的结论:https://www.dbreunig.com/2026/04/14/cybersecurity-is-proof-of-work-now.html
由于现在可以通过花费代币来发现安全漏洞,开源变得更加有价值,因为开源库可以共享审计预算,而封闭源代码软件则必须私下自行寻找所有漏洞。
如果只要不断投入资金,Mythos就能持续找到漏洞,那么安全性简化成了一个非常简单的等式:要强化系统,你需要花费的代币数来发现漏洞,比攻击者利用漏洞花费的代币数还要多。
https://news.ycombinator.com/item?id=47779540
While I personally find this kind of thing extremely annoying, to me, the main problem is the difficulty of determining quality. The Donut media guys did a (relatively unscientific) video comparing a whole bunch of products from the 50s to modern day across several price points. What they found was that the things that “looked” the same now were simultaneously worse and also much cheaper. They also found that, if inflation adjusted, you get could, in most categories, the same or better quality for the same price. It was just that the brands and names that used to be quality were now usually not as much.
So it is often the case that today, you can get something for cheaper than you ever could in the past (albeit not at a great quality), and if you are willing to pay higher prices (but often about the same as you would have paid in the past), you can still get good or even better quality.
The main issue is that determining which products actually are quality has also gotten harder in many cases.
edit: found the video:
https://www.youtube.com/watch?v=I4C62HC1HSo
MostlyStable
虽然我个人觉得这种事情非常烦人,但对我来说,主要问题是判断质量的难度。Donut Media团队做了一个(相对不那么科学的)视频,比较了从50年代到现代多个价格区间的各种产品。他们发现,那些“看起来”相同的东西,现在往往质量更差而且价格也便宜得多。他们还发现,按通货膨胀调整后,在大多数类别中,你用相同的价格可以买到相同甚至更好的质量。只是以前那些品牌和名字曾经代表的高质量,现在通常已经不再如此。
所以,今天你往往能以比过去更便宜的价格买到东西(当然质量不一定好),如果你愿意支付更高的价格(通常和过去相当),你仍然能买到不错甚至更好的质量。
主要问题在于,辨别哪些产品实际上是高质量的变得更难了。
补充:找到那个视频了:
https://www.youtube.com/watch?v=I4C62HC1HSo
https://news.ycombinator.com/item?id=47781248
I have an open source project and started receiving a lot of security vulnerability reports in the last few months. A lot of them are extremely corner cases, but there were some legit ones. They’re all fixed now. Closed source software won’t receive any reports, but it will be exploited with AI. So I definitely agree with the message of this article.
tananaev
我有一个开源项目,最近几个月开始收到很多安全漏洞报告。虽然很多都是非常边缘的情况,但也有一些是真实存在的问题。现在这些问题都已经修复了。闭源软件不会收到任何报告,但却会被人工智能利用进行攻击。因此,我完全同意这篇文章的观点。
https://news.ycombinator.com/item?id=47783044
Privacy, technology and actual freedom overlap massively. Stories like this making it to HN are important since many of the people working at Google that had interactions with this, either by creating the tech or being aware of internal policy changes, read HN. Additionally many founders and decision makers in companies read these stories because it hit HN. Knowing that Google will do this changes your legal calculations. Should I trust them to store my company’s data? Will they honor their BAA requirements if they are ditching other promises they made?
People may be tired of seeing stories like this appear on HN, but getting this story exposure to this group is exactly why they need to hit the homepage.
jmward01
隐私、技术和实际自由之间有着大量重叠。像这样的故事能够出现在HN上非常重要,因为许多在谷歌工作、与此事有过交集的人——无论是参与技术开发,还是了解内部政策变动的——都会阅读HN。此外,许多公司的创始人和决策者也会关注这些故事,因为它们能登上HN首页。知道谷歌会这样做,会改变你的法律计算。我还应该信任他们来存储公司的数据吗?如果他们放弃了其他承诺,还会履行他们的BAA(业务伙伴协议)要求吗?
尽管人们可能已经厌倦看到类似故事出现在HN上,但让这类故事曝光给这群人,正是它们需要登上首页的原因。
https://news.ycombinator.com/item?id=47778855
At some point, don’t you just end up making a low-quality, poorly-tested reinvention of SQLite by doing this and adding features?
z3ugma
到最后,你不就是通过这样做并添加功能,最终做出了一个低质量、测试不足的SQLite的翻版吗?
https://news.ycombinator.com/item?id=47775068
There’s an interesting phenomenon that Agile (capital A) has exposed me to, and once I saw it due to Agile I’ve seen parallels elsewhere.
In that: if it fails, it is only considered evidence that you were not doing it enough.
The solution can never be at fault, it’s your execution, or your devotion to the process (in this case) that was faulty.
It’s also true for Cloud providers; that they’re not suited for certain tasks is no longer considered an engineering trade-off, it’s that you architected your solution wrong, and the answer is to buy even more into how the platform works.
If your microservices become slow or difficult to debug, it’s never that fatter services could have been preferable, it’s that we didn’t go hard-enough into microservices.
If Austerity is not working as an economic model; the answer isn’t to invest in growth, it’s to cut even more corners.
I feel like I see it all the time.
dijit
有一个有趣的现象是,敏捷(大写的A)让我接触到了,一旦我因为敏捷看到了它,我在别的地方也看到了类似的情况。
那就是:如果失败了,人们只会认为证据表明你做得还不够。
解决方案本身永远不会有问题,问题出在你的执行,或者你对流程(在这个例子中)的投入不够。
云服务提供商也是如此;他们不适合某些任务,不再被视为工程上的权衡,而是认为你设计的方案有问题,解决办法就是更深入地投入理解平台的运作方式。
如果你的微服务变得缓慢或难以调试,问题绝不是胖服务可能更好,而是我们对微服务的应用还不够深入。
如果紧缩政策作为经济模型不起作用,答案也不是去投资增长,而是要更加严格地削减开支。
我觉得我几乎时时刻刻都能看到这种情况。
https://news.ycombinator.com/item?id=47776358
In addition to the damages award, Rakoff entered a permanent worldwide injunction
Because apparently U.S. courts and judges can do that. The more this is ignored by third-parties outside of the U.S., the better.
I’m not against international cooperation regarding common rules (I’m rather for), but the current context certainly doesn’t designate the U.S. as a responsible custodian/enforcer of such rules.
Ragnarork
除了赔偿金判决外,拉科夫法官还发布了永久性的全球禁令。
显然,美国的法院和法官是有权这么做的。越多美国以外的第三方忽视这一点,情况就越好。
我并不反对关于通用规则的国际合作(我实际上是支持的),但目前的情况显然并未将美国认定为这些规则的负责任的管理者或执行者。
https://news.ycombinator.com/item?id=47774897
Fundamental in the dependency cooldown plan is the hope that other people - those who weren’t smart enough to configure a cooldown - serve as unpaid, inadvertent beta testers for newly released packages.
This is wrong to an extent.
This plan works by letting software supply chain companies find security issues in new releases. Many security companies have automated scanners for popular and less popular libraries, with manual triggers for those libraries which are not in the top N.
Their incentive is to be the first to publish a blog post about a cool new attack that they discovered and that their solution can prevent.
dominicq
依赖冷却计划的根本在于寄希望于其他人——那些没有足够聪明去配置冷却期的人——成为新发布软件包的无偿、无意的测试员。
这种想法在某种程度上是错误的。
这个计划的运作方式是让软件供应链公司发现新版本中的安全问题。许多安全公司都有针对流行和不太流行库的自动扫描工具,对于那些不在前N名的库,则由人工触发扫描。
他们的动力是抢先发布关于他们发现的新攻击及其解决方案能够防止该攻击的博客文章。
https://news.ycombinator.com/item?id=47769149
Anthropic is really good at releasing features that are almost the same but not exactly the same as other features they released the week before
Eldodi
Anthropic 非常擅长发布那些与他们前一周发布的功能几乎相同但又不完全相同的功能。
https://news.ycombinator.com/item?id=47763678
I guess the problem with Backblaze’s business model with respect to Backblaze Personal is that it is “unlimited”. They specifically exclude linux users because, well, we’re nerds, r/datahoarders exists, and we have different ideas about what “unlimited” means. [1]
This is another example in disguise of two people disagreeing about what “unlimited” means in the context of backup, even if they do claim to have “no restrictions on file type or size” [2].
[1] https://www.reddit.com/r/backblaze/comments/jsrqoz/personal_backup_linux/ [2] https://www.backblaze.com/cloud-backup/personal
azalemeth
我猜Backblaze在其个人版服务的商业模式上的问题在于它是“无限”的。他们专门排除了Linux用户,因为,嗯,我们是极客,r/datahoarders存在,而且我们对“无限”这个词的理解不同。[1]
这其实是另一个关于两个人在备份背景下对“无限”含义理解不同的例子,尽管他们确实声称“对文件类型或大小没有限制”[2]。
[1]
https://www.reddit.com/r/backblaze/comments/jsrqoz/personal_backup_linux/
[2]
https://www.backblaze.com/cloud-backup/personal
https://news.ycombinator.com/item?id=47773942
Extremely bad stuff here. Can’t believe it’s been 7 hours now and you can still pull up people’s complete prepared tax returns right from a Google search. This should be a business-ending breach of trust and good practices, but I worry there’s probably a lack of regulatory might or will to make anything happen.
evmaki
这里的情况非常糟糕。真不敢相信已经7个小时了,你依然可以通过谷歌搜索直接查到人们完整的已准备好的报税表。这本该是足以毁掉一家企业信任和良好操作的严重泄露,但我担心可能缺乏足够的监管力度或意愿来采取任何行动。
https://news.ycombinator.com/item?id=47763392
Exclusions are one thing, but I’ve had Backblaze fail to restore a file. I pay for unlimited history.
I contacted the support asking WTF, “oh the file got deleted at some point, sorry for that”, and they offered me 3 months of credits.
I do not trust my Backblaze backups anymore.
klausa
排除情况是一回事,但我曾遇到过 Backblaze 无法恢复文件的情况。我付费使用了无限历史版本。
我联系了客服,想搞清楚到底怎么回事,他们回复说“哦,文件在某个时候被删除了,抱歉”,然后给了我三个月的信用额度补偿。
我现在已经不再信任我的 Backblaze 备份了。
https://news.ycombinator.com/item?id=47770999
But no need to wait. At a high level, Gas City is the answer to all your problems. Ha! At least, for certain classes of problem, such as, “How can I bring AI into my company and pass an audit trail,”
The important audit at my company is conducted by the FDA.
I have a feeling when they ask what processes we followed to mitigate any user harm that could be caused by software changes that “I told an AI-mayor in the form of a cartoon fox what to do and he spit out a bunch of vibecode software written by AI-driven virtual cartoon characters” is not among the answers they want to hear.
bayarearefugee
但其实不需要等待。从高层来看,Gas City 是解决你所有问题的答案。哈哈!至少,对于某些类别的问题,比如“我如何将人工智能引入公司并通过审计追踪”,它是有效的。
我公司重要的审计是由FDA进行的。
我感觉当他们问我们采取了什么流程来减轻软件变更可能造成的用户伤害时,回答“我告诉了一个卡通狐狸形象的AI市长该做什么,然后他吐出了一堆由AI驱动的虚拟卡通角色编写的vibecode软件”这句话,不会是他们想听到的答案。