MoreRSS

site iconShawn Weekly | 肖恩技术周刊修改

包含“业界资讯”、“技术博客”、“开源项目”、“工具推荐”和“学习资源”等
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

Shawn Weekly | 肖恩技术周刊的 RSS 预览

肖恩技术周刊(第 80 期):AI编程的9条心得

2026-01-26 08:00:00

对周内阅读的技术内容精品(个人向)进行总结。觉得不错可点击上方订阅,第一时间获取更新通知。

本周时间主要用在折腾“AI结对编程实战:打造智能文章知识库全记录”上了,没啥新知识点分享,Copy一下文章中的9条心得充数一下吧:

  1. 定义专属的Agent(AI版专人专事),但不要手动优化提示词,通过描述诉求让AI生成和优化
  2. 结合Spec编程思路,在编程前制定清晰的计划
  3. 优先实现MVP版本,因为如果一次性实现所有功能,效果不一定好,验证的难度也很大
  4. 迭代开发时最好step by step,把工作分解成小的、迭代式的任务,不仅能让AI更聚焦,也方便自己验收结果
  5. 提供详尽的背景信息和指导(生成Agent.md、保留执行计划等),LLM的效果取决于上下文的丰富程度,在任务切换时AI也能更快掌握现状
  6. 考虑上下文使用50%以上时主动切换任务,避免AI因为上下文过长而遗忘信息,让其始终聚焦于解决核心问题
  7. 人在回路(Human in the loop),一定要核实、测试和审查所有内容
  8. 使用Git进行版本管理并经常提交代码,按小迭代推进(需求 -> 开发 -> 验证 -> 提交),方便不符合预期时回滚。并用AI生成git commit信息,能快速生成改动摘要,便于理解具体的改动点
  9. 相信AI,持续学习和适应新的编程模式

业界资讯

安克创新与飞书联合发布“安克 AI 录音豆” ,手指可握仅重10克

安克创新与飞书联合发布“安克 AI 录音豆”,一款仅重10克、直径23.2毫米的轻便AI硬件。其配备2个全指向性麦克风,收音半径5米,支持8小时连续录音,配合充电舱可达32小时。基于飞书AI能力,支持声纹识别、实时转写翻译、AI可视化总结及智能纪要生成,录音内容可沉淀为飞书知识资产,支持协同编辑与问答检索,采用AES-256加密技术保障安全,售价899元。

扣子 2.0,让 Agent 更进一步

扣子2.0版本正式上线,其核心技术更新主要集中在Agent Skills、Agent Plan和Agent Coding三个方面。Agent Skills封装了场景最佳实践与所需工具,例如营销文案写作Skill,包含成功文案框架、调研工具、写作技巧和质量检查,使AI能够写出具有销售力的文案。

Agent Plan支持用户设定长期目标,如运营自媒体账号,AI将自动规划执行路径、定期汇报进展,无需用户频繁提醒。Agent Coding则升级为一站式云端开发平台,支持通过连续对话构建智能体、工作流、网站和移动应用,并提供一键部署功能,满足专业开发者和小白用户的需求。

佳文共赏

拉尔夫・威根是如何从《辛普森一家》中的角色变成如今AI领域最知名的名字

Ralph Wiggum 是一个由 Geoffrey Huntley 开发的 Bash 脚本,后被 Anthropic 正式化为 Claude Code 的插件,用于提升 AI 自主编程性能。它通过将模型的输出(包括错误和幻觉)重新输入到下一次迭代中,形成“上下文压力锅”,迫使模型在失败中自我修正,直至找到解决方案。

这种方法分为社区版(原始 Bash 脚本)和官方版(Anthropic 插件),前者适合创意探索,后者更适合企业工作流,强调安全性和可靠性。Ralph Wiggum 在新项目和自动验证任务中表现出色,如一位开发者以极低的 API 成本完成了价值 50,000 美元的合同,还有在 Y Combinator 黑客马拉松中一夜生成 6 个代码库的案例。

其核心创新在于“Stop Hook”机制,通过拦截 AI 的退出尝试并验证“完成承诺”,若未满足则将失败反馈回系统,形成自我参照的反馈循环,推动 AI 进行下一次尝试。

技术博客

10 秒内获取 AI 代码审查

通过在 GitHub PR URL 后添加“.diff”,可快速获取 PR 的原始 diff 内容,将其粘贴到大型语言模型(LLM)中,即可获得即时代码审查反馈。此方法无需 Copilot Enterprise、浏览器扩展或特殊工具,能快速发现明显问题、获取边缘情况建议,使代码在正式审查前更整洁,缩短开发周期,是对人工代码审查的有力补充,但不能完全替代人工审查。

MCP 和 Skills 到底什么区别?一篇文章说清楚

MCP(模型上下文协议)和 Skills 是 AI Agent 领域的两种不同技术方案。MCP 类似于 USB 协议,定义了 AI 与外部工具的连接标准,通过标准化接口实现 AI 应用与多种工具的快速集成,显著降低开发成本。然而,MCP 存在上下文爆炸问题,连接多个工具时会大量消耗 AI 的上下文窗口,导致工具使用准确性下降。为解决此问题,Claude Code 推出 Tool Search 功能,按需加载工具定义,大幅减少上下文消耗。

Skills 则采用渐进式披露设计,将专业知识和工作流程封装成操作手册。它分为三层:元数据、完整指令和参考资料,按需加载,有效避免上下文浪费。Skills 还支持自带脚本,执行复杂任务时无需将脚本代码加载到上下文,仅返回执行结果,实现零上下文成本和确定性结果。这使得 Skills 在处理本地文件操作、数据处理等任务时效率更高。

MCP 和 Skills 各有适用场景。MCP 适用于连接远程 API、实时数据和对外服务,而 Skills 更适合本地流程、专业方法论和内部工具。未来,随着 Skills 生态成熟,MCP 的需求将减少,主要用于远程连接等核心场景。

一文读懂 Skills

Skills 是一种扩展 AI Agent 能力的机制,最早由 Anthropic 提出,现已成为多数 Agent 开发工具的标准规范。它通过文件夹形式封装任务所需的知识、流程、工具及最佳实践,类似“高级武功秘籍”,使 Agent 从通才变专家。Skill 运行在沙盒环境中,采用渐进式加载机制,分元数据、说明文档、资源与代码三层,按需加载,平衡效果与效率。Agent 使用 Skills 时,先匹配意图,再读取手册,按需执行并反馈结果。

好的 Skills 应具备原子性,坚持单一职责;通过具体例子让模型理解任务;明确角色、拆解步骤、设定限制;设计清晰的输入输出接口;并持续迭代优化。社区提供了丰富的 Skills 资源,如 Claude 官方仓库,用户可直接使用或二次开发以适应特定需求。

Skills 适用于流程明确的任务,不擅长高度创造性、实时决策或简单问答。它解决了 Agent 规则失效、执行失控等问题,通过动态加载机制和生态赋能,降低了使用门槛,使 AI 能高效、精准地完成任务,有望推动 AI 从通才向专家协作伙伴进化。

开源项目

x-algorithm:X推荐算法

X(原 Twitter)“为你推荐”订阅源的核心算法代码。

MemOS:AI存储层

MemOS 是一个为大型语言模型(LLM)和人工智能代理设计的内存操作系统,专注于长期记忆的存储、检索与管理。它提供统一的内存 API,支持文本、图像等多种模态数据,并通过内存立方体(MemCube)管理多个知识库,实现隔离、共享与动态组合。此外,MemOS 引入异步内存操作调度器 MemScheduler,确保高并发下的生产稳定性,并支持内存反馈与修正,以自然语言交互优化内存内容。

clawdbot:AI 助手

Clawdbot 是一款个人 AI 助手,支持多平台运行,包括 macOS、iOS、Android 等。它通过 WebSocket 控制平面集成多种通信渠道,如 WhatsApp、Telegram、Slack 等,可实现语音唤醒、实时对话等功能。

工具推荐

Ami:本地 AI 编程助手

Ami 是一款专为开发者设计的本地桌面级 AI 编程助手。它的核心作用是让用户能够直接在桌面端运行 AI 智能体(Agents),而无需打断现有的工作流。

MiniMax Agent

MiniMax推出的智能体。

扣子编程

扣子编程,提供了智能体、工作流、Skills等功能。

资源推荐

宝玉分享的 Claude Code 技能集

宝玉分享的 Claude Code 技能集,提升日常工作效率。

鱼皮的 AI 知识库

完全免费开放的 AI 知识共享平台。

肖恩技术周刊(第 79 期):AI结对编程

2026-01-19 08:00:00

对周内阅读的技术内容精品(个人向)进行总结。觉得不错可点击上方订阅,第一时间获取更新通知。

结对编程(Pair Programming)是一种两名开发者在同一台电脑前并肩作战的敏捷开发实践。它就像赛车中的车手与领航员:

一人负责驾驶(Driver),专注于键盘输入和具体的逻辑实现。

另一人负责领航(Navigator),在旁边观察代码,思考整体架构、捕捉细微错误,并预判潜在的风险。

这种模式的核心价值在于“实时代码审查”,不仅能显著减少 Bug 数量、提升代码质量,还能有效促进团队内部知识共享。

AI 结对编程(AI Pair Programming)则是将你的合作伙伴从一名同事换成 AI 编程助手。在传统模式中,两人是平等的思维碰撞,角色通常会定期互换。但在 AI 模式中,关系转变为开发者作为主导者,AI 作为执行者。简单对比如下:

| 维度 | 传统结对编程 (Human-Human) | AI 结对编程 (Human-AI) | |

肖恩技术周刊(第 78 期):Markup or Markdown!

2026-01-12 08:00:00

对周内阅读的技术内容精品(个人向)进行总结。觉得不错可点击上方订阅,第一时间获取更新通知。

在如今的 AI 时代,Markdown 已经从程序员的“私人工具”变成了全球通用的“沟通协议”。但鲜为人知的是,这个名字本身其实是一场充满黑色幽默的文字游戏,其诞生背景更带有理想主义色彩。

Markdown 的发明源于John Gruber和Aaron Swartz的合作。Gruber当时是知名科技博客Daring Fireball的作者,厌倦了HTML的冗长代码,希望为博客写作设计一种“人性化”的纯文本格式。

2004年,他与Swartz(Reddit联合创始人、RSS规范贡献者)联手,用Perl语言编写了首个Markdown脚本。两人的初衷极其单纯:“让文档在不被渲染的情况下也具备可读性”。他们希望即使用最原始的纯文本打开,Markdown 文档也应该像一封优雅的邮件,而不是一堆乱码。

Markdown 的名字则是一场精准的对位打击

在计算机领域,HTML 被称为 Markup Language(标记语言)。Gruber认为,既然 Markup 是用一堆繁琐的尖括号(如 <div>)把文字“围起来”,那么一种极简的、能让人一眼看穿意图的语言就应该叫 Markdown

这不仅是方向上的相反(Up vs Down),还双关了其在英文中的另一个含义:“降价/简化”。暗示着砍掉了 90% 的复杂功能,只给用户留下了最轻量、最纯粹的写作体验。

这种“以人为本”的哲学,在二十多年后的今天意外地契合了 AI 时代的需求——Prompt(提示词)。在 AI 眼中,Markdown 符号就像是某种“结构化路标”。比起一整块乱糟糟的文字,AI 对 #(标题)、-(列表)和 > (引用)极度敏感。这种层次感,能显著降低大模型的推理噪音。

从 20 年前对 HTML 复杂性的“调侃”,到今天成为人机协作的“底层语言”,Markdown 的名字不仅是一个好玩的文字游戏,更是一种“简约即正义”的技术胜利。

业界资讯

Gmail正式接入Gemini

Gmail 正式进入 Gemini 时代,借助 Gemini 3 的强大能力推出了一系列 AI 功能。提供AI Overviews 功能能够将长邮件对话智能压缩为关键点摘要,还支持用户以自然语言提问,快速从海量邮件中提取答案,如查找过去某年的特定信息。

写作辅助功能全面升级,Help Me Write 可帮助用户润色或从零开始撰写邮件,Suggested Replies 根据对话上下文提供精准的一键回复选项,Proofread 则提供高级语法、语气和风格检查。

AI Inbox 功能通过智能过滤,突出显示重要邮件和待办事项,基于用户行为和邮件内容智能识别 VIP 联系人,确保关键信息优先展示。

ChatGPT 健康重磅登场

OpenAI 推出 ChatGPT 健康功能,专为健康与保健领域设计。该功能在 ChatGPT 基础上增加多层保护机制,包括专用加密与隔离技术,确保健康数据私密性。用户可安全连接电子医疗记录和健康应用,如 Apple 健康、Function 和 MyFitnessPal,使对话更具相关性和实用性。

ChatGPT 健康由医生参与开发,提供清晰、实用的健康信息,通过 HealthBench 框架进行临床标准评估,确保回复质量。用户可导入健康信息,进行个性化对话,如解读检查结果、准备就诊问题清单等。

CES 2026 召开

CES 2026 (2026年国际消费电子展) 已于2026年1月6日至9日在美国拉斯维加斯成功举办,主题聚焦“Smarter AI for All”,展示了AI与机器人、智能家居、汽车技术等领域的深度融合,中国科技企业以高密度创新和具身智能、AI应用等方面的成果大放异彩,成为展会亮点,标志着AI从概念走向实际应用落地。

佳文共赏

为什么工程师不能理性地对待编程语言

企业在选择编程语言时,往往受身份认同和情感偏见驱动,而非理性的技术评估,这种不可见的对话常导致高昂的技术债务和商业失败。

作者通过自身经历揭示,工程师的脑部活动在面对核心身份挑战时会进入防御模式,使他们将个人的语言偏好伪装成逻辑严密的架构分析。为了规避这种由虚荣和傲慢引发的决策风险,领导者必须将讨论重点从技术优劣转向经济决策框架

该文旨在引导读者超越技术标签的束缚,通过量化长期经济影响来做出更科学的工程选择。

2025年末全球 AI 行业流量报告:狂热退潮,分化开始

分析了 2025 年末全球 AI 行业的流量走势,揭示了市场从盲目狂热转向理性分化的转折点。核心结论指出,以 ChatGPT 为代表的通用型产品流量显著下滑,标志着用户不再将其视为唯一入口,而是开始根据特定需求选择更专业的工具。

报告通过对比发现,谷歌 Gemini 等具备分发优势的巨头正在崛起,而仅靠简单包装的“套壳”应用则面临崩盘风险。

此外,文章强调了垂直领域工具的生命力,如 AI 音乐与视频在特定生产力场景下表现稳健,而缺乏落地能力的 AI Agent 概念仍处于挣扎阶段。

总体而言,这篇综述旨在提醒投资者与从业者,AI 行业的红利期已过,未来将进入以真实产品力和垂直应用为核心的残酷竞争时代。

智普2025:推动迈向通用人工智能之路

Z.ai 在 2025 年取得显著进展。技术层面,Z.ai 从早期的 GLM 架构起步,2020 年至 2021 年开始训练数十亿参数的基础模型,2022 年在 ACL 展示成果,2023 年发布的 ChatGLM 模型在 Hugging Face 上获得极高人气。2025 年,Z.ai 正式推出,发布 9B 和 32B 模型,奠定品牌基础。

产品方面,Z.ai 从侧项目起步,用户数曾大幅下降,但凭借 AI Slides 等特色功能和 GLM-4.5 的推出,用户活跃度回升并实现 100 倍增长,坚持极简、真实、突出能力和低门槛原则。商业上,GLM-4.5 推出前,api.z.ai 收入极低,GLM Coding Plan 的推出显著提升 API 使用量,为个人用户提供无限量 API 使用,降低使用门槛,未来将继续优化服务。

技术博客

软件领域,代码是文档。在AI领域,则是轨迹。

在传统软件中,代码是理解应用行为的核心,但在 AI 代理中,代码仅是框架,决策逻辑由模型在运行时完成。因此,应用行为的真实记录从代码转移到了追踪(traces)。追踪记录了代理的每一步操作,包括工具调用、推理过程、结果和时间。这改变了调试、测试、优化、监控、协作和理解产品使用的方式。如果在构建代理时缺乏良好的可观察性,就会错过系统实际行为的真实记录。

调试变为追踪分析,当用户报告问题时,需查看追踪而非代码,以找出推理错误。测试也转变为基于追踪的评估驱动,需要持续在生产环境中评估追踪,以捕捉质量下降和漂移。性能优化从代码分析转向追踪分析,寻找决策模式中的瓶颈,如不必要的工具调用和冗余推理。

监控从关注系统健康度转向关注决策质量,包括任务成功率、推理质量和工具使用效率。协作也转移到可观察性平台,因为逻辑在追踪中,而非代码中。产品分析与调试合并,因为用户行为与代理行为紧密相关,需要通过追踪来理解用户反馈。

动态上下文发现

Cursor 推出动态上下文发现技术,旨在优化代码 Agent 的上下文管理。通过将长工具响应转化为文件,Agent 可按需读取,避免上下文窗口膨胀。在摘要过程中,引入对话历史作为文件,提升摘要质量,帮助 Agent 恢复关键细节。

此外,支持 Agent Skills 开放标准,将技能定义为文件,Agent 可动态发现并引入相关技能。对于 MCP 工具,仅加载所需工具描述,减少上下文占用,显著降低 token 消耗。集成终端会话也被视为文件,Agent 可动态访问相关输出,提升问题排查效率。

这些改进基于文件的简单抽象,为编码 Agent 提供了高效、灵活的上下文管理方式。

认知重建:Speckit 用了三个月,我放弃了——走出工具很强但用不好的困境

文章探讨了 AI 编程工具在企业落地的困境及解决方案。作者尝试了规范驱动开发工具 Speckit 和 Openspec,发现它们在企业复杂场景下存在局限,如流程僵化、无法处理动态需求、知识不沉淀等问题。

为解决这些问题,作者提出 AI 工程化理念,核心是上下文工程和复合工程。通过上下文工程,AI 能自动获取完整信息,避免上下文缺失;复合工程则让每次实践降低下次成本,实现知识复利。基于此,设计了包含 Agent、Skill、Command 的工具架构,实现知识沉淀与复用,提升开发效率。

开源项目

obsidian-skills:Obsidian官方Skills

用于读写 Obsidian 的 Claude Skills。

oh-my-opencode:OpenCode增强插件

Oh My OpenCode是一个强大的OpenCode插件,通过提供一系列精心策划的工具和代理(agents),提升开发人员的工作效率。

MacOptimizer:Mac系统优化工具

MacOptimizer 是一款专为 macOS 设计的系统优化工具。

工具推荐

免费外语学习资源平台

LingoHut 是一个提供免费外语学习资源的平台,支持使用母语学习超过 45 种语言。平台提供 125 节免费课程,适合零基础学习者,专注于教授日常实用短句和词汇。

一站式Vibe Coding

AICodeMirror 是一个面向中国用户的 AI 编程助手平台,提供一站式编程服务。它支持多种顶级 AI 编程工具,如 Claude Code、Codex 和 Gemini CLI。

二次元AI绘图工具

niji・journey 是一款由 Spellbrush 和 Midjourney 联合开发的先进 AI 绘图工具,专注于创作定制化的动漫插画。

资源推荐

2026年掌握AI智能体的指南

为开发者提供了从零到部署AI代理的实战指南,涵盖8个阶段,旨在帮助读者在6至9个月内掌握构建真实世界AI代理的能力。

秘密知识之书

技术人员工具集,包含 CLI 工具、GUI 工具、Web 工具、系统服务、网络工具、容器编排、手册教程、灵感清单、博客视频、安全测试等内容。

肖恩技术周刊(第 77 期):稀缺特质

2026-01-05 08:00:00

对周内阅读的技术内容精品(个人向)进行总结。觉得不错可点击上方订阅,第一时间获取更新通知。

本周对2025年的周刊内容进行了深度总结。

梳理了Agent元年的三大要点,包含:技术底层的突破,从“对话”到“推理”;交互模式的变革,从“人找工具”到“工具找人”;商业落地的规模化,从“Demo”到“生产力”。

讨论了AI时代人类的稀缺特质,将向“人类本质”回归,弄清楚“人为何为人”可能是这个时代最重要的问题。

也将周刊的要点内容按季度进行了串讲,方便整体回顾。详细内容可点击阅读周刊25年总结:Agent元年,寻找人类最后的护城河

业界资讯

Manus 加入 Meta:加速企业人工智能创新

Meta 完成对通用人工智能代理 Manus 的收购,旨在利用其领先的技术来增强商业服务和用户体验。Meta 计划在保持其独立运行的同时,将其核心能力整合进旗下的社交与商业生态。

GLM-4.7:提升编码能力

GLM-4.7 的发布,在代码开发、逻辑推理及多模态展示方面均有重大飞跃的新一代大模型。通过引入交替思考与持久化思考机制,该模型能够有效处理复杂的长周期任务,并在多语言编程代理和终端模拟等极具挑战性的基准测试中展现出顶尖性能。

除了技术指标的提升,GLM-4.7 还特别强调了视觉美学与用户体验,不仅能生成现代化的网页界面,在幻灯片排版上也更加精致。

OpenAI面向开发者的2025总结

OpenAI 2025年终总结回顾了从单纯的提示词交互向生产级智能体(Agents)开发的重大转型。文中指出,核心进步在于推理能力与通用模型的整合,以及多模态功能(涵盖音视频及文档)成为API的标准化配置,极大降低了复杂任务的门槛。

并重点介绍了Codex编程生态的成熟、Agent-native API的推出,以及支持开发者进行自动化、评估与扩展的一系列底层构建工具。通过展示模型家族的演进与开放标准的建立,该资料旨在为开发者提供一套在真实业务场景中构建、运行并优化高性能AI系统的完整路线图。

佳文共赏

从大厂设计师到超级一人公司:6000字回顾我和AI的2025

2025 年 AI 领域关键技术突破显著,强化学习在工具使用与编程领域应用广泛,推动了 Vibe Coding 和 Agent 工具爆发,如 Claude Code 的人机融合工作方法极具创新性。多模态技术迎来爆发,从简单图像推理到视频、音频的深度理解和编排,如 Sora 2、VEO 3.1、Nano Banana Pro 和 Seedream 4.0 等模型在多模态输出和推理能力上显著提升,为 Agent 体系注入强大动力。

AI 产品方面,Chatwise 凭借整合多模型优势、工具加持与高效构建能力脱颖而出;Manus 在 Agent 交互领域迈出重要步伐,为行业带来启发;AI Studio 的 Build 模式展现了谷歌在 AI 模型整合方面的强大实力,几乎用 AI 模型替代后端。

展望 2026 年,强化学习领域应用将继续深化,Gemini 3 Pro 和 Flash 等模型有望带来更多突破。算力中心构建将推动更大更强模型诞生,多模态领域中视频架构迭代和更新备受期待,Vibe Coding 有望迎来 DeepSeek 时刻。Agent 产品将在垂直领域发力,工具调用能力、上下文管理技术等突破可期,行业整体发展值得持续关注。

LLM 2025 总结

开发者 Simon Willison 对 2025 年大型语言模型(LLM)行业的年度总结,其核心结构围绕着推理能力智能体以及编程范式的演变展开。

作者详细记录了 Anthropic 和 Google 如何通过 Claude Code 与 Nano Banana 等创新产品打破 OpenAI 的领先地位,并探讨了中资实验室开源模型对全球技术格局的冲击。文中还深入剖析了由 vibe coding 驱动的个人开发效率革命,同时也对提示词注入(即“致命三元组”)和 AI 数据中心带来的环境挑战等安全与伦理风险表达了忧虑。

总而言之,该文通过一系列生动的行业术语和个人实验,呈现了 AI 从纯文本交互迈向异步执行任务多模态自主协作的转型之年。

微软CEO展望 2026 年

微软CEO展望了2026年人工智能的发展,指出行业正从单纯的技术发现转向广泛的普及应用阶段。他认为,我们应将AI视为增强人类潜能的认知扩音器而非替代品,并强调通过构建更复杂的系统架构来弥合模型能力与实际价值之间的差距。

文中呼吁在资源分配上做出审慎选择,以确保技术进步能转化为解决现实挑战的社会影响力。最终这种转变的核心目标是回归计算技术的初衷,即通过赋能个体来实现更深远的人类价值

技术博客

Claude Code 之父 Boris 的 9 条实战技巧

Claude Code 之父 Boris Cherny 在日常开发中使用的实战技巧,强调了回归本质、注重效率的工程哲学。

高效使用 AI 的核心不在于复杂的个性化配置,而在于构建多任务并行的工作流,并坚持选用逻辑更缜密但速度较慢的 Opus 模型以减少纠错成本。并重点介绍了几种提升团队协作质量的手段,例如利用 CLAUDE.md 文件沉淀项目记忆,以及通过 Plan 模式落实“先设计后编码”的经典智慧。

此外,Boris 认为提升 AI 产出质量的关键在于赋予 AI 自我验证的能力,将自动化测试与反馈闭环融入开发流程。总体而言,本文旨在引导开发者告别盲目的“调优”,转而通过标准化工具链与自动化习惯来实现与 AI 的高效协同。

Manus 谈 AI Agent 之道:做对一千件小事,比做对三件大事更重要

通过对 Manus 创始人季逸超的访谈,探讨了 “智能主导” 而非“规则主导”的 AI Agent 设计哲学,强调了在构建智能体时,“做对一千件小事” 的工程积累远比追求少数宏大架构更具竞争优势。

Manus 选择不预设固定工作流,而是利用模型的通用学习能力,在面对缺乏 API 的复杂网页环境时实现 “优雅降级”,展现出极高的灵活性与环境适应力。这种路线的门槛并非源于不可逾越的技术壁垒,而在于对 上下文工程 和无数交互细节的极致打磨,使系统能随着大模型能力的进化而不断突破天花板。

全文旨在揭示 AI 应用层竞争的核心:通过解决成百上千个微小的工程痛点,最终叠加成 无法被轻易复制的产品壁垒

AI 时代,我的知识管理系统

文章从知识管理的必要性出发,强调了在 AI 时代,知识管理依然是个人知识体系构建的重要环节。作者介绍了其知识管理系统,涵盖信息捕捉、处理、存储及应用全流程。

在信息捕捉环节,强调主动获取信息的重要性,推荐使用搜索引擎、RSS 订阅等工具,并指出 AI 问答作为一种新兴的信息获取方式,能快速提供答案。

在信息处理方面,提出必要难度理论,结合 AI 辅助的渐进式阅读法,通过划线批注、向 AI 提问等方式,将信息转化为知识。

知识存储方面,介绍了 Zettelkasten 原子笔记法,强调知识卡片的独立性和链接性,并结合 AI Agent 实现知识库的智能管理,如自动写日报、智能检索等功能。

最后,在知识应用环节,强调知识的价值在于实践和创作,通过 Analogy 等工具,将知识库中的知识自然地融入工作和生活中,以实现知识的复利效应。

开源项目

Antigravity-Manager:AI接口反代

Antigravity-Manager 是一款基于 Rust 与 React 构建的专业级账号管理与协议中转工具,旨在为开发者和 AI 爱好者提供一键式的账号切换与 API 反代服务。该项目的核心价值在于其强大的协议适配能力,能够将复杂的 Web 端会话转换为标准的 OpenAI、Anthropic 或 Gemini 接口格式,从而消除不同 AI 模型间的调用壁垒。

memos:自托管笔记管理

Memos 是一款开源、自托管的笔记服务。其隐私架构确保数据完全由用户控制,无追踪、无广告、无订阅费用。用户可自由导出数据,避免供应商锁定。Memos 还具备简洁美观的界面,支持暗黑模式和移动响应式布局,适合个人笔记、团队维基和知识管理。

Mole:macOS 系统清理与优化工具

Mole 是一款开源的 macOS 系统清理与优化工具,整合了 CleanMyMac、AppCleaner、DaisyDisk 和 iStat 等工具的功能。其核心功能包括深度清理系统缓存、日志和浏览器残留文件以释放磁盘空间;智能卸载应用及其关联的启动代理、偏好设置和隐藏残留文件;提供磁盘使用情况可视化,管理大文件,重建缓存并刷新系统服务;实时监控 CPU、GPU、内存、磁盘和网络状态,帮助诊断性能问题。

工具推荐

Claude Code 子代理和MCP资源

精心挑选的Claude Code子代理提示词和 MCP 服务器合集。

AnyGen:字节出品类NoteBookLM工具

AnyGen 提供一站式 AI 协同编辑工具,支持文档、幻灯片、数据分析等功能。其 AI 幻灯片可高质量生成并精修内容,无需导出切换工具,具备扩展内容、强调重点、调整措辞等能力,实现精准局部更新,避免全篇重写。

资源推荐

Agent设计模式

《Agentic Design Patterns》中文翻译。

Claude Code模版

提供 100 多个 AI 代理、自定义命令、设置、钩子、外部集成(MCPs)和项目模板,以增强开发工作流。

Vibe Coding 指南

Vibe Coding中文指南。

2025年总结:Agent元年,寻找人类最后的护城河

2025-12-31 08:00:00

2025年结束了,周刊又坚持了一年,可喜可贺。

今年被称作Agent元年,是AI从“只会聊天的对话框”进化为“能够代劳的打工人”的关键转折点。对于这个称呼,行内人感叹星汉灿烂,行外人则是雾里看花。身在其中的我切实感受到AI的变化和影响,至少在编程智能体这个领域,AI已经带来了深刻的变革。那么到底有哪些关键性突破呢:

技术底层的突破:从“对话”到“推理”。以Reasoning Models(推理模型)为核心的技术路线成熟,模型具备了慢思考能力,学会在回答前进行自我检查、多步规划和逻辑推演。Agent能够将一个复杂目标(如“帮我策划一场去日本的旅行并预订所有门票”)拆解成几十个子任务,并具备出错后自动修正的能力。

交互模式的变革:从“人找工具”到“工具找人”。Agent开始接管工具操作权,具备了直接操作屏幕、点击按钮和填写表格的能力。模型上下文协议(MCP)解决了智能体与外部工具安全、高效交互的核心问题。AI不再是一个APP,而是长在操作系统里。Android、iOS和Windows全面转向“AI优先”,Agent成为了调用各种底层功能的接口。

商业落地的规模化:从“Demo”到“生产力”。各大公司开始将AI引入到实际业务中,部署多个专业Agent(如财务Agent、HR Agent、代码Agent)组成的“虚拟团队”,通过Cross-Agent(A2A)通信协议,多个智能体能够有效连接与协作。

很多关键标志性事件,也都在印证这个趋势:

  • OpenAI在年初推出的o3及后续的o4-mini,首次将“思考链(CoT)”技术标准化
  • DeepSeek-R1开源发布,颠覆全球大模型竞争格局,激发Agent开发热潮
  • 创业公司Manus(通用型AI Agent)一夜爆红,被媒体称为AI Agent的“iPhone时刻”
  • OpenAI发布AGENTS.md标准,被数万个开源项目采用,推动Agent行为一致性
  • Vibe Coding(氛围编程)开始流行,人们开始尝试“口喷”代码,技术壁垒被打破
  • 大模型密集升级潮 xAI Grok 4.1、Google Gemini 3、Anthropic Claude Opus 4.5、OpenAI GPT-5.2相继发布,显著提升Agent的推理、工具调用和自主执行能力
  • 豆包手机”将AI深度集成进硬件,Agent成为了操作系统(OS)的一层,用户只需说话,就能在后台调用各个应用完成操作

...

但技术狂欢的背后,我更多的开始思考人类的价值,我们到底还有哪些稀缺特质是无法(或者最后)被取代的。为了弄明白这个问题,我咨询了一下AI(笑),它的回答是:

  • 真实性与信任
  • 情感与人际能力
  • 伦理与治理能力
  • 物理技能
  • 深度创造力与原创性
  • 审美与品味
  • 判断力和洞察力
  • 哲学思辨能力
  • 责任与社会贡献
  • 隐私与数据主权
  • 生态与自然资源
  • 元认知与学习能力

我很认同,并点了一个踩,不愿承认AI比我更懂人类。

但不可否认,我们在AI时代的稀缺性将向“人类本质”回归,弄清楚“人为何为人”可能是这个时代最重要的问题。完美的答案可能还需要时间来思索,但如果让现在的我来回答这个问题,我会说:

独特的品味,真实的活人感和小圈子的归属感是人之根本。

年度回顾

将周刊内容按照时间线进行串联总结:

第一季度:许可证之争、国产AI爆火与智能体的萌芽

年初,数据库领域率先燃起战火,Redis和Elasticsearch的许可证变动引发了社区关于开源商业模式的剧烈讨论。紧接着,NVIDIA在CES 2025上发布的RTX 50系列及Blackwell架构,预示着个人PC向AI超级计算机转型的开始。

  • 社会热度: 1月,美国对TikTok的“不卖就禁”法案导致大量“TikTok难民”涌入小红书,引发了关于跨文化社区管理的讨论。
  • 国产之光: 春节期间,DeepSeek (R1) 凭借极高的性价比和开源精神震惊全球,甚至引发了美国监管层对技术出口管制的担忧。
  • 技术趋势: OpenAI推出的L3级智能体Operator和华为宇树机器人在春晚的亮相,标志着AI开始从“对话框”走向“实际操作”和“物理世界”。

第二季度:氛围编程、全球化架构与数学突破

随着AI工具的普及,开发者群体中兴起了一种名为“氛围编程(Vibe Coding)”的新范式,强调通过AI辅助快速实现功能而非深究细节,这在降低门槛的同时也引发了对技能退化的担忧。

  • 社会热度: 北京大学校友王虹在三维空间中证明了困扰数学界百年的挂谷猜想,成为科学界的年度盛事。
  • 技术深度: Model Context Protocol (MCP) 协议的发布解决了AI模型与外部系统集成的痛点,成为AI应用层开发的关键标准。
  • 企业动态: 支付宝由于测试“国补”功能误部署导致系统Bug,让社会再次关注到高并发支付系统的稳定性挑战。

第三季度:推理模型乱斗、AI垃圾反思与硬件革新

进入年中,AI的竞争进入了“深水区”。Qwen 3(通义千问)系列的发布让国产模型在编程和逻辑推理上达到了全球领先水平。同时,Google的Gemini 2.5/3系列通过图像生成与实时推理能力,开始尝试平替传统专业软件如PS。

  • 社会热度: 互联网开始反思“Slop(AI生成的低质量垃圾内容)”现象,研究表明过度接触此类数据甚至会导致模型产生“脑损伤”般的认知衰退。
  • 行业变革: GitHub CEO Thomas Dohmke的离职,标志着GitHub将更紧密地整合进微软的AI战略版图。
  • 生活方式: 周刊通过“新公园文化”和“外卖员生活体验”等记录,反映了在技术高速发展下,普通人寻找精神慰藉与生活实感的努力。

第四季度:Faker六冠、白银狂潮与AGI的终极赛跑

年末,技术与现实社会的碰撞达到了高潮。AI模型通过强化学习(RL)和链式思考(CoT)实现了智能形态的重塑,GPT-5.2、Claude 4.5以及DeepSeek V3.2的相继发布,将“长时推理”推向了极致。

  • 社会热度: Faker获得职业生涯第六冠,被誉为“最高的山、最长的河”,引发了全网关于坚持与巅峰的讨论。同时,白银价格的暴涨严重冲击了光伏和电动车等高科技制造业的供应链成本。
  • 程序员节: 1024程序员节期间,关于“程序员身份认同”的讨论升温,大家在拥抱AI驱动开发的同时,也在反思如何保留“纯粹工程”的艺术性。
  • 年度人物: 《时代》杂志将年度人物授予AI构建者们,比喻他们如同当年修建摩天大楼的工人,正坐在钢梁上俯瞰并重塑人类的未来。

⭐️ 更多细节可阅读往期:肖恩技术周刊

数据分析

2025年1月1日- 12月31日共发表了46期周刊,累计117,458字(vuepress字数统计),各类内容共592条,公众号累计阅读8410人次。

阅读趋势

52-55期题材应该命中了流量池,阅读量高很多。除去这几期外整体趋势比较平稳,已有30+左右的稳定读者啦,谢谢你们的喜欢。

信息源

周刊信息源持续扩充中,已包含130+ RSS订阅源,主要覆盖了:

  • 技术前沿资讯
  • 知名开发者技术博客
  • 国内大厂技术团队公众号(美团、阿里、腾讯、字节等)
  • 国外技术公司工程博客

内容分析

内容共592条,类型占比:

今年主题覆盖情况(TOP100关键词):

来年规划

第一是增加“活人感”。正如前文所述,在AI时代,“活人感”是最重要的稀缺特质之一。这一点其实在24年总结中已经注意到,但今年碍于精力实在有限,未能做到有效改善。来年继续去AI味,尝试更人性化的开篇内容,并在摘要后增加个人见解。

第二是优化信息源。丰富的信息源是周刊质量的保障,今年增加了不少,达到了134个。但只求量不行,更需要质。来年在持续收集的过程中也会对现有信息源进行整理,剔除低质部分。

第三是流程自动化。周刊的产出流程为:信息收集 → 阅读 → 留存 → 撰写。理想状态应该是只聚焦于阅读、标注是否喜欢、想法等,工具基于交互自动生成周刊。

信息收集基本实现了自动化,通过自部署FreshRSS + 定时任务实现RSS源的定时拉取,再通过网页端或手机应用Readrops实现随时随地碎片阅读,更多细节见:碎片时间刷文章!懒人阅读方案分享

阅读是目前耗时最多的阶段,虽有AI工具辅助,但整体效率仍不高。有考虑搞一个AI初筛工具,但实际上一天收集的内容数量并不多(大概百来篇),且一篇文章多数情况看了标题和第一段就能确定是否对味,因此筛选并不是核心痛点。效率低的根本原因应该还是阅读本身,被英语水平和阅读效率所拖累(从小就阅读慢😭),来年再研究研究有没有提效思路。

留存目前使用flomo,撰写是kimi + Obsidian + doocs/md。理论上这两步可以做到全自动化。

调查问卷

闭门造车当然是不行的,最后还是例行问卷收集环节,虽然召回率很低,但不能没有!

问卷调查

肖恩技术周刊(第 76 期):疯狂的白银

2025-12-29 08:00:00

对周内阅读的技术内容精品(个人向)进行总结。觉得不错可点击上方订阅,第一时间获取更新通知。

2025年12月,白银市场经历了史诗级的暴涨。现货白银(London Silver)价格冲破每盎司 79美元 关口,年内涨幅超 170%,其波动性和上涨斜率已远超黄金。

近期关于白银投机的话题很热,原因是场内溢价居高不下,可以进行套利(具体方式可问AI)。溢价(Premium)是指投资产品的交易价格高于其内在价值(净值)的现象。在此轮行情中,国内唯一的白银期货公募基金(国投白银LOF)溢价率一度突破 60%-70%。这意味着场内交易者愿意多花六七成的溢价去抢购该基金,本质上是在博弈更疯狂的涨势,而非进行资产配置。

马斯克(Elon Musk)近期在社交平台 X 上对此明确表示:“这不是什么好事。许多工业生产都需要白银。”马斯克的担忧不仅在于特斯拉的造车成本,更在于其 “宏图计划”(Master Plan 3) 的核心——可持续能源转型。

光伏(PV)板块的影响:白银是光伏电池正银/背银浆料(用于收集电流)的核心原材料。在之前的成本构成中,硅料是最大的开支,但随着银价翻倍,银浆已跃升为光伏组件中占比最大的单一原材料成本

电动车(EV)板块的影响:电动车对白银的需求远高于传统内燃机汽车。白银具有极佳的导电性,被广泛应用于电驱动系统、车载电子设备(如传感器、显示屏)以及充电桩的连接器中。每一台纯电动汽车大约需要使用 25-50克 白银。

还有其他板块如AI 算力与基础设施半导体与消费电子通信与 5G 基础设施医疗器械也会受到不小的冲击。

业界资讯

MiniMax M2.1: 大幅提升多语言编程,为真实世界复杂任务而生

MiniMax M2.1 是一款多语言编程 AI 模型,支持 Rust、Java、Golang 等多种语言,覆盖从底层系统到应用层开发。它在 Web 和 App 开发场景中表现出色,能构建复杂交互和高质量可视化表达。此外,M2.1 在办公场景中的可用性显著提升,可高效处理复合指令约束任务。

性能方面,M2.1 回复简洁,响应速度和资源利用效率显著提升。它在多种编程工具和框架中表现稳定,支持多种 Context Management 机制。模型还具备自主调用工具完成任务的能力,可实现办公自动化。

MiniMax M2.1 提供了两个版本的 API,分别是M2.1和M2.1-lightning,后者速度更快,适合对TPS有需求的用户。同时,M2.1全面支持自动Cache,无需设置,自动生效,为开发者带来更流畅的体验、更低的成本与更优的延时表现。

全球首款无需遥控的智能机器狗:维他动力“大头 BoBo”发布

维他动力发布全球首款无需遥控的智能机器狗“大头 BoBo”。该机器狗采用自研关节电机,具备强大负重与拖拽能力,续航 5 小时,配备一体化电池仓设计。

在空间智能方面,搭载多种传感器与全场景空间基座模型,支持语音交互与自主避障。 产品还配备全能拓展背板,支持多种接口,满足不同使用需求。

佳文共赏

唐杰THU关于AI的感悟

深入探讨了大模型技术的核心演进方向与未来行业格局。指出提升模型效能的关键在于持续规模化基础模型,并通过长尾场景对齐强化推理能力来增强实际体验。智能体(Agent)化记忆机制被视为AI迈入真实世界的里程碑,使模型从单纯的知识积累转向真正的生产力工具

未来,AI的发展将聚焦于自我评估与在线学习,通过端到端的技术整合逐步替代人类特定工种。此外,作者认为领域大模型仅是过渡产物,而多模态与具身智能的突破则依赖于更庞大的数据积累与硬件稳定性。

总而言之,AI的应用本质并非创造新软件,而是通过模拟或辅助人类工作来创造实质价值。

钢铁、蒸汽机与无限大脑

文章探讨了人工智能革命对个人、组织及社会形态的深刻重塑,强调我们必须摆脱“后视镜思维”,即停止用旧时代的逻辑来束缚新技术。

作者通过钢铁与蒸汽机的历史类比,指出程序员已率先从“骑自行车”转向“开汽车”,即从亲历亲为转变为管理无限大脑的指挥官。在组织层面,AI 扮演着支撑信息流的“钢铁架构”,能打破传统沟通成本的瓶颈,促使企业从低效的传统模式向高敏捷性进化。

未来,知识经济将从“人类尺度”的小型城市演变为如同东京般的巨型智能网络,实现全天候、大规模的自动化协作。真正的变革不在于用 AI 优化现有工具,而在于彻底重构工作流程,释放无限心智作为基础设施的潜能。

充满氛围的一年

程序员 Armin Ronacher 对其 2025 年工作与生活的深度总结。他详细描述了自己从传统手动编程向代理式编程(Agentic Coding)的重大转变,并分享了使用 Claude Code 等 AI 工具作为虚拟助手的实践经验。

作者探讨了 AI 带来的心理冲击,包括人机之间产生的“准社会关系”以及对“智能体”定义的哲学思考。文中还指出了当前版本控制代码审查工具在 AI 时代面临的局限性,呼吁技术架构进行相应革新。最后,他反思了 AI 生成内容的质量问题,并强调在拥抱自动化的同时应保持人类的责任感与技术水准。

年度总结

2025 AI编程总结

通过深入的行业数据,全面揭示了人工智能如何重塑软件开发生态

报告指出,AI工具已成为开发者的效能倍增器,显著提升了代码产出量并增加了拉取请求(PR)的规模与密度,同时详细分析了 Anthropic 与 OpenAI 在模型性能、响应速度及成本效率上的激烈竞争。

除了市场工具的普及趋势,文章还汇编了关于混合专家模型(MoE)、长文本处理与强化学习搜索的前沿研究,旨在探讨如何通过算法优化解决上下文管理和智能体推理的瓶颈。

整体而言,该报告不仅记录了编程工具链的快速更迭,更旨在引导工程团队在日益自动化的开发流程中,通过技术创新实现更高效的逻辑推理与系统构建

Stack Overflow 2025 年开发者调查

报告汇总了来自177个国家数万名从业者的反馈,全面剖析全球软件开发现状。

文本揭示了技术生态的深刻变革,特别强调了AI工具的普及与矛盾:尽管超过八成的开发者已将AI纳入流程,但普遍存在对AI生成内容准确性的质疑以及对“似是而非”代码的调试挫败感。此外,报告还追踪了工具偏好的演变,指出 Python 和 Rust 的生态系统(如 Cargo 和 uv) 正受到狂热追捧,而远程办公与工作满意度之间的正向联系也愈发凸显。

通过对开发角色、学习路径及社区参与度的多维度分析,该报告不仅勾勒出当前的技术趋势,更反映了开发者在追求效率的同时,对信息安全与知识真实性的核心关切。

Cloudflare 2025 年回顾

详尽分析了全球互联网流量的动态演变,揭示了网络连接在现代社会各领域的深远影响。

深入探讨了生成式人工智能的爆发式增长及其对网络爬虫流量的重塑,还重点关注了网络安全趋势,涵盖了后量子加密技术、超大规模 DDoS 攻击以及电子邮件威胁的最新演变。

通过对 SpaceX Starlink 卫星互联网普及率、移动端与桌面端占比以及新兴协议采纳情况的统计,系统地描绘了全球数字基础设施的连接质量与技术整合现状。

通过 Cloudflare 全球网络的宏观数据,为读者提供一个观察互联网行业竞争态势与防御机制的权威视角。

谷歌年度回顾:2025 年 8 个研究突破领域

回顾详述了谷歌在人工智能领域实现从辅助工具向通用实用程序跨越的里程碑。

全文围绕Gemini 3系列模型的科研突破展开,重点介绍了其在复杂推理、多模态理解以及赋能科学探索方面的卓越表现。通过涵盖医疗基因组学、量子计算、气候预测和创意协作等八大板块,文章展示了谷歌如何将前沿技术转化为提升生产力与应对全球挑战的具体应用。

最终,该报告强调了在追求技术极限的同时,必须秉持负责任的开发态度,通过跨行业协作确保人工智能的安全性与社会共益。

开源项目

blog-post-workflow:博客列表自动刷新

自动从 RSS 源更新项目 README 文件中的博客列表,以实现Github主页自动刷新。

Green-Wall:生成Github回顾

Green-Wall 可用于生成 GitHub 贡献图和 AI 驱动的年度报告。

MrRSS:AI RSS 阅读器

一个现代化、跨平台且免费的 AI RSS 阅读器.

stray_avatar:潦草头像馆

随机生成多种风格的头像图片,让你的头像不再“撞衫”。(@xingxingc投稿)

工具推荐

Storyset:免费可定制插画

Storyset 提供免费可定制插画,支持 Figma 插件,可在线编辑颜色、背景与图层,适配多种项目需求。其动画功能可将静态插画转化为动态效果,提升视觉吸引力。

朱雀AI检测助手

腾讯朱雀AI文本检测基于多种先进的人工智能模型,构造数百万级别的数据进行训练,能够识别出人类和AI的书写模式。该系统不仅具备优秀的英文检测能力,在处理中文数据方面表现尤为出色。

客群采集

免费的商户采集工具,配套:打电话、加入通讯录、定位、导航和导出分享等功能,适合实体业务方向使用。(@xingxingc投稿)

猫头鹰:智能网页订阅

猫头鹰智能网页订阅系统基于AI技术,实现了网页变化的智能监测与精准推送。系统采用先进的语义理解和智能降噪算法,能够自动过滤无关信息,仅推送用户关心的内容变化,如价格波动、库存更新、内容发布等。其多平台通知系统支持短信、邮件和Webhook等多种方式,确保用户实时接收重要信息。(@jufeng-2022投稿)

资源推荐

《电脑爱好者》停刊落幕!全套杂志 PDF 电子版 30 年合集打包下载

期刊资源合集。

图解 Transformer

结合图片学习Transformer。

性能提示

聚焦于性能优化,提供了通用原则和具体技术。