2026-02-01 18:00:00
1. AI IDE 引起的量变 AI 生成了大量代码引入工程。AI IDE 实在太好用,从之前的命名补全,到函数实现的生成,再到现在整个功能代码的交付。甚至你不需要会写代码,通过聊天对话,也能完成很多的软件迭代任务,代码交付从未如此简单。 激进的团队已经拥抱 AI IDE。全
2026-01-29 08:00:00
1. MCP 是什么 MCP 是 Model Context Protocol 的缩写,是一个用于在模型和应用程序之间传递上下文的协议。 MCP 最大的价值是,在模型大战快结束,AI 应用爆发前夕,让开发者们对模型之外的能力调用有了统一的标准。如果模型、服务商各自定制一套协议,应用开发者们将面临巨大的学习成本
2026-01-17 08:00:00
PD 分离部署场景下,经常会采用异构型号的显卡,跨机进行部署模型,这会导致跨机通信压力倍增。通常会借助 RDMA 设备加速 kvcache 在不同节点之间的传输,以获得更低的 FTTL。本篇将介绍如何测试 eRDMA 设备,并部署 PD 分离应用。 1. 驱动 1.1 安装驱动 安装驱动 1 2 3 4 5 6 apt-get update -y
2026-01-14 18:00:00
1. 为什么是运维事件 更小的入侵性 Metrics、Log 维度的观测数据,运维团队通常都有所沉淀。运维事件可以是一个新的切入点,在不影响现有系统稳定性的情况下,引入新的运维能力。 更适合自动化 Metrics 表征的是系统状态,Log 表征的是具体代码行为,而 Event 表征
2025-12-21 08:00:00
1. 链式提示系统(Prompt chaining) 提示链将任务分解为一系列步骤,其中每个 LLM 调用都会处理前一个步骤的输出。 2. 路由系统(Routing) 路由会对输入进行分类,并将其定向到专门的后续任务。 3. 并行化系统(Parallelization)
2025-11-29 08:00:00
1. 处理确定故障 对于有具体处理方式的故障,直接使用 Agent 处理,发通知周知即可。 类似的自动处理,我们有应用层的异常负载删除、节点层的磁盘清理、GPU 掉卡屏蔽卡、屏蔽节点等。先找出团队中遇到得最多、需要最多人力的事情,对其进行自动化处理。你可以认为,