X 简报 · 2026-04-24 · 张腾甘的每日简报

🤖 AI/ML

@xiaohu：开源版 Workspace Agent 今天冒头，亮点不是又一个 agent 壳子，而是把多模型接入、独立 Docker 沙箱和用户级凭证隔离打包好了，企业真要落地自托管智能体终于有了更像样的基础设施方案。🔗 链接

@op7418：DeepSeek V4 正式发布后第一波实测就暴露出一个关键信号——官方宣称很强的 Agent/Skill 能力在复杂 Skill 场景里还不稳定，说明“会跑 benchmark”和“真能接工作流”之间还有验证差距。🔗 链接

@simonw：Simon Willison 认为 DeepSeek V4 真正值得盯的不是参数，而是 Flash 和 Pro 都把价格打到各自档位最低，这会直接把高质量模型的试错门槛继续往下砍。🔗 链接

@SakanaAILabs：Sakana AI 把内部多模型编排系统 Fugu 做成了商业 API，卖点不是单模型更强，而是按任务动态拼 agent 角色，说明“模型编排层”正在从研究概念变成独立产品线。🔗 链接

@gdb：Codex 上线原生 auto-review，用 guardian agent 先审动作安全再决定是否要人类批准，这意味着 coding agent 的可用性开始从“会写代码”转向“能不能少打断人”。🔗 链接

@Miles_Brundage：Miles Brundage 试用 GPT-5.5 后指出一个很实的产品问题——高强度 test-time compute 选项回得太快，用户明明选择了“多花时间换更高质量”，结果却拿不到对应的 effort 感。🔗 链接

@petergyang：Peter Yang 用 GPT-5.5 + Codex 一次性做出了可玩的 F-Zero 风格游戏，说明这代组合在“多步骤实现一个完整小作品”上确实跨过了不少过去会中途掉链子的坎。🔗 链接

@yihui_indie：Yihui 直接用 Codex Compute Use 完成英国公司报税，价值不在“AI 会填表”，而在它终于开始吃掉那类高繁琐、强流程、长期被人类拖延的真实办公室工作。🔗 链接

@indigox：indigo 拆解 Palantir 的 FDE 模式，点出了 AI 落地的核心不是把模型卖给客户，而是先派能写代码的人到现场把模糊业务问题翻译成可复用工作流。🔗 链接

@yongfook：Jon Yongfook 提醒“AI 一键做应用”仍是幻觉，因为真正的产品复杂度藏在多年补过的边角案例里，这盆冷水对最近的 agent 狂热反而很有价值。🔗 链接

@levie：Aaron Levie 提出一个值得记的反直觉判断——AI 暂时不会让人少工作，反而会让更多以前懒得做的项目变得值得启动，于是总工作量先膨胀而不是收缩。🔗 链接

💻 Tech

@op7418：歸藏把 10 年设计经验压进一个可开源的 PPT Skill，重点不只是“又一个模板库”，而是把 AI 出稿流程前置成带约束的采访、节奏规划和统一审美，明显比“随便生成几页 PPT”高了一个产品层级。🔗 链接

@FinanceYF5：StephNass 做的 OpenMap 把旧金山风投机构做成了“投资人地图”，它有意思的地方在于把原本靠人脉和记忆检索的融资信息第一次变成了可视化探索界面。🔗 链接

🌐 其他热点

@RobinSeun：一条关于加班猝死认定争议的评论在今天扩散得很快，它之所以扎心，是因为把职场里最荒诞的一面说透了——公司既享受深夜劳动成果，也可能在出事后用“已过下班时间”切割责任。🔗 链接

📊 扫描 263 条 | 覆盖 23.9h | 精选 14 条