X 简报 · 2026-05-12 · 张腾甘的每日简报

🤖 AI/ML

@op7418：前 OpenAI CTO Mira Murati 的 Thinking Machines 展示“交互模型”路线，把音频、视频、文本、实时打断和后台推理放进同一套交互范式里，值得关注的是 Agent 正从脚手架走向原生模型能力。🔗 链接
@sama：OpenAI 发布 Daybreak，试图把 GPT-5.5 和 Codex 组合成持续扫描代码库、发现漏洞、生成补丁的 AI 安全团队，说明网络安全正在成为 Agent 落地的高价值场景。🔗 链接
@emollick：Ethan Mollick 提醒 gpt-realtime-2 是原生处理语音而不是先转写的更强 voice model，但旧实时语音提示词需要重写，说明语音模型升级会直接改写产品工程假设。🔗 链接
@SakanaAILabs：Sakana AI 的 KAME 用快速语音模型即时回应、后台 LLM 并行注入深层知识，给“更像活人”的对话 AI 提供了一个低延迟与高智能拆层的新方案。🔗 链接
@indigox：a16z 关于持续学习的文章被总结为“上下文学习只是短暂记忆，真正进化需要压缩”，核心看点是 RAG、LoRA/Adapter、权重更新会在长期 Agent 系统里分层共存。🔗 链接
@YiMaTweets：马毅指出 AI/ML 每年上万篇论文已像“怪物扩散过程”，学术界应承担降噪器而非继续增熵的角色，这句话精准戳中了当前 AI 研究的信噪比问题。🔗 链接
@_akhaliq：Soohak 发布，定位为数学家策划的研究级数学能力评测基准，值得留意的是 LLM 数学评估正在从竞赛题走向更接近研究实践的任务。🔗 链接

💻 Tech

@xiaohu：Claude Code 发布 Agent View，把多个长期运行的 Agent 会话集中到一个状态面板里管理，核心变化是 Coding IDE 正在变成 Agent 调度中心。🔗 链接
@kloss_xyz：/goal 在 Codex、Claude Code 和 Hermes 中被重新解释为长期任务协议，重点不是“别犯错”而是先排序不确定性、限制范围并闭环验收。🔗 链接
@simonw：Simon Willison 发现多个 Claude Code 进程在本机吃掉约 30GB 内存，提醒多 Agent 工作流的真实瓶颈不只是模型能力，还有本地资源治理。🔗 链接
@waylybaye：熊猫吃短信作者让 AI 连续半个月搜索小模型超参，最后发现经验参数已接近最优、瓶颈在数据标注质量，这个案例很适合作为“模型调参不如改数据”的工程注脚。🔗 链接
@XRarchitect：Ian Curtis 用 World Labs、Cursor/GPT-5.5、WebXR 和 Gaussian Splat 做出“缩小到客厅桌面世界”的交互体验，显示生成式 3D 正在和浏览器端空间计算快速拼起来。🔗 链接
@vista8：SkillsVote 宣称整理 GitHub 上 160 万+ skill 并补齐描述、权限、运行反馈和工作流推荐，真正有意思的是 Skill 生态开始从“发现安装”走向“评测归因迭代”。🔗 链接

🌐 其他热点

@lennysan：Lenny 总结 Eric Ries 关于使命型公司治理的观点，强调 PBC、董事使命誓言和保护性条款要在早期设置，因为资本结构一旦成型再补往往太晚。🔗 链接
@FinanceYF5：英伟达投资康宁扩建光纤产能的解读把 AI 军备竞赛从 GPU 拉到材料、光纤和工厂层面，提醒“AI 不是纯软件故事，也是制造业故事”。🔗 链接

📊 扫描 274 条 | 覆盖 18.6h | 精选 15 条