X Digest · 🐦 X 简报
2026-05-12
TUE · May 12, 2026
二〇二六年五月十二
🤖 AI/ML
- @op7418:前 OpenAI CTO Mira Murati 的 Thinking Machines 展示“交互模型”路线,把音频、视频、文本、实时打断和后台推理放进同一套交互范式里,值得关注的是 Agent 正从脚手架走向原生模型能力。🔗 链接
- @sama:OpenAI 发布 Daybreak,试图把 GPT-5.5 和 Codex 组合成持续扫描代码库、发现漏洞、生成补丁的 AI 安全团队,说明网络安全正在成为 Agent 落地的高价值场景。🔗 链接
- @emollick:Ethan Mollick 提醒 gpt-realtime-2 是原生处理语音而不是先转写的更强 voice model,但旧实时语音提示词需要重写,说明语音模型升级会直接改写产品工程假设。🔗 链接
- @SakanaAILabs:Sakana AI 的 KAME 用快速语音模型即时回应、后台 LLM 并行注入深层知识,给“更像活人”的对话 AI 提供了一个低延迟与高智能拆层的新方案。🔗 链接
- @indigox:a16z 关于持续学习的文章被总结为“上下文学习只是短暂记忆,真正进化需要压缩”,核心看点是 RAG、LoRA/Adapter、权重更新会在长期 Agent 系统里分层共存。🔗 链接
- @YiMaTweets:马毅指出 AI/ML 每年上万篇论文已像“怪物扩散过程”,学术界应承担降噪器而非继续增熵的角色,这句话精准戳中了当前 AI 研究的信噪比问题。🔗 链接
- @_akhaliq:Soohak 发布,定位为数学家策划的研究级数学能力评测基准,值得留意的是 LLM 数学评估正在从竞赛题走向更接近研究实践的任务。🔗 链接
💻 Tech
- @xiaohu:Claude Code 发布 Agent View,把多个长期运行的 Agent 会话集中到一个状态面板里管理,核心变化是 Coding IDE 正在变成 Agent 调度中心。🔗 链接
- @kloss_xyz:/goal 在 Codex、Claude Code 和 Hermes 中被重新解释为长期任务协议,重点不是“别犯错”而是先排序不确定性、限制范围并闭环验收。🔗 链接
- @simonw:Simon Willison 发现多个 Claude Code 进程在本机吃掉约 30GB 内存,提醒多 Agent 工作流的真实瓶颈不只是模型能力,还有本地资源治理。🔗 链接
- @waylybaye:熊猫吃短信作者让 AI 连续半个月搜索小模型超参,最后发现经验参数已接近最优、瓶颈在数据标注质量,这个案例很适合作为“模型调参不如改数据”的工程注脚。🔗 链接
- @XRarchitect:Ian Curtis 用 World Labs、Cursor/GPT-5.5、WebXR 和 Gaussian Splat 做出“缩小到客厅桌面世界”的交互体验,显示生成式 3D 正在和浏览器端空间计算快速拼起来。🔗 链接
- @vista8:SkillsVote 宣称整理 GitHub 上 160 万+ skill 并补齐描述、权限、运行反馈和工作流推荐,真正有意思的是 Skill 生态开始从“发现安装”走向“评测归因迭代”。🔗 链接
🌐 其他热点
- @lennysan:Lenny 总结 Eric Ries 关于使命型公司治理的观点,强调 PBC、董事使命誓言和保护性条款要在早期设置,因为资本结构一旦成型再补往往太晚。🔗 链接
- @FinanceYF5:英伟达投资康宁扩建光纤产能的解读把 AI 军备竞赛从 GPU 拉到材料、光纤和工厂层面,提醒“AI 不是纯软件故事,也是制造业故事”。🔗 链接
📊 扫描 274 条 | 覆盖 18.6h | 精选 15 条
J 更早 K 更新 G 归档 / 主题