X 简报 · 2026-04-18 · 张腾甘的每日简报

🤖 AI/ML

@bindureddy：被不少人忽略的信号是，Qwen 3.6 以仅 3B 激活参数就打到接近 Opus 4.7 八成表现，说明高性价比开源模型还在快速逼近闭源前沿。🔗 链接
@gdb：Greg Brockman 用一句话把 Codex 的方向说透了，Codex 正从单点能力演进成完整的 agentic IDE，编程工作流的入口正在被重写。🔗 链接
@emollick：Ethan Mollick 认为 Opus 4.7 最关键的启示不是人格或调性争论，而是模型在高经济价值任务上的可测性能仍在持续上升且看不到放缓迹象。🔗 链接
@emollick：Mollick 公开质疑 GDPval-AA 这个热门分数，因为它本质上是 Gemini 3.1 在公开题上给别的模型打分，容易被误用成没有实际含金量的 benchmark。🔗 链接
@EMostaque：Emad 判断 Anthropic 等厂商真正想拿下的是接入企业系统记录层的官方工作台，所以商业模式会从 seat 计费转向 API 消耗，最好用的模型也会越来越绑定自家壳层。🔗 链接
@DeepLearningAI：Anthropic 推出了能自主发现并利用严重软件漏洞的 Claude Mythos Preview，但因为风险太高选择先不公开发布，这说明前沿模型的安全边界开始进入实战级攻防区间。🔗 链接
@cursor_ai：Cursor 周末临时把 agents 窗口里的 Composer 2 配额翻倍，看起来既是在给 agent 工作流导流，也侧面说明新窗口的使用量正在快速拉升。🔗 链接
@vista8：有人几乎不改代码就把 Claude Design 生成的博客主题直接上线了，这比“Figma 已死”式口号更有信息量，因为它展示了设计到前端落地的真实压缩比。🔗 链接

💻 Tech

@levie：Aaron Levie 提出“软件无头化”会是 agent 时代的必然结果，因为未来不是人按 seat 使用工具，而是 agent 以 API 消耗的方式 24/7 并行榨干系统能力。🔗 链接
@op7418：有人把 Claude Code 和 Codex 的状态监控与审批搬到了墨水屏上，这类“随身 agent 控制面板”原型很小，但很可能是下一波个人智能硬件的真实形态。🔗 链接
@lennysan：Lennybot 直接内嵌进 Substack 并接入作者全部文章和播客语料，说明“内容平台原生分身”正在从外挂聊天机器人变成创作者基础设施。🔗 链接
@patrickc：Patrick Collison 公开求推荐靠谱的 D2C 消费级基因测序服务却发现几乎没有现成答案，这反而暴露出一个需求明确但产品和交付都还很不成熟的市场空档。🔗 链接

🌐 其他热点

@kevinweil：Kevin Weil 宣布离开 OpenAI，原因是 OpenAI for Science 被拆分回其他研究团队，这既是高层人事变动，也暗示科学方向组织形态正在调整。🔗 链接
@RobinSeun：中证协新指引把薪酬追索扣回机制明确延伸到离职和退休人员，意味着金融从业者的风险责任周期被显著拉长，职业安全边界又收紧了一层。🔗 链接

📊 扫描 267 条 | 覆盖 21.3h | 精选 14 条