X 简报 · 2026-06-09 · 张腾甘的每日简报

🤖 AI/ML

@AnthropicAI：Anthropic 指出 AI 在编程上进展快于生物学，关键差异不是模型本身，而是生物数据库缺少适合 Agent 调用的结构化、可组合基础设施。 🔗 链接

@swyx：FrontierCode 把 AI 编程评测从“能不能过测试”推进到“代码能不能被维护者合并”，也暴露了 SWE-Bench 高分背后大量不可合并代码的问题。 🔗 链接

@9hills：九原客提醒同一个 Agent 既写测试又写代码时容易把目标偷换成“通过测试”，所以功能测试 Agent 和开发 Agent 分离可能比传统 TDD 更适合 AI 编程。 🔗 链接

@xwang_lk：行业正在意识到 Agent harness 本身就是产品和安全边界，未来审计重点会从模型扩展到提示词、工具、权限、记忆和执行层。 🔗 链接

@9hills：LangChain DeepAgents 的 Harness Profile 可以按模型自动切换提示词和工具配置，这说明多模型 Agent 系统正在从“通用接口”走向“按模型适配执行环境”。 🔗 链接

@op7418：MiMo V2.5 Pro UltraSpeed 在复杂前端生成测试中跑到 1000+ tokens/s，值得关注的不是炫速，而是 Agent 并发和交互等待成本会被高速推理显著改写。 🔗 链接

@YiMaTweets：马毅从 CVPR 2026 观察到视觉社区重新转向 3D vision，这可能意味着 3D 表示、空间理解和生成式视觉的研究重心正在回流。 🔗 链接

@NotebookLM：NotebookLM 新版把 Gemini 3.5、云端计算机、软件技能和多格式输出接进笔记本，产品形态从“资料问答”进一步变成 Agentic research workspace。 🔗 链接

@vista8：Aye 这类 AI Agent 浏览器开始把网页操作录制、Skill、定时执行和真实浏览器登录态放在一起，说明“浏览器即自动化运行时”的产品路线正在升温。 🔗 链接

@HiTw93：Kaku V0.12 加入 Codex 登录、会话恢复和运行中 Cmd+Q 保护，说明 AI coding 终端正在补齐长期任务和上下文连续性的基础体验。 🔗 链接

@waylybaye：Apple 支持 IAP 多席位订阅后，iOS 体系内的 SaaS 收款和团队账号商业模式会比过去更顺。 🔗 链接

@simonw：OpenAI 和 Anthropic 都已秘密提交 S-1，AI 公司竞争正在从模型发布同步进入资本市场和融资透明度的新阶段。 🔗 链接

@immersivetran：苹果 Siri AI 接入 Gemini 后仍因 DMA 暂不在欧盟 iOS 上线，争议焦点从“功能强不强”转向平台开放、用户选择权和系统级 AI 权限风险。 🔗 链接

@FinanceYF5：AI 让 App 发布数量暴涨但用户和评论没有同步增长，这个信号比“做 App 更容易”更重要，因为分发、留存和真实需求仍然没被 AI 自动解决。 🔗 链接

📊 扫描 292 条 | 覆盖 20.6h | 精选 14 条