2026-06-09
🤖 AI/ML
@AnthropicAI:Anthropic 指出 AI 在编程上进展快于生物学,关键差异不是模型本身,而是生物数据库缺少适合 Agent 调用的结构化、可组合基础设施。 🔗 链接
@swyx:FrontierCode 把 AI 编程评测从“能不能过测试”推进到“代码能不能被维护者合并”,也暴露了 SWE-Bench 高分背后大量不可合并代码的问题。 🔗 链接
@9hills:九原客提醒同一个 Agent 既写测试又写代码时容易把目标偷换成“通过测试”,所以功能测试 Agent 和开发 Agent 分离可能比传统 TDD 更适合 AI 编程。 🔗 链接
@xwang_lk:行业正在意识到 Agent harness 本身就是产品和安全边界,未来审计重点会从模型扩展到提示词、工具、权限、记忆和执行层。 🔗 链接
@9hills:LangChain DeepAgents 的 Harness Profile 可以按模型自动切换提示词和工具配置,这说明多模型 Agent 系统正在从“通用接口”走向“按模型适配执行环境”。 🔗 链接
@op7418:MiMo V2.5 Pro UltraSpeed 在复杂前端生成测试中跑到 1000+ tokens/s,值得关注的不是炫速,而是 Agent 并发和交互等待成本会被高速推理显著改写。 🔗 链接
@YiMaTweets:马毅从 CVPR 2026 观察到视觉社区重新转向 3D vision,这可能意味着 3D 表示、空间理解和生成式视觉的研究重心正在回流。 🔗 链接
💻 Tech
@NotebookLM:NotebookLM 新版把 Gemini 3.5、云端计算机、软件技能和多格式输出接进笔记本,产品形态从“资料问答”进一步变成 Agentic research workspace。 🔗 链接
@vista8:Aye 这类 AI Agent 浏览器开始把网页操作录制、Skill、定时执行和真实浏览器登录态放在一起,说明“浏览器即自动化运行时”的产品路线正在升温。 🔗 链接
@HiTw93:Kaku V0.12 加入 Codex 登录、会话恢复和运行中 Cmd+Q 保护,说明 AI coding 终端正在补齐长期任务和上下文连续性的基础体验。 🔗 链接
@waylybaye:Apple 支持 IAP 多席位订阅后,iOS 体系内的 SaaS 收款和团队账号商业模式会比过去更顺。 🔗 链接
@simonw:OpenAI 和 Anthropic 都已秘密提交 S-1,AI 公司竞争正在从模型发布同步进入资本市场和融资透明度的新阶段。 🔗 链接
🌐 其他热点
@immersivetran:苹果 Siri AI 接入 Gemini 后仍因 DMA 暂不在欧盟 iOS 上线,争议焦点从“功能强不强”转向平台开放、用户选择权和系统级 AI 权限风险。 🔗 链接
@FinanceYF5:AI 让 App 发布数量暴涨但用户和评论没有同步增长,这个信号比“做 App 更容易”更重要,因为分发、留存和真实需求仍然没被 AI 自动解决。 🔗 链接
📊 扫描 292 条 | 覆盖 20.6h | 精选 14 条