AI 信息源 · 2026-02-18 · 张腾甘的每日简报

🎙️ AI 信息源日报 | 2026-02-18

⭐ 核心推荐（tier1）
• [Matthew Berman] — Anthropic just dropped Sonnet 4.6...
摘要：视频解读了 Anthropic 发布 Claude Sonnet 4.6 的关键变化：在价格维持 Sonnet 档位的同时，能力接近更高阶模型。内容引用了 OSWorld 成绩对比（Sonnet 4.6 约 72.5%，此前版本约 61.4%），强调其在“像人一样操作电脑”的代理任务中提升明显。还提到该模型在金融分析与办公自动化场景中表现稳定，且已进入默认可用路径，意味着落地门槛进一步降低。
🔗 链接

• [Matthew Berman] — 21 INSANE Use Cases For OpenClaw...
摘要：这期内容系统展示了 OpenClaw 的 21 个实用场景，核心不是“单次问答”，而是“长期记忆+工作流自动化”。示例包括把 Gmail、日历、会议纪要整合成可查询的个人 CRM，并自动提炼联系人状态与待跟进事项。视频还展示了“顾问团”式多 Agent 协同分析机制，用于对业务数据做夜间复盘与建议排序。
🔗 链接

🎙️ 访谈类（tier2）
无近期更新

🔬 技术深度（tier3）
无近期更新

🚀 创业/VC（tier4）
无近期更新

🎧 播客精选
无近期更新

📝 博客精选
• [simonwillison.net] — Introducing Claude Sonnet 4.6
摘要：Simon 记录了 Sonnet 4.6 的发布信息，并强调其定价为输入 3 美元/百万 tokens、输出 15 美元/百万 tokens，明显低于 Opus 档。文章还提到他已更新 llm-anthropic 以支持 Sonnet 4.6/Opus 4.6，同时适配了 adaptive thinking 等接口变化。实测案例中，他用新模型生成“鹈鹕骑车 SVG”，观察到模型在风格偏好上的有趣细节。
🔗 链接

• [simonwillison.net] — Qwen3.5: Towards Native Multimodal Agents
摘要：文中总结了 Qwen 3.5 的两条线：开源权重版 Qwen3.5-397B-A17B 与托管 API 版 Qwen3.5 Plus。重点技术点是 MoE 结构中“总参数 397B、单次激活约 17B”，以换取更优推理效率与成本。Qwen3.5 Plus 还给到最高 100 万上下文并整合搜索与代码解释器，明显朝“原生多模态 Agent”产品形态推进。
🔗 链接

• [simonwillison.net] — Two new Showboat tools: Chartroom and datasette-showboat
摘要：这篇文章发布了两个与 Showboat 配套的新工具：Chartroom 与 datasette-showboat。Chartroom 本质是对 matplotlib 的轻量封装，让编码 Agent 可以直接在流程里生成图表并附带可访问文本。datasette-showboat 则把文档增量发布到 Datasette 端，实现“边生成边可视化查看”，适合协作调试与实时反馈。
🔗 链接

• [garymarcus.substack.com] — Rumors of AGI’s arrival have been greatly exaggerated
摘要：Gary Marcus 这篇文章核心观点是：把大模型的统计逼近能力等同于 AGI，是概念偷换。文中指出单点 benchmark 的高分并不能证明系统在新环境、目标变化和不确定条件下具备稳健泛化能力。作者认为当前系统仍依赖大量人为设定与任务边界，距离“可自驱、可迁移、通用稳定”的 AGI 还有结构性差距。
🔗 链接

📊 扫描统计 | 新内容 6 条 | 精选 6 条