AI 信息源 · 2026-02-11 · 张腾甘的每日简报

⭐ 核心推荐（tier1）

无近期更新（最近一期 AI Explained 发布于 2/6，Dwarkesh 发布于 2/5）

🎙️ 访谈类（tier2）

无近期更新

🔬 技术深度（tier3）

• [Weights & Biases] — She Raised $64M to Build an AI Math Prodigy | Carina Hong, CEO of Axiom
摘要：Axiom CEO Carina Hong 讨论了她如何融资 6400 万美元构建专注于数学推理的 AI 系统。Axiom 的目标是打造能进行严格数学证明的 AI，而非仅靠模式匹配。这一方向对理解 AI 推理能力的真实边界具有重要意义。
发布：2026-02-07（超过24h，不收录）

🚀 创业/VC（tier4）

• [AI Jason] — How to install and use Claude Code Agent Teams (Reverse-engineered)
摘要：Claude Code 推出了 "agent teams" 功能，允许 3-5 个 AI 实例协作完成同一任务。与此前的 sub-agent 不同，这些实例可通过多种协议互相通信、共享上下文和任务列表。例如在 debug 场景中，多个 agent 分头探索不同方向并互相评审，最终给出比单 agent 更全面的分析。使用 team_create、task_create、send_message 等工具管理协作。
🔗 https://www.youtube.com/watch?v=S2WTTMXYcYY

🎧 播客精选

无近期更新

📝 博客精选

• [simonwillison.net] — Introducing Showboat and Rodney, so agents can demo what they've built
摘要：Simon Willison 发布了 Showboat 和 Rodney 两个新工具，解决编程 agent 向人类展示工作成果的难题。Showboat 是 CLI 工具，帮助 agent 构建 Markdown 文档记录命令执行和截图；Rodney 提供 CLI 浏览器自动化，让 agent 能操作 Web 界面并截图。Willison 强调"我从不信任任何功能，除非亲眼看到它运行"。
🔗 https://simonwillison.net/2026/Feb/10/showboat-and-rodney/

• [garymarcus.substack.com] — BREAKING: LLM "reasoning" continues to be deeply flawed
摘要：Gary Marcus 引用 Caltech 和 Stanford 的最新综述 "Large Language Model Reasoning Failure"，指出 LLM 推理能力仍存在根本缺陷。尽管行业投入近万亿美元，LLM 依然会产生幻觉和低级错误，即使是专门标榜推理能力的模型也不例外。Marcus 呼吁硅谷应关注替代方案。
🔗 https://garymarcus.substack.com/p/breaking-llm-reasoning-continues

• [garymarcus.substack.com] — Some disconcerting facts about AI and banking that may have profound consequences
摘要：Marcus 警告 AI 基础设施的巨额投资可能引发经济风险。Morgan Stanley 预测超大规模云厂商今年将借入 4000 亿美元，高等级债券发行将达创纪录的 2.25 万亿美元。数据中心建设规模被描述为"比 1850 年代铁路扩张更大"。如果 AI 承诺的生产力提升无法兑现，可能触发类似 2008 年的流动性危机。
🔗 https://garymarcus.substack.com/p/some-disconcerting-facts-about-ai

📊 扫描统计 | 扫描频道 18 个 + 播客 3 个 + 博客 92 个 | 精选 4 条
今日新内容较少