2026-02-11
⭐ 核心推荐(tier1)
无近期更新(最近一期 AI Explained 发布于 2/6,Dwarkesh 发布于 2/5)
🎙️ 访谈类(tier2)
无近期更新
🔬 技术深度(tier3)
• [Weights & Biases] — She Raised $64M to Build an AI Math Prodigy | Carina Hong, CEO of Axiom
摘要:Axiom CEO Carina Hong 讨论了她如何融资 6400 万美元构建专注于数学推理的 AI 系统。Axiom 的目标是打造能进行严格数学证明的 AI,而非仅靠模式匹配。这一方向对理解 AI 推理能力的真实边界具有重要意义。
发布:2026-02-07(超过24h,不收录)
🚀 创业/VC(tier4)
• [AI Jason] — How to install and use Claude Code Agent Teams (Reverse-engineered)
摘要:Claude Code 推出了 "agent teams" 功能,允许 3-5 个 AI 实例协作完成同一任务。与此前的 sub-agent 不同,这些实例可通过多种协议互相通信、共享上下文和任务列表。例如在 debug 场景中,多个 agent 分头探索不同方向并互相评审,最终给出比单 agent 更全面的分析。使用 team_create、task_create、send_message 等工具管理协作。
🔗 https://www.youtube.com/watch?v=S2WTTMXYcYY
🎧 播客精选
无近期更新
📝 博客精选
• [simonwillison.net] — Introducing Showboat and Rodney, so agents can demo what they've built
摘要:Simon Willison 发布了 Showboat 和 Rodney 两个新工具,解决编程 agent 向人类展示工作成果的难题。Showboat 是 CLI 工具,帮助 agent 构建 Markdown 文档记录命令执行和截图;Rodney 提供 CLI 浏览器自动化,让 agent 能操作 Web 界面并截图。Willison 强调"我从不信任任何功能,除非亲眼看到它运行"。
🔗 https://simonwillison.net/2026/Feb/10/showboat-and-rodney/
• [garymarcus.substack.com] — BREAKING: LLM "reasoning" continues to be deeply flawed
摘要:Gary Marcus 引用 Caltech 和 Stanford 的最新综述 "Large Language Model Reasoning Failure",指出 LLM 推理能力仍存在根本缺陷。尽管行业投入近万亿美元,LLM 依然会产生幻觉和低级错误,即使是专门标榜推理能力的模型也不例外。Marcus 呼吁硅谷应关注替代方案。
🔗 https://garymarcus.substack.com/p/breaking-llm-reasoning-continues
• [garymarcus.substack.com] — Some disconcerting facts about AI and banking that may have profound consequences
摘要:Marcus 警告 AI 基础设施的巨额投资可能引发经济风险。Morgan Stanley 预测超大规模云厂商今年将借入 4000 亿美元,高等级债券发行将达创纪录的 2.25 万亿美元。数据中心建设规模被描述为"比 1850 年代铁路扩张更大"。如果 AI 承诺的生产力提升无法兑现,可能触发类似 2008 年的流动性危机。
🔗 https://garymarcus.substack.com/p/some-disconcerting-facts-about-ai
📊 扫描统计 | 扫描频道 18 个 + 播客 3 个 + 博客 92 个 | 精选 4 条
今日新内容较少