AI 信息源 · 2026-03-31 · 张腾甘的每日简报

🎬 YouTube

无近期更新。

🎙️ 播客

1. Mistral: Voxtral TTS, Forge, Leanstral, & what's next for Mistral 4 — w/ Pavan Kumar Reddy & Guillaume Lample

这期 Latent Space 围绕 Mistral 最新音频与模型路线展开，核心是 Voxtral TTS、Forge、Leanstral 以及 Mistral 4 的后续方向。节目里提到 Voxtral TTS 是一个约 3B/4B 级别、低延迟、多语言的开源语音模型，采用“语义语音 token 自回归 + 声学 token flow matching”的混合架构，并在对比中拿到了接近甚至优于 ElevenLabs Flash v2.5 的表现。讨论还延伸到实时语音 agent、企业私有化部署、个性化语音以及小模型效率路线，能看出 Mistral 正在把“可落地的开放语音能力”当成下一阶段重点。
🔗 链接

📝 博客

无近期更新。

🗞️ Techmeme 热点

1. David Sacks 正在重塑特朗普政府的 AI 议程，Sriram Krishnan 也将加入国家经济委员会聚焦 AI

这条消息显示，美国新一轮 AI 政策布局正在成形，而且不只是象征性任命。Sacks 负责更宏观的 AI 政策方向，Krishnan 被指将进入 National Economic Council 专门处理 AI，意味着白宫层面的产业、监管和国家竞争策略可能会更快落地。
🔗 链接

2. OpenAI 为 Claude Code 推出 Codex 插件，可在 Claude Code 内直接调用 Codex 做代码审查或任务委派

这基本是在把不同 coding agent 之间的协作产品化：用户不用切换工具，就能在 Claude Code 里把部分任务交给 Codex。它反映的不是单一模型能力竞争，而是“代理编排”正在成为新工作流，未来代码工具更像多代理协作面板而不是单模型聊天框。
🔗 链接

3. 泄露的 1 月路演材料显示：Coatue 预计 Anthropic 2026 年营收 180 亿美元，但 EBITDA 仍将亏损 140 亿美元

这个数字很夸张，说明即使顶级模型公司收入高速增长，算力、训练和推理成本仍足以吞掉绝大部分商业化成果。更值得看的是同一份材料还给出了 2030 年接近 1.995 万亿美元估值的远期想象，典型地体现出当下 AI 市场“短期巨亏、长期巨估”的资本叙事。
🔗 链接

4. 阿里巴巴发布 Qwen3.5-Omni 全模态模型，支持 10 小时以上音频输入，并称 Plus 版本在音频基准上超过 Gemini 3.1 Pro

这是 Qwen 系列继续往全模态和长上下文推进的重要更新，尤其是“10+ 小时音频输入”这个规格，直接把会议、播客、客服录音等长时音频场景拉进可用范围。若官方 benchmark 结论成立，Qwen 在音频理解上的位置会明显上移，也会让国内开源阵营在多模态赛道更有存在感。
🔗 链接

5. Quinnipiac 民调：55% 的美国人认为 AI 对日常生活弊大于利，65% 反对在自己社区建设数据中心

这说明公众对 AI 的焦虑已经不只停留在抽象层面，而是开始落到本地基础设施和社区利益冲突上。对行业来说，数据中心、电力消耗、噪音和土地占用会越来越像现实阻力，未来 AI 扩张未必卡在模型本身，更可能卡在“社会许可”和基础设施审批。
🔗 链接

📊 YouTube 0 条 | 播客 1 条 | 博客 0 条 | Techmeme 5 条 | 精选 6 条