2026-03-31
🎬 YouTube
无近期更新。
🎙️ 播客
1. Mistral: Voxtral TTS, Forge, Leanstral, & what's next for Mistral 4 — w/ Pavan Kumar Reddy & Guillaume Lample
这期 Latent Space 围绕 Mistral 最新音频与模型路线展开,核心是 Voxtral TTS、Forge、Leanstral 以及 Mistral 4 的后续方向。节目里提到 Voxtral TTS 是一个约 3B/4B 级别、低延迟、多语言的开源语音模型,采用“语义语音 token 自回归 + 声学 token flow matching”的混合架构,并在对比中拿到了接近甚至优于 ElevenLabs Flash v2.5 的表现。讨论还延伸到实时语音 agent、企业私有化部署、个性化语音以及小模型效率路线,能看出 Mistral 正在把“可落地的开放语音能力”当成下一阶段重点。
🔗 链接
📝 博客
无近期更新。
🗞️ Techmeme 热点
1. David Sacks 正在重塑特朗普政府的 AI 议程,Sriram Krishnan 也将加入国家经济委员会聚焦 AI
这条消息显示,美国新一轮 AI 政策布局正在成形,而且不只是象征性任命。Sacks 负责更宏观的 AI 政策方向,Krishnan 被指将进入 National Economic Council 专门处理 AI,意味着白宫层面的产业、监管和国家竞争策略可能会更快落地。
🔗 链接
2. OpenAI 为 Claude Code 推出 Codex 插件,可在 Claude Code 内直接调用 Codex 做代码审查或任务委派
这基本是在把不同 coding agent 之间的协作产品化:用户不用切换工具,就能在 Claude Code 里把部分任务交给 Codex。它反映的不是单一模型能力竞争,而是“代理编排”正在成为新工作流,未来代码工具更像多代理协作面板而不是单模型聊天框。
🔗 链接
3. 泄露的 1 月路演材料显示:Coatue 预计 Anthropic 2026 年营收 180 亿美元,但 EBITDA 仍将亏损 140 亿美元
这个数字很夸张,说明即使顶级模型公司收入高速增长,算力、训练和推理成本仍足以吞掉绝大部分商业化成果。更值得看的是同一份材料还给出了 2030 年接近 1.995 万亿美元估值的远期想象,典型地体现出当下 AI 市场“短期巨亏、长期巨估”的资本叙事。
🔗 链接
4. 阿里巴巴发布 Qwen3.5-Omni 全模态模型,支持 10 小时以上音频输入,并称 Plus 版本在音频基准上超过 Gemini 3.1 Pro
这是 Qwen 系列继续往全模态和长上下文推进的重要更新,尤其是“10+ 小时音频输入”这个规格,直接把会议、播客、客服录音等长时音频场景拉进可用范围。若官方 benchmark 结论成立,Qwen 在音频理解上的位置会明显上移,也会让国内开源阵营在多模态赛道更有存在感。
🔗 链接
5. Quinnipiac 民调:55% 的美国人认为 AI 对日常生活弊大于利,65% 反对在自己社区建设数据中心
这说明公众对 AI 的焦虑已经不只停留在抽象层面,而是开始落到本地基础设施和社区利益冲突上。对行业来说,数据中心、电力消耗、噪音和土地占用会越来越像现实阻力,未来 AI 扩张未必卡在模型本身,更可能卡在“社会许可”和基础设施审批。
🔗 链接
📊 YouTube 0 条 | 播客 1 条 | 博客 0 条 | Techmeme 5 条 | 精选 6 条