2026-04-28
🎬 YouTube
Weaviate Podcast #136:AgentIR with Zijian Chen and Xueguang Ma
Weaviate 这期播客聚焦 AgentIR,嘉宾是 Zijian Chen 和 Xueguang Ma。主题看起来围绕“智能体时代的信息检索/检索增强”展开,适合关注 RAG、agentic retrieval 和向量数据库演进的人跟进。
🔗 链接
🎙️ 播客
Latent Space:Physical AI that Moves the World — Applied Intuition
Applied Intuition 的 CEO Qasar Younis 和 CTO Peter Ludwig 讲“Physical AI”:把 AI 部署到矿车、无人机、卡车、军舰、自动驾驶车辆等真实机器上。他们强调物理世界 AI 的难点不只是模型智能,而是受限硬件、实时控制、传感器流、延迟、故障保护和可靠更新;公司也从仿真/数据基础设施扩展到车辆操作系统、自治模型与 30+ 产品。
🔗 链接
📝 博客
pip 26.1 新功能:lockfile 与 dependency cooldown
Simon Willison 记录了 pip 26.1 的两个关键变化:新的 pip lock 可以生成 pylock.toml,他用 Datasette 和 LLM 测试后得到 519 行锁文件;同时新增 --uploaded-prior-to PXD,可以要求依赖至少发布 X 天,降低供应链攻击风险。这个版本也停止支持 Python 3.9。
🔗 链接
talkie:一个只看过 1931 年前文本的 13B “复古语言模型”
Nick Levine、David Duvenaud 和 Alec Radford 发布 talkie-1930-13b-base,训练在 260B tokens 的 1931 年前英文文本上,模型权重 Apache 2.0。项目有 base 和 instruction-tuned 版本,研究问题很有趣:模型能否预测未来历史事件、能否独立“发明”知识截止线之后的科学概念、能否学习编程。
🔗 链接
Microsoft VibeVoice:带说话人分离的开源语音转文本模型
VibeVoice 是微软的 Whisper 风格 ASR 模型,MIT 许可,并内置 speaker diarization。Simon 用 5.71GB 的 4bit MLX 转换版在 M5 Max 上测试:1 小时音频约 8 分 45 秒处理完,峰值内存报告 30.44GB;默认 token 上限只够约 25 分钟音频,需要调高 --max-tokens 才能转完整长节目。
🔗 链接
OpenAI 与 Microsoft “AGI 条款”的历史追踪
Simon 梳理了 OpenAI/Microsoft 合作中那条“达到 AGI 后 Microsoft 商业 IP 权利失效”的长期条款,以及它如何从 2019 年的 pre-AGI 授权逻辑,演变到 2024 年关于 1000 亿美元利润能力的财务定义,再到 2025 年独立专家组判断。文章核心是:如果商业合同依赖“AGI 已达成”,就必须给出可操作、可裁定的定义。
🔗 链接
Google Meet 语音翻译开始推向移动端
Google Meet 的语音翻译功能正在向移动设备 rollout:两个人可以用不同语言说话,Meet 会延迟翻译并用近似原说话人的声音朗读。目前支持英语、西语、法语、德语、葡语和意大利语;Simon 体验后认为网页端能跑,但 iPhone/iPad 之间还不稳定,整体仍偏 alpha。
🔗 链接
🗞️ Techmeme 热点
美国农村社区反对 AI 数据中心扩张
Financial Times 报道称,很多美国农村社区正在反对 AI 数据中心建设。Pew 数据显示,计划中的数据中心有 67% 位于农村地区,而现有数据中心 87% 在城市地区,说明 AI 基建扩张正在把能源、水资源和土地压力转移到新区域。
🔗 链接
404 Media:ChatGPT 发布后新网站中约 35% 与 AI 生成/辅助有关
404 Media 基于 Internet Archive 数据分析称,到 2025 年中,自 2022 年 11 月 ChatGPT 发布以来的新网站中,约 35% 是 AI 生成或 AI 辅助生成。这是一个很强的互联网内容结构变化信号:AI 内容不只是平台内文本,而是在重塑公开 Web。
🔗 链接
Google 与美国国防部 AI 使用协议曝光
The Information 报道称,Google 签署了一项协议,允许美国国防部将 Google AI 用于“任何合法政府目的”。Google 表示这是对既有合同的修订;这个方向会继续引发大型 AI 公司与国防/政府用途边界的讨论。
🔗 链接
OpenAI 发布 Symphony:面向编码智能体编排的开源规范
OpenAI 发布 Symphony,一个用于 agent orchestration 的开源规范,目标是把 Linear 这类项目管理看板变成编码智能体的控制平面。它反映了一个趋势:多 agent 编码工作流正在从“聊天窗口”转向更结构化的任务、状态和权限编排。
🔗 链接
SquareMind 获 1800 万美元融资,用 AI 做全身皮肤影像
巴黎公司 SquareMind 获得 1800 万美元融资,其 Swan 机器人用 AI 做全身皮肤镜影像采集,目标是提升皮肤检查的覆盖率和一致性。这属于医疗 AI 与机器人硬件结合的方向,场景比纯软件诊断更贴近临床流程。
🔗 链接
📊 YouTube 1 条 | 播客 1 条 | 博客 5 条 | Techmeme 5 条 | 精选 12 条