X 简报 · 2026-05-19 · 张腾甘的每日简报

🤖 AI/ML

@xwang_lk：HarnessAudit 把 agent 安全从“最终答案对不对”推进到“有没有越权读文件、乱调用工具、跨组件泄露上下文”，而 10 个真实 harness 的最高安全得分只有 0.32，说明 agent 产品的风险主要藏在执行轨迹里。🔗 链接
@immersivetran：BabelDOC 的 ACL demo paper 发布在 arXiv，用中间表示把 PDF 布局和语义拆开处理再自适应排版，PDF 翻译正在从文本替换走向文档级重建。🔗 链接
@godofprompt：Opus 4.7 被开发者集中反馈会忽略项目指令、跳过 MCP 配置并更快烧掉额度，提醒模型升级不能只看 SWE-Bench 分数，真实工作流回归测试更重要。🔗 链接
@xiaohu：Cursor 发布自研编码模型 Composer 2.5，称能力接近 Opus 4.7 但输出价格低约 30 倍，编码 agent 的成本结构可能继续被垂直模型压低。🔗 链接
@op7418：NVIDIA 开始交付 Vera 通用 CPU，定位不是模型推理而是高并发 agent 编排、工具调用和常驻调度，AI 基础设施正在把 CPU 重新拉回核心位置。🔗 链接
@SakanaAILabs：Sakana AI 把主权 AI 定义为“在全球能力之上的本地主体性”，重点不是每国都重训大模型，而是数据、适配、协同和治理责任如何留在本地。🔗 链接
@FinanceYF5：Anthropic 官宣收购 Stainless 这类 SDK 生成基础设施公司，说明大模型公司正在把开发者体验和 API 工具链也纳入核心能力栈。🔗 链接
@OpenAIDevs：Codex 桌面端新增远程连接和 Keep this Mac awake，允许手机端触发任务但让 Mac 继续执行，移动端 AI 编程开始更像“远程工作站入口”。🔗 链接

💻 Tech

@rauchg：Vercel 宣布 Firewall 的所有缓解能力免费，包括自定义规则的计算和网络成本，前端云平台正在把基础安全从增值项变成默认底座。🔗 链接
@Google：Google Search 的 Preferred Sources 已全球上线，用户可以指定更想看的来源且已选择 34.5 万个独立来源，搜索分发开始明显向个性化可信源倾斜。🔗 链接
@HiTw93：Pake v3.11.5 发布，修复 Linux Wayland 空白屏、macOS 新窗口崩溃、CSP 样式注入等问题并新增 dock badge 和隐身模式，小工具的工程稳定性继续补齐。🔗 链接
@XPENG_Global：小鹏公布 Robotaxi 路测车队，称 VLA 2.0 已在广州完成 5 个月有限道路测试并支持 L4 自动驾驶，中国厂商开始把量产车和 Robotaxi 叙事合到一起。🔗 链接
@starzq：X 新增 Active followers 指标，可以看到粉丝里昨天登录过 X 的比例，这会让账号价值评估从总粉丝数进一步转向真实活跃度。🔗 链接

🌐 其他热点

@ednewtonrex：英国新民调显示 57% 受访者认为 AI 会毁掉的工作多于创造的工作，65% 认为收益主要流向富裕投资者和大公司，AI 就业叙事和公众感受正在明显脱节。🔗 链接
@lifesinger：玉伯把 AI 应用创业拆成市场结构、产品结构和组织结构三件事，提醒创业机会不只在模型能力，也在赛道规则、体验关系和团队协作方式里。🔗 链接

📊 扫描 273 条 | 覆盖 25.2h | 精选 15 条