Teigen's Daily
X Digest · 🐦 X 简报

2026-05-19

🤖 AI/ML

  • @xwang_lk:HarnessAudit 把 agent 安全从“最终答案对不对”推进到“有没有越权读文件、乱调用工具、跨组件泄露上下文”,而 10 个真实 harness 的最高安全得分只有 0.32,说明 agent 产品的风险主要藏在执行轨迹里。🔗 链接
  • @immersivetran:BabelDOC 的 ACL demo paper 发布在 arXiv,用中间表示把 PDF 布局和语义拆开处理再自适应排版,PDF 翻译正在从文本替换走向文档级重建。🔗 链接
  • @godofprompt:Opus 4.7 被开发者集中反馈会忽略项目指令、跳过 MCP 配置并更快烧掉额度,提醒模型升级不能只看 SWE-Bench 分数,真实工作流回归测试更重要。🔗 链接
  • @xiaohu:Cursor 发布自研编码模型 Composer 2.5,称能力接近 Opus 4.7 但输出价格低约 30 倍,编码 agent 的成本结构可能继续被垂直模型压低。🔗 链接
  • @op7418:NVIDIA 开始交付 Vera 通用 CPU,定位不是模型推理而是高并发 agent 编排、工具调用和常驻调度,AI 基础设施正在把 CPU 重新拉回核心位置。🔗 链接
  • @SakanaAILabs:Sakana AI 把主权 AI 定义为“在全球能力之上的本地主体性”,重点不是每国都重训大模型,而是数据、适配、协同和治理责任如何留在本地。🔗 链接
  • @FinanceYF5:Anthropic 官宣收购 Stainless 这类 SDK 生成基础设施公司,说明大模型公司正在把开发者体验和 API 工具链也纳入核心能力栈。🔗 链接
  • @OpenAIDevs:Codex 桌面端新增远程连接和 Keep this Mac awake,允许手机端触发任务但让 Mac 继续执行,移动端 AI 编程开始更像“远程工作站入口”。🔗 链接

💻 Tech

  • @rauchg:Vercel 宣布 Firewall 的所有缓解能力免费,包括自定义规则的计算和网络成本,前端云平台正在把基础安全从增值项变成默认底座。🔗 链接
  • @Google:Google Search 的 Preferred Sources 已全球上线,用户可以指定更想看的来源且已选择 34.5 万个独立来源,搜索分发开始明显向个性化可信源倾斜。🔗 链接
  • @HiTw93:Pake v3.11.5 发布,修复 Linux Wayland 空白屏、macOS 新窗口崩溃、CSP 样式注入等问题并新增 dock badge 和隐身模式,小工具的工程稳定性继续补齐。🔗 链接
  • @XPENG_Global:小鹏公布 Robotaxi 路测车队,称 VLA 2.0 已在广州完成 5 个月有限道路测试并支持 L4 自动驾驶,中国厂商开始把量产车和 Robotaxi 叙事合到一起。🔗 链接
  • @starzq:X 新增 Active followers 指标,可以看到粉丝里昨天登录过 X 的比例,这会让账号价值评估从总粉丝数进一步转向真实活跃度。🔗 链接

🌐 其他热点

  • @ednewtonrex:英国新民调显示 57% 受访者认为 AI 会毁掉的工作多于创造的工作,65% 认为收益主要流向富裕投资者和大公司,AI 就业叙事和公众感受正在明显脱节。🔗 链接
  • @lifesinger:玉伯把 AI 应用创业拆成市场结构、产品结构和组织结构三件事,提醒创业机会不只在模型能力,也在赛道规则、体验关系和团队协作方式里。🔗 链接

📊 扫描 273 条 | 覆盖 25.2h | 精选 15 条

同日其他 — 2026-05-19
J 更早   K 更新   G 归档   / 主题