AI资讯日报 · 2026年6月23日
Anthropic 发布 Claude Tag——Agent 嵌入 Slack 成为团队”异步同事”(内部已写 65% 代码),Karpathy 称此为大模型 UI 第三范式;Prime Intellect 实现万亿参数 MoE 强化学习训练;OpenAI Daybreak 安全工具栈扩张;Apple container 项目让 Docker Desktop 在 Mac 上变成可选项
核心摘要
- **Claude Tag 发布:Agent 嵌入 Slack 成为团队常驻成员**:Claude 加入 Slack 作为团队成员,拥有频道/工具访问权限。内部已编写产品团队 65% 代码,且构建了 Claude Tag 自身的大部分。Karpathy 称其为继网页版、桌面应用之后的”第三个大模型 UI 范式”——持久化、异步、嵌入组织的 Agent
- **Prime Intellect prime-rl v0.6.0:RL 训练万亿参数 MoE**:支持 1T 参数 MoE 模型的强化学习训练,步进时间 <5 分钟。在 GLM-5 agentic SWE 设置中 131k 上下文中 ~3 天完成 ~1k 步。Agent 训练正从算法问题变成基础设施问题
- **Mistral OCR 4:结构化 OCR 支持 170 种语言,但基准争议浮现**:声称 SOTA 却在 OlmOCRBench 公共排行榜上排第 3,低于两个开源模型
- **Agent 基础设施从聊天机器人转向”异步同事”UX**:OpenAI DevDay 2026 开启报名;Apple container 实现 Mac 免 Docker Desktop 运行 Linux 容器;Krea 2 开源完整 checkpoint;Microsoft FastContext 4B 子 Agent 实现主 Agent token 节省 46.5%
产品动态
Claude Tag:Agent 嵌入 Slack 成为团队常驻”异步同事”,Karpathy 称此为大模型 UI 第三范式
Anthropic 发布 Claude Tag,这是从聊天机器人向持久化、异步、组织嵌入 Agent 转型的最明确产品信号。Claude 现在可以作为团队成员加入 Slack,拥有限定频道和工具访问权限。Anthropic 表示内部版本已编写产品团队 65% 的代码,包括构建 Claude Tag 自身的大部分工作。
关键使用场景不是”对话”,而是后台监控——启动/指标监控、主动任务执行、在现有工作流中嵌入检查步骤。Andrej Karpathy 将此定位为LLM UI 的第三个主要范式:从网页版 → 桌面应用 → 持久化实体在线与团队协同工作。
开源生态也在朝同一方向汇聚:StarAgent(tmux + Tailscale + Web 仪表板多路复用 Agent 会话)、Self-Harness(Agent 挖掘失败、提出 harness 变更、回归验证)、Hermes Agent 新增 /learn 命令(可摄入文档/URL/历史会话合成新 skill)、Executor 发布开源 MCP Gateway(进入 YC S26)。
关键信息: Anthropic, Claude Tag, Slack, Agent, Karpathy, 异步协作
OpenAI Daybreak 扩张:Codex 安全插件 + GPT-5.5-Cyber 完整版 + 网络合作伙伴计划
OpenAI 宣布 Daybreak 安全计划重大扩张,四管齐下:
- Codex Security 插件:在 Codex 内查找、验证和修复漏洞
- GPT-5.5-Cyber 完整版:面向可信防御者的专用安全模型
- Cyber Partner Program:将最先进的网络安全能力赋能领先安全公司的产品
- Patch the Planet:与维护者合作保护关键开源项目
关键信息: OpenAI, Daybreak, Codex Security, GPT-5.5-Cyber, 网络安全
OpenAI DevDay 2026 开放报名:9/29 旧金山
OpenAI DevDay 2026 已开放申请,9 月 29 日在旧金山举办,7 月 10 日截止申请。同时 OpenAI 宣布 GPT-5.5 Instant 健康问答能力已达 Thinking 模型水平,每周超 2.3 亿人使用 ChatGPT 咨询健康问题。
关键信息: OpenAI, DevDay 2026, GPT-5.5 Instant, 开发者大会
Google DeepMind 与 A24 电影公司建立研究合作
Google DeepMind 宣布与独立电影公司 A24 建立研究合作伙伴关系,确保未来 AI 工具由创作者(creators)参与塑造。同时 Project Genie 团队斩获戛纳国际创意节(Cannes Lions)AI Craft 大奖。
关键信息: Google DeepMind, A24, Project Genie, Cannes Lions
Google Interactions API 正式发布(GA):跨模型/跨 Agent 的统一编排
Google 将 Interactions API 发布为 GA,这是面向 Agent 时代的新默认 API,支持在同一接口中编排多个模型和 Agent,为开发者提供跨模型的统一调度层。
关键信息: Google, Interactions API, GA, 多Agent编排
ByteDance Seedance 2.5 发布:30 秒 4K 视频 + 50 个全模态参考素材
Seedance 2.5 支持 30 秒片段、原生 4K、50 个全模态参考素材(图片/视频/音频/文本/3D 白模),同时上线 AI 版权商业化平台。@linusekenstam 评价其”引领潮流”。
关键信息: ByteDance, Seedance 2.5, 视频生成, 4K, 多模态
工具框架
Prime Intellect prime-rl v0.6.0:万亿参数 MoE 的 Agentic RL 基础设施
本周最具技术深度的系统发布。prime-rl v0.6.0 支持 1 万亿参数 MoE 模型的强化学习训练,步进时间 <5 分钟,~3 天完成 ~1k 步。已在 GLM-5 agentic SWE 设置上验证,131k 上下文。优化覆盖推理(wide-EP、FP8 推理、Mooncake、KV-cache CPU offload)、训练(FSDP2、Deep-EP、FP8 训练、router replay)和 rollout 编排(重写核心、支持 GLM5/Kimi/Nemotron)。
W&B/OpenPipe 将 RL 吞吐度量重构为 trajectories/sec(轨迹/秒)而非传统的 tokens/sec,在新 Megatron 后端上声称 12× 吞吐提升,4 GPU 上可达 ~35 轨迹/秒(GRPO 类负载)。Vibrant Labs 发布 Ecom Bench——40 个任务的实时 Shopify 基准,确定性验证。
核心趋势:Agent 训练正从算法问题变成基础设施问题——开放后训练栈 + 可验证环境 + 任务特化 rollout。
关键信息: Prime Intellect, prime-rl, MoE, RL训练, GLM-5, 基础设施
Apple container 项目:Docker Desktop 在 Mac 上成为可选项
Apple 的 container 项目引发巨大关注。功能集包括:Apple Silicon 上原生 Linux 容器、OCI 兼容、Swift 实现、Apache 2.0 许可,完全无需 Docker Desktop 守护进程或商业授权费用。对于本地 AI/ML 开发场景,这意味着更轻量、无许可成本的容器方案。
关键信息: Apple, container, Docker Desktop, Linux容器, Apple Silicon
Microsoft FastContext-1.0:4B 仓库探索子 Agent,主 Agent token 节省 46.5%
Microsoft 开源 FastContext-1.0,一个 4B 参数的仓库探索子 Agent(subagent),通过并行 READ/GLOB/GREP 调用返回紧凑的 file-path + line-range 引用。在 GPT-5.4 追踪中,代码库搜索/读取占 56.2% 工具调用次数和 46.5% 主 Agent token。FastContext 在 SWE-bench Pro 上为 GPT-5.4 提升 +5.5 分。社区关注点在于它与基于 codegraph 的确定性方法相比,是否能可靠找到”怪异的跨文件依赖”。
关键信息: Microsoft, FastContext, 子Agent, 仓库探索, token节省
Modal 推出托管私有 LLM 端点 + Latitude 发布 Agent 生产监控
- Modal 发布托管私有 LLM 端点(managed private endpoints),强调用户仍可访问底层代码而非黑箱服务
- Latitude 在 Agent 生产监控领域获好评:自动将重复失败合并为 issue、自然语言搜索生产对话、开源/自托管可部署
关键信息: Modal, LLM端点, Latitude, Agent监控, 可观测性
模型发布
Mistral OCR 4:结构化 OCR 支持 170 种语言,但”类SOTA”声明存争议
Mistral 发布 OCR 4,声称实现带边界框(bounding boxes)、块分类、行内置信度评分的结构化 OCR,支持 170 种语言。但 @NielsRogge 指出 Mistral 的 OlmOCRBench “SOTA” 声明与 Hugging Face 公共排行榜不符——实际排名第 3,低于两个开源模型。Baidu Unlimited-OCR 同期登陆 HF,OCR 正成为突然升温的开源竞争前沿。
关键信息: Mistral, OCR 4, 结构化OCR, Baidu, OlmOCRBench
Krea 2 开源完整权重:发布原始未蒸馏中期训练 checkpoint
Krea 2 开源两个 checkpoint:Krea 2 Raw(未蒸馏中期训练模型,适合微调和后训练)和 Krea 2 Turbo(蒸馏推理版)。这种”直接发布原始未蒸馏 checkpoint”的做法值得关注——给社区提供了一个真正可用于后训练的基座,而非仅提供打磨过的推理工件。Day-0 即获 Hugging Face diffusers 和 LoRA 生态支持。
关键信息: Krea 2, 开源, 图像生成, 蒸馏, LoRA
X平台动态
过去 2 天精选
Claude Tag 与 Agent 新范式
@karpathy:Claude Tag 是大模型 UI 的第三范式——从网页版、桌面应用到持久化实体在线与团队协同工作
这是与 Claude 交互的一种新范式,显著更”内联”于组织内所有其他人类活动。一旦完成了底层工程工作使其”只管用”(跨工具、集成、计算环境、内存、安全等),Claude 就从”你去找它”变成了”它跟你们一起工作”。
@claudeai:Claude Tag 发布——Claude 加入 Slack 作为团队成员,内部已编写产品团队 65% 代码
Claude Tag 让团队以一种新方式与 Claude 协作。在 Slack 中,Claude 作为团队成员加入,拥有频道和工具访问权限。内部,Claude 已经编写了我们产品团队 65% 的代码。
开源模型与基础设施
@jeremyphoward:GLM 5.2 是个奇迹——这是我第一次体验如此好的开源模型
GLM 5.2 是个奇迹!至少和 Opus 4.8、GPT 5.5 一样好。超级快、便宜、不啰嗦,处理长上下文非常好。我从未体验过这样的开源权重模型。
@OfficialLoganK:过去一个月,人们在 Google AI Studio 中创建了超过 100 万个原生 Android 应用
有趣的统计:过去一个月内,人们在 Google AI Studio 中直接创建了超过 1,000,000 个原生 Android 应用!!巨大的进步,看到人们构建的广度太酷了。
安全与政策
@yoshua_bengio:新论文——AI Agent 对可见激励的贪婪可能导致它们放弃安全对齐
我最近博士毕业生的一篇有趣的论文——关于 AI Agent 对可见激励的贪婪如何导致它们放弃安全对齐。
@linusekenstam:ByteDance Seedance 2.5——30 秒片段、原生 4K、50 个全模态参考素材
Seedance 2.5 🤯 → 30 秒片段 → 原生 4K → 支持 50 个全模态参考素材,疯狂 → 支持 3D 白模。同时上线 AI 版权商业化平台。ByteDance 在这方面领先。
工具与工作流
@simonw:用 Claude Code 将 Moebius 图像定位模型移植到 ONNX 以在浏览器中完全运行
我今天的并行 Agent 副项目是让 Claude Code 将新的 Moebius 图像定位模型移植到 ONNX,以便完全在浏览器中运行。
关键词
#ClaudeTag #AgentInfra #PrimeRL #MistralOCR #GLM5_2 #OpenAI #AppleContainer #FastContext
数据来源: smol.ai, X/Twitter (twitterapi.io) | 生成时间: 2026-06-24 08:00


