Claude Sonnet 5：新一代主力模型来了

Sonnet 5 把接近 Opus 的部分任务能力带到更低价位，但新 tokenizer 改变了真实成本。

深度专题 FEATURES — 2

PAPER H 15

Valdi 用单步扩散兼顾随机未来与在线规划，初步控制效果追平 MLP 基线。

PAPER H 15

FurnitureVLA让双臂机器人挑战真实尺度家具装配，用进度预测撑起最长1550步任务。

速览 BRIEFS — 9

PAPER

只训练中间一层，作者称可拿回全参数 RL 的大部分收益，甚至偶有反超。

H 1

PAPER

GSRQ 用增益—形状残差量化挑战亚比特 KV Cache，长上下文精度表现值得关注。

H 20

PAPER

ELDR 根据专家位置分配解码请求，在负载均衡之外减少 MoE 通信开销。

HF 24

PAPER

QuasiMoTTo 用更均匀的并行采样，减少测试时扩展的重复算力。

H 32

PAPER

ABot-M0.5 把底盘移动、机械臂操作与环境预测放进统一模型，缓解通用机器人的能力割裂。

H 8

PAPER

BaseRT 原生适配 Metal，作者称其刷新 Apple Silicon 本地 LLM 推理吞吐。

H 12

PAPER

量化旧 rollout 与学习率的耦合，为异步 RLHF 调参划出稳定边界

PAPER

把视频预测压进结构化 4D 潜空间，让机器人规划兼顾几何与时间。

PAPER

把预训练数据配比改写成因果估计，降低小模型方案外推到大模型时的误判。

H 28