深度专题 FEATURES — 3
R-hat 拆开算,代价有多大?
split R-hat 更敏感,却可能让在线 MCMC 多跑近一倍:代价藏在拆链后的链数里。
最优方案,可能只是运气最好
从一堆带噪估值里挑冠军,往往也挑中了最走运的误差,决策价值因此容易被高估。
Meta 的 AI 存储扩容蓝图
Meta 重构 AI 存储栈:减少 GPU 等数据,也让跨区域研究迭代更快。
速览 BRIEFS — 8
NEWS
内存才是数据工程的新瓶颈
30GB 数据塞不进单机内存时,先选对执行方式,再考虑加机器。
NEWS
空间机器学习别再随机切数据
空间数据随机切分容易让指标虚高,验证方式应跟真实预测区域对齐。
PAPER
群体互动实验该怎样做推断
随机分组后组员彼此影响,怎样估计因果效应并选对标准误?
PAPER
异质性效应不只看子群
把效应差异改写成人群构成问题,更直观地判断结论能否迁移。
PAPER
外部对照不是拿来就能合并
外部对照能补样本,但先要判断哪些数据值得借、该借多少。
NEWS
图表洞察也进入智能体流水线
AI 智能体开始串联取数、制图与解释,分析自动化也把校验和问责推到台前。
NEWS
RAG 输出应先变成可校验契约
把 RAG 答案变成带类型、引用和状态字段的契约,让下游真正可解析、可测试。
PAPER
预测模型值不值得继续外部验证
把“还要验证多少样本”改写成收益与成本的决策题