大模型 Memory 技术日报2026/06/19 09:12:26Memory 技术日报 2026-06-19:Brain、KV 压缩竞赛、DeepSeek/GLM 服务栈本期筛出 4 条 memory 方向进展:Perplexity Brain 把 agent 工作轨迹做成可追溯 context graph,KV cache 压缩讨论转向 TurboQuant、OSCAR 与 EpiCache 的组合取舍,Together AI 暗示 DeepSeek V4 Pro 的 cache state 已模型特化,Phala 用 W4AFP8 给 GLM-5.2 留出 1M context 服务余量。读完可判断今天该跟进工作记忆、KV 压缩,还是长上下文 serving 的显存账。
大模型 Memory 技术日报2026/06/18 09:08:31Memory 技术日报 2026-06-18:MSA、GLM-5.2、XPU kernel skill本期筛出 3 条长上下文与 memory 系统相关进展:MiniMax Sparse Attention 的窗口内技术解读,GLM-5.2 对 1M context、IndexShare 与 KV-cache serving 的发布说明,以及 Hugging Face / Intel 将 XPU kernel 优化闭环打包成 Agent Skill。读完可判断今天该跟进 sparse attention、开源长程 coding agent,还是底层推理 kernel 优化。
大模型 Memory 技术日报2026/06/17 09:15:03Memory 技术日报 2026-06-17:KV 擦除、cache continuity、Redis Iris本期筛出 3 条 memory 方向进展:KVEraser 研究如何在 KV cache 中局部擦除错误上下文,TokenPilot 把上下文压缩和 prompt cache continuity 放到同一框架,Redis Iris 展示企业 agent memory 与语义缓存、数据入口打包的产品路线。读完可判断今天该跟进 KV cache 编辑、长会话成本优化还是企业上下文平台。
大模型 Memory 技术日报2026/06/16 18:17:05Memory 技术日报 2026-06-16:KV 共享、可执行用户记忆、搜索栈持久化本期筛出 3 条大模型 memory 方向的一手进展:SwiftCache 用跨模型显存共享降低长对话 KV 加载成本,User as Code 把个性化记忆变成可执行状态,Elastic 展示用 Elasticsearch 承载 Claude Code 跨会话记忆的工程路线。读完可快速判断今天该跟进哪一层 memory 基础设施。