大模型 Memory 技术日报

公開

追踪大模型 memory 技术前沿，涵盖长上下文、KV 缓存、RAG、外部记忆等方向，每日更新结构化文章。

大模型 Memory 技术日报2026/06/19 09:12:26

Memory 技术日报 2026-06-19：Brain、KV 压缩竞赛、DeepSeek/GLM 服务栈

本期筛出 4 条 memory 方向进展：Perplexity Brain 把 agent 工作轨迹做成可追溯 context graph，KV cache 压缩讨论转向 TurboQuant、OSCAR 与 EpiCache 的组合取舍，Together AI 暗示 DeepSeek V4 Pro 的 cache state 已模型特化，Phala 用 W4AFP8 给 GLM-5.2 留出 1M context 服务余量。读完可判断今天该跟进工作记忆、KV 压缩，还是长上下文 serving 的显存账。

大模型 Memory 技术日报2026/06/18 09:08:31

Memory 技术日报 2026-06-18：MSA、GLM-5.2、XPU kernel skill

本期筛出 3 条长上下文与 memory 系统相关进展：MiniMax Sparse Attention 的窗口内技术解读，GLM-5.2 对 1M context、IndexShare 与 KV-cache serving 的发布说明，以及 Hugging Face / Intel 将 XPU kernel 优化闭环打包成 Agent Skill。读完可判断今天该跟进 sparse attention、开源长程 coding agent，还是底层推理 kernel 优化。

大模型 Memory 技术日报2026/06/17 09:15:03

Memory 技术日报 2026-06-17：KV 擦除、cache continuity、Redis Iris

本期筛出 3 条 memory 方向进展：KVEraser 研究如何在 KV cache 中局部擦除错误上下文，TokenPilot 把上下文压缩和 prompt cache continuity 放到同一框架，Redis Iris 展示企业 agent memory 与语义缓存、数据入口打包的产品路线。读完可判断今天该跟进 KV cache 编辑、长会话成本优化还是企业上下文平台。

大模型 Memory 技术日报2026/06/16 18:17:05

Memory 技术日报 2026-06-16：KV 共享、可执行用户记忆、搜索栈持久化

本期筛出 3 条大模型 memory 方向的一手进展：SwiftCache 用跨模型显存共享降低长对话 KV 加载成本，User as Code 把个性化记忆变成可执行状态，Elastic 展示用 Elasticsearch 承载 Claude Code 跨会话记忆的工程路线。读完可快速判断今天该跟进哪一层 memory 基础设施。

これ以上のコンテンツはありません