Blog Projects About

Back

Tags: #claude

2026年5月3日

Prompt Caching 需要留意和微操省钱点

从 KV cache 和 prefill 成本的角度重新理解 prompt caching：它不是模型有记忆，而是服务端把稳定前缀的计算结果跨请求复用。

13 min
- llm
- anthropic
- openai
- deepseek
- prompt engineering
- claude