Back
从 KV cache 和 prefill 成本的角度重新理解 prompt caching:它不是模型有记忆,而是服务端把稳定前缀的计算结果跨请求复用。
llm
anthropic
openai
deepseek
prompt engineering
claude