性能优化 :: 标签

性能优化 :: 标签 :: x7peepshttps://x7peeps.com/tags/%E6%80%A7%E8%83%BD%E4%BC%98%E5%8C%96/index.htmlHugozh-CNFri, 03 Jul 2026 07:21:56 +0000LLM 应用性能工程：Token 优化、语义缓存与延迟调优https://x7peeps.com/AI/06-AI%E5%B7%A5%E7%A8%8B%E5%8C%96/LLM%E5%BA%94%E7%94%A8%E6%80%A7%E8%83%BD%E5%B7%A5%E7%A8%8BToken%E4%BC%98%E5%8C%96%E8%AF%AD%E4%B9%89%E7%BC%93%E5%AD%98%E4%B8%8E%E5%BB%B6%E8%BF%9F%E8%B0%83%E4%BC%98/index.htmlFri, 03 Jul 2026 07:21:56 +0000https://x7peeps.com/AI/06-AI%E5%B7%A5%E7%A8%8B%E5%8C%96/LLM%E5%BA%94%E7%94%A8%E6%80%A7%E8%83%BD%E5%B7%A5%E7%A8%8BToken%E4%BC%98%E5%8C%96%E8%AF%AD%E4%B9%89%E7%BC%93%E5%AD%98%E4%B8%8E%E5%BB%B6%E8%BF%9F%E8%B0%83%E4%BC%98/index.htmlLLM 应用性能工程：Token 优化、语义缓存与延迟调优当 LLM 应用从原型走向生产环境，性能问题会以最直接的方式暴露出来——Token 成本随用户量线性增长、首 Token 响应时间让用户失去耐心、高并发场景下 API 限流导致大量请求失败。这些不是边缘问题，而是决定 LLM 应用能否商业化的核心瓶颈。