<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>评测平台架构：自动化评测、Trace 回放与归因分析 :: x7peeps</title><link>https://x7peeps.com/AI/05-Agent%E8%AF%84%E6%B5%8B%E4%B8%8E%E8%B4%A8%E9%87%8F%E4%BF%9D%E9%9A%9C/%E8%AF%84%E6%B5%8B%E5%B9%B3%E5%8F%B0%E6%9E%B6%E6%9E%84%E8%87%AA%E5%8A%A8%E5%8C%96%E8%AF%84%E6%B5%8BTrace%E5%9B%9E%E6%94%BE%E4%B8%8E%E5%BD%92%E5%9B%A0%E5%88%86%E6%9E%90/index.html</link><description>为什么需要评测平台 在 Agent 评测方法论 中，我们建立了评测维度与指标体系的抽象框架；在 LLM-as-Judge 中，我们掌握了自动化评判的技术手段。然而，当这些方法论和工具要真正落地到生产环境中，一个系统化的评测平台是不可或缺的基础设施。</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate/><atom:link href="https://x7peeps.com/AI/05-Agent%E8%AF%84%E6%B5%8B%E4%B8%8E%E8%B4%A8%E9%87%8F%E4%BF%9D%E9%9A%9C/%E8%AF%84%E6%B5%8B%E5%B9%B3%E5%8F%B0%E6%9E%B6%E6%9E%84%E8%87%AA%E5%8A%A8%E5%8C%96%E8%AF%84%E6%B5%8BTrace%E5%9B%9E%E6%94%BE%E4%B8%8E%E5%BD%92%E5%9B%A0%E5%88%86%E6%9E%90/index.xml" rel="self" type="application/rss+xml"/></channel></rss>