<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>质量保障 :: 标签 :: x7peeps</title><link>https://x7peeps.com/tags/%E8%B4%A8%E9%87%8F%E4%BF%9D%E9%9A%9C/index.html</link><description/><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Fri, 03 Jul 2026 07:21:56 +0000</lastBuildDate><atom:link href="https://x7peeps.com/tags/%E8%B4%A8%E9%87%8F%E4%BF%9D%E9%9A%9C/index.xml" rel="self" type="application/rss+xml"/><item><title>Agent 评测方法论：维度设计、指标体系与评测框架</title><link>https://x7peeps.com/AI/05-Agent%E8%AF%84%E6%B5%8B%E4%B8%8E%E8%B4%A8%E9%87%8F%E4%BF%9D%E9%9A%9C/Agent%E8%AF%84%E6%B5%8B%E6%96%B9%E6%B3%95%E8%AE%BA%E7%BB%B4%E5%BA%A6%E8%AE%BE%E8%AE%A1%E6%8C%87%E6%A0%87%E4%BD%93%E7%B3%BB%E4%B8%8E%E8%AF%84%E6%B5%8B%E6%A1%86%E6%9E%B6/index.html</link><pubDate>Fri, 03 Jul 2026 07:21:56 +0000</pubDate><guid>https://x7peeps.com/AI/05-Agent%E8%AF%84%E6%B5%8B%E4%B8%8E%E8%B4%A8%E9%87%8F%E4%BF%9D%E9%9A%9C/Agent%E8%AF%84%E6%B5%8B%E6%96%B9%E6%B3%95%E8%AE%BA%E7%BB%B4%E5%BA%A6%E8%AE%BE%E8%AE%A1%E6%8C%87%E6%A0%87%E4%BD%93%E7%B3%BB%E4%B8%8E%E8%AF%84%E6%B5%8B%E6%A1%86%E6%9E%B6/index.html</guid><description>为什么 Agent 评测特殊 在传统软件工程中，评测（Testing）的核心假设是确定性——相同的输入经过相同的处理路径，产生相同的输出。单元测试验证函数返回值，集成测试验证模块间的交互契约，端到端测试验证用户流程的完整性。这些测试的共同特征是：预期结果可以在测试编写时就明确确定。</description></item></channel></rss>