<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>强化学习 :: 标签 :: x7peeps</title><link>https://x7peeps.com/tags/%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0/index.html</link><description/><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Fri, 03 Jul 2026 07:21:56 +0000</lastBuildDate><atom:link href="https://x7peeps.com/tags/%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0/index.xml" rel="self" type="application/rss+xml"/><item><title>如何训练一个原生 Computer Use 模型</title><link>https://x7peeps.com/AI/10-%E6%A8%A1%E5%9E%8B%E8%AE%AD%E7%BB%83/%E5%A6%82%E4%BD%95%E8%AE%AD%E7%BB%83%E4%B8%80%E4%B8%AA%E5%8E%9F%E7%94%9FComputer-Use%E6%A8%A1%E5%9E%8B/index.html</link><pubDate>Fri, 03 Jul 2026 07:21:56 +0000</pubDate><guid>https://x7peeps.com/AI/10-%E6%A8%A1%E5%9E%8B%E8%AE%AD%E7%BB%83/%E5%A6%82%E4%BD%95%E8%AE%AD%E7%BB%83%E4%B8%80%E4%B8%AA%E5%8E%9F%E7%94%9FComputer-Use%E6%A8%A1%E5%9E%8B/index.html</guid><description>Computer Use 模型的技术全景 2025 年，AI 领域出现了一个重要的范式转移：让大模型直接操控计算机界面。从 OpenAI 的 CUA（Computer-Using Agent）到 Anthropic 的 Claude Computer Use，从字节跳动的 UI-TARS 到微软的 OmniParser，各大厂商和研究机构纷纷押注这个方向。这不是简单的"截图 + OCR + 操作脚本"的工程拼凑，而是一个涉及视觉感知、语言理解、动作规划与强化学习的端到端训练问题。</description></item></channel></rss>