cua
SHA-256开源计算机使用代理基础设施,提供沙箱、SDK 和基准测试,用于训练和评估能控制完整桌面的 AI 代理。
让 AI 像人一样操作电脑的开源工具箱
核心功能
- 后台驱动:在 macOS 上操作原生应用时不抢占光标和焦点,可同时工作
- 统一沙箱 API:一个接口支持 Linux/macOS/Windows/Android 的容器或虚拟机
- 内置基准测试:针对 OSWorld、ScreenSpot 等标准评估 AI 代理能力
- CuaBot 协作工具:让编码代理在独立沙箱中运行 GUI 任务,原生窗口显示
- macOS 虚拟化性能接近原生:使用苹果 Virtualization.Framework 创建和管理 macOS/Linux 虚拟机
避坑指南
- •Cua 并非通用桌面自动化工具,它专为 AI 代理场景设计,需配合 AI 模型使用。Cua Driver 目前仅支持 macOS(后台模式);Windows/Linux 沙箱需要通过虚拟机或容器运行。Cua 沙箱默认使用 QEMU 本地虚拟化,需要系统支持虚拟化技术(如 macOS 的 Hypervisor.framework、Linux 的 KVM)。CuaBot 目前处于早期阶段,仅支持部分编码代理。
适用场景
- 训练和评估计算机使用 AI 代理(如桌面操作自动化)
- 在隔离沙箱中运行 GUI 工作流(浏览器、设计工具、游戏引擎)
- 让编码助手(如 Claude Code)在虚拟桌面中执行需要点击和键盘的任务
Cua 是一个开源平台,提供构建、训练和部署计算机使用代理(AI 代理,可自主控制桌面)所需的全部工具。它支持 macOS、Linux 和 Windows,提供统一的沙箱 API(本地或云端)、后台驱动(不会抢占鼠标/键盘)、用于集成编码助手的 CLI 和 MCP 服务器(如 Claude Code),以及评估代理性能的基准测试套件。与传统的 UI 自动化工具(如 Playwright、Selenium)专注于 Web 自动化不同,Cua 专为 AI 代理设计,支持原生桌面应用、画布工具(Blender、Figma、游戏引擎)和移动手势。其独特优势:(1)在 macOS 上实现后台计算机操作,不影响用户交互;(2)一个 API 支持多种操作系统和运行环境(容器、虚拟机、云端)。
标签
快速上手
安装软件
双击下载的安装程序,按提示完成安装
安装 Cua Driver(后台驱动): /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/trycua/cua/main/libs/cua-driver/scripts/install.sh)"
安装 Cua Python 包: pip install cua
在 Python 中创建沙箱并执行操作,参考官方文档示例
- 安装 Cua Driver(后台驱动): /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/trycua/cua/main/libs/cua-driver/scripts/install.sh)"
- 安装 Cua Python 包: pip install cua
- 在 Python 中创建沙箱并执行操作,参考官方文档示例
已提供 SHA-256 校验码,下载后可自行核对文件完整性
该校验码提取自 GitHub 官方 Release 页面
SHA256 校验码
f65081a40ae8e08b324b5dbe0132041680273097d15a10e57a63bbb228a13e59该校验码提取自 GitHub Release 页面,下载后请自行核对文件完整性
本平台所有 SHA-256 校验码均提取自项目在 GitHub 官方 Release 页面发布的文件,未做任何修改。你可以通过 GitHub Releases 页面自行验证。
开源透明
查看 GitHub 源码卸载说明
卸载 Cua Python 包:执行 `pip uninstall cua`。卸载 Cua Driver:运行安装脚本时提供的卸载命令(或直接删除 /usr/local/bin/cua 相关文件)。对于 Lume 虚拟机,使用 `lume vm stop` 和 `lume vm delete`。
无额外依赖
下载后即可直接使用,无需安装其他运行环境
遇到问题?查看下方 FAQ
5 FAQs