CUA-2026 · 招生中

实战训练营 · 2026 版 · 14 周

从零到自建 Computer Use Agent

14 周,从没写过一行代码,到亲手做出一个能听懂人话、自己操作电脑的 AI Agent。

14 周
训练营周期
约 60 小时
核心视频
零基础
起步要求
agent — demo

把今天的订单从后台导出,给负责人发一封带附件的邮件

[Agent] 登录公司后台,进入今日订单列表

[Agent] 筛选今天的 47 条订单,导出成 Excel

[Agent] 打开邮箱,新建邮件,收件人填负责人

[Agent] 写好正文摘要,把 Excel 拖进附件并发送

邮件已发出,共 47 条订单 / 1 个附件,用时 1 分 22 秒

你给它一句话,它看着屏幕,自己把这件事做完。这门课带你把这样一个 Agent 从零做出来。

Audience

这门课写给谁

学 AI 自动化、学 Agent 的教程网上不少,散落在各处。真正卡住人的,是没人把“从什么都不会”到“做出一个能用的东西”这中间的路接起来。东学一块、西学一块,到了要自己动手组装的时候发现接不上,慢慢也就放下了。

这门课适合想认真把 AI 自动化学下来的人。前提是你愿意每周稳定投入 8 到 10 小时,也接受这是一件要动手、要交作业的事。想三天速成,或者只想听个大概、不打算自己动手,这门课帮不上忙。

Gaps

市面上的同类课,大多缺这几块

Computer Use 这一两年突然热起来,跟着出来的课程、教程也多了。我们把市面上能找到的看了一轮,发现大家都集中在差不多的地方,真正硬的几块反而少有人讲。这门课要补的,正是这些。

缺口 01

多是“用”,不是“造”

教你开 Claude 的 Computer Use、跑官方 Docker demo、写 Prompt

这一类内容学完,你顶多是会用一个现成的工具。哪天工具改了,或者要做一个不一样的东西,就接不上。课程会让你从零手写一遍核心循环,把每一层为什么这么设计搞清楚。

缺口 02

底层 GUI 控制没人系统讲

pyautogui 和 UI Automation(uiautomation / pywinauto)的结合,什么时候用元素定位、什么时候用视觉

大部分教程要么只讲 pyautogui,要么只讲视觉。真到了写一个稳定脚本的时候,你需要根据界面情况自己切换。课程会把两条路线和切换时机都讲透。

缺口 03

几乎不讲沙箱与安全

Windows Sandbox + Hyper-V + Docker 在 Computer Use 里的实际部署和生产注意事项

让一个 Agent 替你点鼠标,等于把电脑的钥匙交给它。这一块,这门课花的力气最重。从隔离方案怎么选,到生产环境里要踩的坑,会一项一项讲。

缺口 04

跨平台和工程化薄弱

Linux + Windows 混合路由、生产级错误处理、轨迹记录

现有内容大多只讲一个平台,要么 macOS 的 Claude Desktop,要么 Linux 的 Docker。真要把 Agent 用到自己业务上,你会同时面对几台系统、几条调用链路。这些工程细节,课程里会按一等公民来讲。

缺口 05

和多 Agent 的结合几乎没人做

把 Computer Use 做成多 Agent 系统里的一个 Worker,跟其他 Agent 分工协作

现实里的任务很少是“一个 Agent 从头干到尾”,更多是几个 Agent 分工协作。把 Computer Use 当成其中一个角色塞进去,这种实战经验在公开课程里非常少。这门课会带你完整做一遍。

挑课的时候,可以拿这五条去对一对你手上那门,看它能不能一条条讲明白。下一节直接把市面上能找到的几类课摆出来,你可以对着看。

Compare

对照一下现在能找到的几类课

上一节的五条是大方向判断,这一段把现在能找到的几类课原样列出来,各有各的好处,你也能直接对一对。

课程 / 平台它在教什么它的优势它的短板课里怎么讲
DeepLearning.AI《Building Toward Computer Use with Anthropic》Colt Steele 主讲 · 官方短课程过一遍 Anthropic API、Tool Use、Multimodal,讲清 Computer Use 的原理,再跑一个简单 demo理论讲得扎实,讲解清晰,有官方背书只讲怎么用官方能力,不教你自己实现 GUI 控制,几乎不涉及沙箱和生产实践从零手写一遍核心循环,沙箱和生产部署都讲透
YouTube 上各种《Claude Computer Use 教程》免费 Setup + Docker Demo 视频教你怎么把 Claude Computer Use 开起来、跑官方 Docker、写简单 prompt入门快,视觉演示多内容浅、重复度高,基本不讲底层原理和自己实现,安全和工程化几乎没人讲底层原理、自己实现、安全工程化,一项一项铺开
Pluralsight / LinkedIn Learning(Computer Use Snapshot)付费短课程快速过一遍 Computer Use,再带一个简单 workflow 示例结构清晰,适合快速上手比较浅,属于“快照”级别,不涉及自实现,也不讲 Windows 方案14 周完整展开,加上 Windows 沙箱和跨平台
国内 RPA + AI 类课程影刀 RPA、UiPath、实在学院 等 · 工具类付费课程教你用某一款 RPA 工具,再补一点 AI 能力(智能元素、魔法指令这一类)偏企业实用,流程规范,案例多强绑定特定工具,核心逻辑自己实现不了,对 LLM Computer Use 理解较浅,沙箱和跨平台都弱不依赖任何特定 RPA 工具,核心逻辑你自己造
LangGraph / CrewAI 类 AI Agent 全栈课程YouTube 长视频 + 付费平台 · 框架类课程讲 Agent 架构、LangGraph 状态机、多 Agent 协作框架现代,工程化做得不错很少碰桌面 GUI 层(pyautogui、UIA),沙箱和真实桌面控制几乎不讲桌面 GUI 层和沙箱都补齐,再把多 Agent 串起来

最接近的是 DeepLearning.AI 那门官方课,它教的是怎么更好地用 Anthropic 的 Computer Use,自己从头造一套不在它的范围里。YouTube 内容最多,质量参差,大部分停在“跑通 demo”这一层。传统 RPA 课程和通用 Agent 框架各占一半市场,但没人把底层 GUI 控制、LLM 视觉 Agent、安全沙箱、跨平台生产实践这一套完整讲过。这门课的 14 周,就是奔着把这一套完整跑下来去。

Roadmap

你会走过的路

整门课 14 到 16 周,核心视频约 60 小时。第一周会带你把开发环境搭起来——陪跑版可以直接用我们配好的云环境,打开浏览器就能跟着敲。

第 1 周

开营与全景

第一周先过一遍你期末要做出的成品,也把 Computer Use 这类技术今天能做什么、不能做什么讲清楚。这一周结束,你手里会有一张看懂全程的课程地图,和一张自己的项目草图。

第 2–4 周

Python 速成

Python 只学做 Agent 用得到的部分,边学边做。第 3 周左右,你会写出第一个能演示的脚本,自动整理文件、生成报告。

贯穿全程

版本管理

从写出第一个能跑的脚本起,就带你用上 Git——提交、回滚、开分支、连 GitHub。往后每一周的代码都进同一个仓库,出了问题随时退回上一个能跑的版本,到结业时,这个仓库就是你一路做下来的实战成果。

第 5–7 周

给 Agent 装上“手”

桌面控制和浏览器控制,让程序能替你点鼠标、敲键盘、填表单。这一段结束,你能写出一个跨网页和桌面的多步任务脚本。

第 8–10 周

装上“眼睛”和“脑子”

接入多模态大模型,让程序看得懂屏幕截图、自己判断下一步该点哪里。做完,你会有一个看一眼截图就知道怎么操作的小程序。

第 11–14 周

把 Agent 组装起来

先用 50 到 100 行代码手写一遍核心循环,把每一层都搞明白;再用框架重写一遍,对比两者的差别。补上记忆、错误恢复、安全隔离。这一段走完,你手里有一个完整的、能跑的 Computer Use Agent。

第 15–16 周

落到你自己的任务

把 Agent 用到一件你自己的真实任务上,做成一个实战项目和一段演示视频。

整条线设计成每隔三四周就有一个能拿出去演示的产出。零基础学员很容易卡在“学了一个月还没做出任何东西”,这套节奏就是来对付这一点的。

想看完整 16 周课程表
每周主题 · 学员产出物 · 配套资源
Reality check

关于“学完到什么程度”

这门课结束时,你能用框架组装出一个 Computer Use Agent,也讲得清它每一层为什么这么设计。课程里专门留了“手写核心循环”那一段,先手写过一遍,你才会真懂这个循环每一步在做什么,往后用框架也改得动。

还有几句实话先讲在前面。Computer Use 这类技术现在不便宜、不算快,也不是每次都稳,它每走一步都要调一次大模型。课程会专门讲清楚什么任务适合交给 Agent、什么任务老老实实写一个确定性脚本更划算。这门课教的是技术和判断力,不承诺你学完就能接单赚钱,也不承诺你做出来的东西能直接商用。预期摆正了,学起来反而踏实。

Instructors

两位讲师

01课程设计 · 方向把关

九目

15 年全栈开发,做过 AI 产品,也做过不少独立项目。课程主线怎么排、方向怎么判断、哪些该学哪些不用学,由他把关。

02自动化 · 工程攻坚

Eunice

安卓逆向、Web 协议、Web3,是他常年在做的几个方向。专长是把没有文档的系统摸透、让程序稳定地驱动它。课程里偏硬核的自动化、接口对接、让 Agent 在真实环境里跑得稳的部分,由他来讲。

Pricing

三个版本

三个版本的课程内容完全一样,区别只在有没有人带、有没有人改你的作业和项目。

预售 7 折 / 满 20 人开班后恢复原价。

自学

自学版

¥799¥1100
  • 全套约 60 小时录播
  • 逐周搭建的代码仓库
  • 模板与提示词库
  • 学员社群
选这个版本
主力版本

训练营版

¥2299¥3300
  • 自学版的全部内容
  • 固定开营、14 周带打卡
  • 作业批改、阶段项目点评
  • 讲师答疑(承诺 24 小时内回复)
  • 结业实战项目与证书
选这个版本
陪跑

陪跑版

¥3999¥5700
  • 训练营版的全部内容
  • 配好的云端环境,打开浏览器即用
  • 针对你项目方向的一对一定期指导
  • 代码深度点评
  • 结业 1 年内对接外包项目,报价合计不低于学费
  • 名额有限
选这个版本

挑哪个版本,问自己一个问题就够了,你一个人能不能扛住把 14 周走完。能,自学版够用;想有人盯着、卡住了有人答、不容易半路弃课,选训练营版;手上已经有个明确的项目想落地,选陪跑版

Outcomes

你会拿到什么

课程最终要给你的,是一身能继续往前走的能力。这门课结束的时候,你大致能做到这几件事——

01

从零开发一个属于你自己的自动化 Agent,不依赖任何特定平台

02

看懂大部分自动化场景该怎么拆,知道哪一步交给 Agent、哪一步老老实实写脚本

03

对 AI 怎么“看屏幕、做判断、调工具”有自己的一手感觉,不止停在“会写提示词”这一步

04

AI 圈每隔几周冒出来的新东西,你能花几分钟扫一眼,大致摸清原理,判断要不要花时间深入

看得见的东西也有几样——从第一周建到最后一周的完整代码仓库、一套能直接套用的脚本和提示词模板、一个能写进简历的实战项目,以及结业证书。课程内容按期更新,新模型、新框架出来,后面的期次会补进去,老学员可以回看。

FAQ

常见问题

真的零基础也能学吗?

可以。课程默认你没写过代码,从 Python 速成开始。唯一的前提是你愿意每周稳定投入 8 到 10 小时,跟着动手敲。

云环境是什么意思?

云环境是陪跑版的权益:我们配好一套云端环境,陪跑版学员打开浏览器就能跟着敲,不用在自己电脑上装 Python、配依赖。自学版和训练营版在自己电脑上搭环境,第一周会带你一步步弄好,也提供搭建文档和排错支持。

学完到底能做什么?

你会有一个能跑的 Computer Use Agent,理解它的原理,也能把它改造到自己的任务上。能不能靠它赚钱,要看你后面怎么用,这门课不替你打包票。

都有 OpenClaw、Hermes Agent 了,为什么不直接用现成的?

这俩都是好框架,课里也会带你读它们的源码。但装好就能跑,和搞懂它凭什么能跑,差着一整门课。差距都在出问题之后——这类框架默认权限大、缺沙箱隔离,效果又高度吃背后的模型,不懂底层碰上就只能干等。这门课第一周先搭隔离沙箱,后面专门讲反检测和稳定性,补的正好是它们的软肋。学完你能上手,也能判断什么时候直接拿现成的、什么时候自己写。

要花多久学完?

训练营版按 14 到 16 周的节奏走。自学版没有时间限制,不过还是建议照着这个节奏,不然容易拖着拖着就放弃。

课程费之外还要花钱吗?

有一笔:Agent 调用的大模型 API 按用量付费,需要你自己准备 API key,这部分不包含在课程费里。课程会教你怎么把调用成本压下来。

陪跑版的外包对接,具体怎么算?

结业后 1 年内,我们会给你对接外包项目,报价合计不低于你支付的学费 ¥3999。价格不用你一个人跟需求方拉扯,我们会和你一起商讨,定一个合理的数。具体能不能接到、做不做成,看你的判断和交付。

报名

想报名,直接加微信聊。名额、选哪个版本、课程相关的问题,都可以先问清楚再决定。

课程微信
jiumu404
开班与退款
  • 满 20 人开班
  • 开班后 1 周内,上线第一篇视频教程
  • 人数不够 20 人,已付费的全额退款
  • 付费后 3 天内,无理由退款
从零到自建 Computer Use Agent · 14 周实战训练营 | 资讯狗 | Zixungou