实战训练营 · 2026 版 · 14 周
从零到自建 Computer Use Agent
14 周,从没写过一行代码,到亲手做出一个能听懂人话、自己操作电脑的 AI Agent。
❯ 把今天的订单从后台导出,给负责人发一封带附件的邮件
[Agent] 登录公司后台,进入今日订单列表
[Agent] 筛选今天的 47 条订单,导出成 Excel
[Agent] 打开邮箱,新建邮件,收件人填负责人
[Agent] 写好正文摘要,把 Excel 拖进附件并发送
✓ 邮件已发出,共 47 条订单 / 1 个附件,用时 1 分 22 秒
你给它一句话,它看着屏幕,自己把这件事做完。这门课带你把这样一个 Agent 从零做出来。
这门课写给谁
学 AI 自动化、学 Agent 的教程网上不少,散落在各处。真正卡住人的,是没人把“从什么都不会”到“做出一个能用的东西”这中间的路接起来。东学一块、西学一块,到了要自己动手组装的时候发现接不上,慢慢也就放下了。
这门课适合想认真把 AI 自动化学下来的人。前提是你愿意每周稳定投入 8 到 10 小时,也接受这是一件要动手、要交作业的事。想三天速成,或者只想听个大概、不打算自己动手,这门课帮不上忙。
市面上的同类课,大多缺这几块
Computer Use 这一两年突然热起来,跟着出来的课程、教程也多了。我们把市面上能找到的看了一轮,发现大家都集中在差不多的地方,真正硬的几块反而少有人讲。这门课要补的,正是这些。
多是“用”,不是“造”
教你开 Claude 的 Computer Use、跑官方 Docker demo、写 Prompt
这一类内容学完,你顶多是会用一个现成的工具。哪天工具改了,或者要做一个不一样的东西,就接不上。课程会让你从零手写一遍核心循环,把每一层为什么这么设计搞清楚。
底层 GUI 控制没人系统讲
pyautogui 和 UI Automation(uiautomation / pywinauto)的结合,什么时候用元素定位、什么时候用视觉
大部分教程要么只讲 pyautogui,要么只讲视觉。真到了写一个稳定脚本的时候,你需要根据界面情况自己切换。课程会把两条路线和切换时机都讲透。
几乎不讲沙箱与安全
Windows Sandbox + Hyper-V + Docker 在 Computer Use 里的实际部署和生产注意事项
让一个 Agent 替你点鼠标,等于把电脑的钥匙交给它。这一块,这门课花的力气最重。从隔离方案怎么选,到生产环境里要踩的坑,会一项一项讲。
跨平台和工程化薄弱
Linux + Windows 混合路由、生产级错误处理、轨迹记录
现有内容大多只讲一个平台,要么 macOS 的 Claude Desktop,要么 Linux 的 Docker。真要把 Agent 用到自己业务上,你会同时面对几台系统、几条调用链路。这些工程细节,课程里会按一等公民来讲。
和多 Agent 的结合几乎没人做
把 Computer Use 做成多 Agent 系统里的一个 Worker,跟其他 Agent 分工协作
现实里的任务很少是“一个 Agent 从头干到尾”,更多是几个 Agent 分工协作。把 Computer Use 当成其中一个角色塞进去,这种实战经验在公开课程里非常少。这门课会带你完整做一遍。
挑课的时候,可以拿这五条去对一对你手上那门,看它能不能一条条讲明白。下一节直接把市面上能找到的几类课摆出来,你可以对着看。
对照一下现在能找到的几类课
上一节的五条是大方向判断,这一段把现在能找到的几类课原样列出来,各有各的好处,你也能直接对一对。
| 课程 / 平台 | 它在教什么 | 它的优势 | 它的短板 | 课里怎么讲 |
|---|---|---|---|---|
| DeepLearning.AI《Building Toward Computer Use with Anthropic》Colt Steele 主讲 · 官方短课程 | 过一遍 Anthropic API、Tool Use、Multimodal,讲清 Computer Use 的原理,再跑一个简单 demo | 理论讲得扎实,讲解清晰,有官方背书 | 只讲怎么用官方能力,不教你自己实现 GUI 控制,几乎不涉及沙箱和生产实践 | 从零手写一遍核心循环,沙箱和生产部署都讲透 |
| YouTube 上各种《Claude Computer Use 教程》免费 Setup + Docker Demo 视频 | 教你怎么把 Claude Computer Use 开起来、跑官方 Docker、写简单 prompt | 入门快,视觉演示多 | 内容浅、重复度高,基本不讲底层原理和自己实现,安全和工程化几乎没人讲 | 底层原理、自己实现、安全工程化,一项一项铺开 |
| Pluralsight / LinkedIn Learning(Computer Use Snapshot)付费短课程 | 快速过一遍 Computer Use,再带一个简单 workflow 示例 | 结构清晰,适合快速上手 | 比较浅,属于“快照”级别,不涉及自实现,也不讲 Windows 方案 | 14 周完整展开,加上 Windows 沙箱和跨平台 |
| 国内 RPA + AI 类课程影刀 RPA、UiPath、实在学院 等 · 工具类付费课程 | 教你用某一款 RPA 工具,再补一点 AI 能力(智能元素、魔法指令这一类) | 偏企业实用,流程规范,案例多 | 强绑定特定工具,核心逻辑自己实现不了,对 LLM Computer Use 理解较浅,沙箱和跨平台都弱 | 不依赖任何特定 RPA 工具,核心逻辑你自己造 |
| LangGraph / CrewAI 类 AI Agent 全栈课程YouTube 长视频 + 付费平台 · 框架类课程 | 讲 Agent 架构、LangGraph 状态机、多 Agent 协作 | 框架现代,工程化做得不错 | 很少碰桌面 GUI 层(pyautogui、UIA),沙箱和真实桌面控制几乎不讲 | 桌面 GUI 层和沙箱都补齐,再把多 Agent 串起来 |
最接近的是 DeepLearning.AI 那门官方课,它教的是怎么更好地用 Anthropic 的 Computer Use,自己从头造一套不在它的范围里。YouTube 内容最多,质量参差,大部分停在“跑通 demo”这一层。传统 RPA 课程和通用 Agent 框架各占一半市场,但没人把底层 GUI 控制、LLM 视觉 Agent、安全沙箱、跨平台生产实践这一套完整讲过。这门课的 14 周,就是奔着把这一套完整跑下来去。
你会走过的路
整门课 14 到 16 周,核心视频约 60 小时。第一周会带你把开发环境搭起来——陪跑版可以直接用我们配好的云环境,打开浏览器就能跟着敲。
开营与全景
第一周先过一遍你期末要做出的成品,也把 Computer Use 这类技术今天能做什么、不能做什么讲清楚。这一周结束,你手里会有一张看懂全程的课程地图,和一张自己的项目草图。
Python 速成
Python 只学做 Agent 用得到的部分,边学边做。第 3 周左右,你会写出第一个能演示的脚本,自动整理文件、生成报告。
版本管理
从写出第一个能跑的脚本起,就带你用上 Git——提交、回滚、开分支、连 GitHub。往后每一周的代码都进同一个仓库,出了问题随时退回上一个能跑的版本,到结业时,这个仓库就是你一路做下来的实战成果。
给 Agent 装上“手”
桌面控制和浏览器控制,让程序能替你点鼠标、敲键盘、填表单。这一段结束,你能写出一个跨网页和桌面的多步任务脚本。
装上“眼睛”和“脑子”
接入多模态大模型,让程序看得懂屏幕截图、自己判断下一步该点哪里。做完,你会有一个看一眼截图就知道怎么操作的小程序。
把 Agent 组装起来
先用 50 到 100 行代码手写一遍核心循环,把每一层都搞明白;再用框架重写一遍,对比两者的差别。补上记忆、错误恢复、安全隔离。这一段走完,你手里有一个完整的、能跑的 Computer Use Agent。
落到你自己的任务
把 Agent 用到一件你自己的真实任务上,做成一个实战项目和一段演示视频。
整条线设计成每隔三四周就有一个能拿出去演示的产出。零基础学员很容易卡在“学了一个月还没做出任何东西”,这套节奏就是来对付这一点的。
关于“学完到什么程度”
这门课结束时,你能用框架组装出一个 Computer Use Agent,也讲得清它每一层为什么这么设计。课程里专门留了“手写核心循环”那一段,先手写过一遍,你才会真懂这个循环每一步在做什么,往后用框架也改得动。
还有几句实话先讲在前面。Computer Use 这类技术现在不便宜、不算快,也不是每次都稳,它每走一步都要调一次大模型。课程会专门讲清楚什么任务适合交给 Agent、什么任务老老实实写一个确定性脚本更划算。这门课教的是技术和判断力,不承诺你学完就能接单赚钱,也不承诺你做出来的东西能直接商用。预期摆正了,学起来反而踏实。
两位讲师
九目
15 年全栈开发,做过 AI 产品,也做过不少独立项目。课程主线怎么排、方向怎么判断、哪些该学哪些不用学,由他把关。
Eunice
安卓逆向、Web 协议、Web3,是他常年在做的几个方向。专长是把没有文档的系统摸透、让程序稳定地驱动它。课程里偏硬核的自动化、接口对接、让 Agent 在真实环境里跑得稳的部分,由他来讲。
三个版本
三个版本的课程内容完全一样,区别只在有没有人带、有没有人改你的作业和项目。
预售 7 折 / 满 20 人开班后恢复原价。
挑哪个版本,问自己一个问题就够了,你一个人能不能扛住把 14 周走完。能,自学版够用;想有人盯着、卡住了有人答、不容易半路弃课,选训练营版;手上已经有个明确的项目想落地,选陪跑版。
你会拿到什么
课程最终要给你的,是一身能继续往前走的能力。这门课结束的时候,你大致能做到这几件事——
从零开发一个属于你自己的自动化 Agent,不依赖任何特定平台
看懂大部分自动化场景该怎么拆,知道哪一步交给 Agent、哪一步老老实实写脚本
对 AI 怎么“看屏幕、做判断、调工具”有自己的一手感觉,不止停在“会写提示词”这一步
AI 圈每隔几周冒出来的新东西,你能花几分钟扫一眼,大致摸清原理,判断要不要花时间深入
看得见的东西也有几样——从第一周建到最后一周的完整代码仓库、一套能直接套用的脚本和提示词模板、一个能写进简历的实战项目,以及结业证书。课程内容按期更新,新模型、新框架出来,后面的期次会补进去,老学员可以回看。
常见问题
真的零基础也能学吗?
可以。课程默认你没写过代码,从 Python 速成开始。唯一的前提是你愿意每周稳定投入 8 到 10 小时,跟着动手敲。
云环境是什么意思?
云环境是陪跑版的权益:我们配好一套云端环境,陪跑版学员打开浏览器就能跟着敲,不用在自己电脑上装 Python、配依赖。自学版和训练营版在自己电脑上搭环境,第一周会带你一步步弄好,也提供搭建文档和排错支持。
学完到底能做什么?
你会有一个能跑的 Computer Use Agent,理解它的原理,也能把它改造到自己的任务上。能不能靠它赚钱,要看你后面怎么用,这门课不替你打包票。
都有 OpenClaw、Hermes Agent 了,为什么不直接用现成的?
这俩都是好框架,课里也会带你读它们的源码。但装好就能跑,和搞懂它凭什么能跑,差着一整门课。差距都在出问题之后——这类框架默认权限大、缺沙箱隔离,效果又高度吃背后的模型,不懂底层碰上就只能干等。这门课第一周先搭隔离沙箱,后面专门讲反检测和稳定性,补的正好是它们的软肋。学完你能上手,也能判断什么时候直接拿现成的、什么时候自己写。
要花多久学完?
训练营版按 14 到 16 周的节奏走。自学版没有时间限制,不过还是建议照着这个节奏,不然容易拖着拖着就放弃。
课程费之外还要花钱吗?
有一笔:Agent 调用的大模型 API 按用量付费,需要你自己准备 API key,这部分不包含在课程费里。课程会教你怎么把调用成本压下来。
陪跑版的外包对接,具体怎么算?
结业后 1 年内,我们会给你对接外包项目,报价合计不低于你支付的学费 ¥3999。价格不用你一个人跟需求方拉扯,我们会和你一起商讨,定一个合理的数。具体能不能接到、做不做成,看你的判断和交付。
报名
想报名,直接加微信聊。名额、选哪个版本、课程相关的问题,都可以先问清楚再决定。
- 满 20 人开班
- 开班后 1 周内,上线第一篇视频教程
- 人数不够 20 人,已付费的全额退款
- 付费后 3 天内,无理由退款