课程大纲
课程大纲系列主页
学习进度已完成 0/19

常见问题

入门进行中

开课前,这门课最常被问到的几个问题集中放这儿。先弄清楚值不值得学、自己适不适合,再决定要不要投入十几周。

为什么要自己学

现在 Codex、Claude 都能写代码了,为什么还要自己学?

这门课本来就教你用它们,我自己天天用。但 AI 写得出,不等于你驾驭得了。让它整一个 Computer Use Agent,跑起来照样被网站拦、坐标点偏、跑一半崩——不懂原理,你连问题出在哪、该让 AI 怎么改都说不清,只能干等。AI 负责把代码敲出来,你得是那个定方向、拆任务、判断它做得对不对的人。越是谁都能让 AI 生成代码,这份判断力越值钱。这门课练的就是它,让你指挥得动 AI,别反过来被它牵着走。

都有 Browser-use、官方 demo 了,为什么还要自己造?

会用和会造是两回事。用现成的,出错你只能干等;框架一换又得从头学。自己把原理写通一遍,再出问题知道动哪、新框架几分钟看懂。课程里也用 Browser-use、也走读官方方案,目的是让你判断什么时候用现成的、什么时候自己写。

都有 OpenClaw、Hermes Agent 这些开源框架了,为什么还要自己学着造?

这俩都是好框架,课里也会带你读它们的源码。但装好就能跑,和搞懂它凭什么能跑,差着一整门课。差距都在出问题之后——这类框架默认权限大、缺沙箱隔离,效果又高度吃背后的模型,不懂底层碰上就只能干等。这门课第一周先搭隔离沙箱,后面专门讲反检测和稳定性,补的正好是它们的软肋。学完你能上手,也能判断什么时候直接拿现成的、什么时候自己写。

适合谁、要投入多少

完全没写过代码,能跟下来吗?

能,这门课就是从零起步的。前三周专门补 Python 和环境,只教做 Agent 用得上的那部分,不铺开讲一整本书。前提是你愿意每周稳定花 8–10 小时动手、按时交作业。想纯听个热闹、不动手的,跟不下来。

已经是开发者,会不会太基础、浪费时间?

前三周的 Python 速成你可以快进。这门课的重头在后面——自己实现 Computer Use 的核心循环(W10)、浏览器和桌面的反检测与稳定性(W7/W14)、工程化全套(W15)。这些就算写了多年代码,大概率也没系统做过。

每周到底要花多少时间?

每周 8–10 小时,看视频加动手做作业。低于这个投入,作业大概率交不出来,后面会越落越多。真抽不出时间,建议按自己的节奏慢慢来,别赶。

对电脑有什么要求?

Mac、Windows 都行,课程本来就讲跨平台,Linux 也覆盖。配置上,内存建议 16G(8G 能跑前期大部分内容,到后面 Windows 沙箱、多环境一起开会有点吃力),硬盘给 Docker 镜像和环境留出 40G 左右。Windows 上想用系统自带的沙箱要专业版或企业版,家庭版用 Docker 方案替代,照样能跟。配置实在不够,后面也能上云环境。

课程内容和边界

学完能做出什么?

一个你自己写的、会看屏幕、自己决定下一步、还能在真实任务里跑稳的 Agent。外加一个逐周累积的完整代码仓库、一套能套用的脚本和提示词模板、一个能写进简历的实战项目。

用什么编程语言?

Python。前两三周从零补,只补做 Agent 用得上的,不展开讲用不上的。

要用付费的大模型 API 吗?大概多少钱?

要,核心就是接大模型、让 Agent 看着屏幕自己决策。练习阶段用国产模型就够便宜——拿 DeepSeek 当前价算(输入约 1 元、输出约 2 元每百万 token),跑通一个任务也就几分钱,照着课程练一整周,多数人也就花几块到十几块。真换成带视觉、能跑完整 Computer Use 的模型(比如 Claude),单价会高一截,所以课里专门留了一节讲成本控制,靠截图压缩、对话历史裁剪把账压下来。

反检测那部分,合法吗?会教灰色的东西吗?

W7 和 W14 两节开篇都先把法律和道德边界讲清楚,只在合法场景里讲怎么让脚本跑得稳、少被误拦。不教打码平台这类灰色服务,也不碰别人明令禁止的目标。

微信消息助理那个案例,会不会被封号?

会,所以把它当技术演示讲,并讲清边界。微信个人号自动化违反平台规范、有封号风险;真要上生产,建议走企业微信的官方接口。

Computer Use 现在到底实不实用?

实话——还在早期,慢、贵、偶尔抽风。但原理和工程方法是通用的,模型还在一代代变强,这套底层能力短期不会过时。趁现在打好底子,比一直追新工具划算。

常见问题 | 资讯狗 | Zixungou