常见问题 | 资讯狗

开课前，这门课最常被问到的几个问题集中放这儿。先弄清楚值不值得学、自己适不适合，再决定要不要投入十几周。

为什么要自己学

现在 Codex、Claude 都能写代码了，为什么还要自己学？

这门课本来就教你用它们，我自己天天用。但 AI 写得出，不等于你驾驭得了。让它整一个 Computer Use Agent，跑起来照样被网站拦、坐标点偏、跑一半崩——不懂原理，你连问题出在哪、该让 AI 怎么改都说不清，只能干等。AI 负责把代码敲出来，你得是那个定方向、拆任务、判断它做得对不对的人。越是谁都能让 AI 生成代码，这份判断力越值钱。这门课练的就是它，让你指挥得动 AI，别反过来被它牵着走。

都有 Browser-use、官方 demo 了，为什么还要自己造？

会用和会造是两回事。用现成的，出错你只能干等；框架一换又得从头学。自己把原理写通一遍，再出问题知道动哪、新框架几分钟看懂。课程里也用 Browser-use、也走读官方方案，目的是让你判断什么时候用现成的、什么时候自己写。

都有 OpenClaw、Hermes Agent 这些开源框架了，为什么还要自己学着造？

这俩都是好框架，课里也会带你读它们的源码。但装好就能跑，和搞懂它凭什么能跑，差着一整门课。差距都在出问题之后——这类框架默认权限大、缺沙箱隔离，效果又高度吃背后的模型，不懂底层碰上就只能干等。这门课第一周先搭隔离沙箱，后面专门讲反检测和稳定性，补的正好是它们的软肋。学完你能上手，也能判断什么时候直接拿现成的、什么时候自己写。

适合谁、要投入多少

完全没写过代码，能跟下来吗？

能，这门课就是从零起步的。前三周专门补 Python 和环境，只教做 Agent 用得上的那部分，不铺开讲一整本书。前提是你愿意每周稳定花 8–10 小时动手、按时交作业。想纯听个热闹、不动手的，跟不下来。

已经是开发者，会不会太基础、浪费时间？

前三周的 Python 速成你可以快进。这门课的重头在后面——自己实现 Computer Use 的核心循环（W10）、浏览器和桌面的反检测与稳定性（W7/W14）、工程化全套（W15）。这些就算写了多年代码，大概率也没系统做过。

每周到底要花多少时间？

每周 8–10 小时，看视频加动手做作业。低于这个投入，作业大概率交不出来，后面会越落越多。真抽不出时间，建议按自己的节奏慢慢来，别赶。

对电脑有什么要求？

Mac、Windows 都行，课程本来就讲跨平台，Linux 也覆盖。配置上，内存建议 16G（8G 能跑前期大部分内容，到后面 Windows 沙箱、多环境一起开会有点吃力），硬盘给 Docker 镜像和环境留出 40G 左右。Windows 上想用系统自带的沙箱要专业版或企业版，家庭版用 Docker 方案替代，照样能跟。配置实在不够，后面也能上云环境。

课程内容和边界

学完能做出什么？

一个你自己写的、会看屏幕、自己决定下一步、还能在真实任务里跑稳的 Agent。外加一个逐周累积的完整代码仓库、一套能套用的脚本和提示词模板、一个能写进简历的实战项目。

用什么编程语言？

Python。前两三周从零补，只补做 Agent 用得上的，不展开讲用不上的。

要用付费的大模型 API 吗？大概多少钱？

要，核心就是接大模型、让 Agent 看着屏幕自己决策。练习阶段用国产模型就够便宜——拿 DeepSeek 当前价算（输入约 1 元、输出约 2 元每百万 token），跑通一个任务也就几分钱，照着课程练一整周，多数人也就花几块到十几块。真换成带视觉、能跑完整 Computer Use 的模型（比如 Claude），单价会高一截，所以课里专门留了一节讲成本控制，靠截图压缩、对话历史裁剪把账压下来。

反检测那部分，合法吗？会教灰色的东西吗？

W7 和 W14 两节开篇都先把法律和道德边界讲清楚，只在合法场景里讲怎么让脚本跑得稳、少被误拦。不教打码平台这类灰色服务，也不碰别人明令禁止的目标。

微信消息助理那个案例，会不会被封号？

会，所以把它当技术演示讲，并讲清边界。微信个人号自动化违反平台规范、有封号风险；真要上生产，建议走企业微信的官方接口。

Computer Use 现在到底实不实用？

实话——还在早期，慢、贵、偶尔抽风。但原理和工程方法是通用的，模型还在一代代变强，这套底层能力短期不会过时。趁现在打好底子，比一直追新工具划算。