Skill Seekers
如要给 Claude / Cursor / Gemini 等多个 AI 平台准备知识包,又不想同一份资料手动处理十几遍,可以采用这个仓库。
Skill Seekers 是一个把各种资料源(文档网站、GitHub 仓库、PDF、视频、Jupyter notebook 等 18 种)转成结构化知识包的工具,转换后可以直接导出给 Claude、Gemini、Cursor、LangChain 等 16 个平台使用。作者给它的定位是「AI 系统的数据层」。
它要解决的核心问题是:做 RAG、构建 AI skill、给 Agent 准备上下文时,从「拿到一份资料」到「AI 能用」中间有大量预处理工作(爬取、解析、分段、格式转换、冲突检测),而且每个平台的格式都不一样,同一份资料要处理多遍。Skill Seekers 把这条链路自动化了。
典型工作流
三条命令完成一次完整流程:
bashpip install skill-seekers # 从文档网站抓取并转为结构化数据 skill-seekers create https://docs.django.com/ # 打包成 Claude skill 格式 skill-seekers package output/django --target claude
也可以直接从 GitHub 仓库或本地目录创建:
bashskill-seekers create facebook/react skill-seekers create ./my-project
--target 参数决定导出格式,支持 claude、gemini、openai、cursor、langchain 等 16 个目标平台。同一份 create 结果可以反复 package 给不同平台,不需要重新抓取。
支持的源类型
18 种输入源:
- 文档网站(自动发现 SPA、llms.txt 支持)
- GitHub 仓库(代码 + README + 文档)
- PDF(文本 / 表格提取、OCR、密码保护)
- Word (.docx)、EPUB、PowerPoint (.pptx)
- 视频(YouTube / 本地,转录 + 视觉帧 OCR)
- Jupyter Notebook、Markdown、AsciiDoc
- OpenAPI 规范、RSS / Atom 源、Man 页面
- Confluence wiki、Notion 页面
- Slack / Discord 导出
- 本地项目目录
支持的导出平台
LLM 平台:Claude AI、Google Gemini、OpenAI、MiniMax、Kimi、DeepSeek、Qwen、OpenRouter、Together AI、Fireworks AI、OpenCode、Generic Markdown
RAG / 向量平台:LangChain、LlamaIndex、Haystack、Pinecone、ChromaDB、FAISS、Qdrant
MCP 集成
自带 MCP Server,可以挂到 Claude Code 或其他支持 MCP 的工具里直接调用:
bash# stdio 模式 python -m skill_seekers.mcp.server_fastmcp # HTTP 模式 python -m skill_seekers.mcp.server_fastmcp --transport http --port 8765
包含 26 个 MCP 工具,覆盖抓取、解析、打包、向量存储和云同步。
适用场景
- 需要把文档、代码库、PDF 等资料批量转成 AI 可用的知识包
- 同一份资料要导出给多个 AI 平台(Claude + Cursor + Gemini 等)
- 搭建 RAG 系统,需要标准化的文档解析和分段
- 给 Claude Code / Cursor 生成规则文件(.cursorrules 等)
- 企业内部知识库维护,从 Confluence / Notion 等导入
不适用场景
- 只需要手动给 AI 粘贴一段文本作为上下文
- 已有成熟的文档解析 pipeline(Docling / unstructured 等),只需要格式转换
- 需要实时流式数据接入,Skill Seekers 是离线批处理模式
安装
bash# 基础安装 pip install skill-seekers # 完整功能(含视频处理、MCP 等) pip install skill-seekers[all] # 按需安装 pip install skill-seekers[gemini] pip install skill-seekers[openai] pip install skill-seekers[video-full] pip install skill-seekers[mcp]
License 为 MIT。
语言
Python
分类
上下文工程
许可证
MIT
更新时间
4/12/2026
标签