返回项目

Skill Seekers

如要给 Claude / Cursor / Gemini 等多个 AI 平台准备知识包,又不想同一份资料手动处理十几遍,可以采用这个仓库。

Skill Seekers 是一个把各种资料源(文档网站、GitHub 仓库、PDF、视频、Jupyter notebook 等 18 种)转成结构化知识包的工具,转换后可以直接导出给 Claude、Gemini、Cursor、LangChain 等 16 个平台使用。作者给它的定位是「AI 系统的数据层」。

它要解决的核心问题是:做 RAG、构建 AI skill、给 Agent 准备上下文时,从「拿到一份资料」到「AI 能用」中间有大量预处理工作(爬取、解析、分段、格式转换、冲突检测),而且每个平台的格式都不一样,同一份资料要处理多遍。Skill Seekers 把这条链路自动化了。

典型工作流

三条命令完成一次完整流程:

bash
pip install skill-seekers

# 从文档网站抓取并转为结构化数据
skill-seekers create https://docs.django.com/

# 打包成 Claude skill 格式
skill-seekers package output/django --target claude

也可以直接从 GitHub 仓库或本地目录创建:

bash
skill-seekers create facebook/react
skill-seekers create ./my-project

--target 参数决定导出格式,支持 claude、gemini、openai、cursor、langchain 等 16 个目标平台。同一份 create 结果可以反复 package 给不同平台,不需要重新抓取。

支持的源类型

18 种输入源:

  • 文档网站(自动发现 SPA、llms.txt 支持)
  • GitHub 仓库(代码 + README + 文档)
  • PDF(文本 / 表格提取、OCR、密码保护)
  • Word (.docx)、EPUB、PowerPoint (.pptx)
  • 视频(YouTube / 本地,转录 + 视觉帧 OCR)
  • Jupyter Notebook、Markdown、AsciiDoc
  • OpenAPI 规范、RSS / Atom 源、Man 页面
  • Confluence wiki、Notion 页面
  • Slack / Discord 导出
  • 本地项目目录

支持的导出平台

LLM 平台:Claude AI、Google Gemini、OpenAI、MiniMax、Kimi、DeepSeek、Qwen、OpenRouter、Together AI、Fireworks AI、OpenCode、Generic Markdown

RAG / 向量平台:LangChain、LlamaIndex、Haystack、Pinecone、ChromaDB、FAISS、Qdrant

MCP 集成

自带 MCP Server,可以挂到 Claude Code 或其他支持 MCP 的工具里直接调用:

bash
# stdio 模式
python -m skill_seekers.mcp.server_fastmcp

# HTTP 模式
python -m skill_seekers.mcp.server_fastmcp --transport http --port 8765

包含 26 个 MCP 工具,覆盖抓取、解析、打包、向量存储和云同步。

适用场景

  • 需要把文档、代码库、PDF 等资料批量转成 AI 可用的知识包
  • 同一份资料要导出给多个 AI 平台(Claude + Cursor + Gemini 等)
  • 搭建 RAG 系统,需要标准化的文档解析和分段
  • 给 Claude Code / Cursor 生成规则文件(.cursorrules 等)
  • 企业内部知识库维护,从 Confluence / Notion 等导入

不适用场景

  • 只需要手动给 AI 粘贴一段文本作为上下文
  • 已有成熟的文档解析 pipeline(Docling / unstructured 等),只需要格式转换
  • 需要实时流式数据接入,Skill Seekers 是离线批处理模式

安装

bash
# 基础安装
pip install skill-seekers

# 完整功能(含视频处理、MCP 等)
pip install skill-seekers[all]

# 按需安装
pip install skill-seekers[gemini]
pip install skill-seekers[openai]
pip install skill-seekers[video-full]
pip install skill-seekers[mcp]

License 为 MIT。

语言

Python

分类

上下文工程

许可证

MIT

更新时间

4/12/2026

标签

context-engineeringknowledge-baseragskill-buildermcpclaudegeminicursordocument-parserpdf
~/安装方式

# source

$pip install skill-seekers
$pip install skill-seekers[all]

# usage

$skill-seekers create https://docs.example.com/
$skill-seekers package output/example --target claude
$skill-seekers create facebook/react