Content CreationProv0.3.1
微信公众号文章抓取
lovstudio:wxmp-cracker
微信公众号文章抓取。token 全自动——用 agent-browser 弹出 Chrome 让你扫一次码,之后持久化复用;失效时自动重扫。底层调度 wcx CLI,支持按日期窗口导出(--since 10d)和 md+json+csv 三索引一次产出。
Part of lovstudio skills — by lovstudio.ai
Install
npx skills add lovstudio/skills --skill lovstudio:wxmp-cracker
Or clone directly:
git clone https://github.com/lovstudio/wxmp-cracker-skill \
~/.claude/skills/lovstudio-wxmp-cracker
Requires:
- Python 3.8+
npm i -g agent-browserwcxCLI in$PATH- 微信公众号后台(个人订阅号即可)
What It Does
你:"搜一下 '宝玉' 公众号"
│
▼
[Claude Code 匹配到 skill]
│
▼
wcx_run.py -- search 宝玉
│
├─ 凭证有效 ─▶ wcx 输出表格 ✓
│
└─ 凭证失效
│
▼
refresh_token.py
│
▼
agent-browser --headed --profile ~/.lovstudio/wxmp-cracker/profile
│
▼
你扫码(首次需要,之后复用 profile)
│
▼
URL ?token=XXXXXX + cookies get (含 HttpOnly)
│
▼
wcx login ✓ 凭证有效
│
▼
自动重试 wcx_run → 输出表格 ✓
Usage
在 Claude Code 里直接说中文/英文意图即可:
- "搜一下 XXX 公众号"
- "抓下 XXX 最近 20 篇文章"
- "导出 XXX 最近 10 天的文章"
- "把 XXX 的文章导出成 markdown"
- "wcx 登录失效了,重抿一下"
Claude Code 会通过这个 skill 自动调度 wcx。
手动调用(debug):
# 首次 / 主动刷新
python3 ~/.claude/skills/lovstudio-wxmp-cracker/scripts/refresh_token.py
# 任意 wcx 命令,带自动失效重抿
python3 ~/.claude/skills/lovstudio-wxmp-cracker/scripts/wcx_run.py -- search 宝玉
python3 ~/.claude/skills/lovstudio-wxmp-cracker/scripts/wcx_run.py -- fetch 量子位 --limit 100
python3 ~/.claude/skills/lovstudio-wxmp-cracker/scripts/wcx_run.py -- export 量子位 --since 10d --out ./posts
Scripts
| Script | Purpose |
|---|---|
refresh_token.py | agent-browser 扫码 → 提取 token + cookie → wcx login |
wcx_run.py | wcx 的薄封装,失效自动重抿 + 重试一次 |
Profile & 数据位置
| 路径 | 内容 |
|---|---|
~/.lovstudio/wxmp-cracker/profile/ | agent-browser 的持久 Chrome profile(含 session cookies) |
~/Library/Application Support/wcx/config.json | wcx 自己的 token+cookie(macOS) |
~/Library/Application Support/wcx/cache.db | wcx 抓取缓存(macOS) |
Profile 不加密。不要把目录 commit 到 git。
局限
- 首次必须人工扫码(微信扫码登录强制要求)
- 多微信号需要复制 skill + 改
PROFILE_DIR(将来会参数化) - 受微信公众号后台频控限制,
wcx fetch有节流(不是本 skill 的问题)
License
MIT
wechatwxmpwcxcrawleragent-browser