项目鸟瞰¶
⚙️ 本文件由
pnpm docs:rebuild自动生成,手改无效。
当前版本:v0.10.113¶
最近 5 次版本改动¶
- 2026-05-30 v0.10.112 → v0.10.113 50k 窗口家族 bug 沉淀 — 新 rule + scan 脚本 + pre-commit + 修 merchant-stats
- 2026-05-30 v0.10.111 → v0.10.112 KPI 0 邮箱 bug 修复 + mstage 文案通俗化 + 邮箱 chip
- 2026-05-29 v0.10.110 → v0.10.111 v0.10.110 审计修复(INDEX display + CF Pages 依赖固化)
- 2026-05-29 v0.10.109 → v0.10.110 文件名英文化(129 文件 git mv + 全 wikilink 同步)
- 2026-05-28 v0.10.102 → v0.10.103 code review 修 4 项(2 严重 + 2 优化)
五层文档体系¶
| 层 | 入口 | 写入门槛 | 用途 |
|---|---|---|---|
| raw | raw/INDEX.md | 极低 | 用户反馈/对话/想法粘贴 |
| specs | specs/INDEX.md | 中 | PRD / 数据模型 / API |
| wiki | wiki/INDEX.md | 高 | 架构 / 字段 / 组件 |
| issues | issues/INDEX.md | 中 | Bug 修复归档 |
| rules | rules/INDEX.md | 高 | 工作流 / 工具使用 |
核心 wiki(架构必读)¶
- Popup 认证状态机 — 浏览器扩展 popup 的登录态机制 — 4 态状态机 + 2 秒超时兜底 + 多重登录入口
- Tab 生命周期与看门狗 — 抓取 Tab 的创建/销毁完整流程 + v0.10.15 看门狗的兜底机制
- 云端同步架构(SPEC-004 Phase 3 准备) — 为什么所有 sync-related 数据用 jsstore;4 类同步数据的 store 设计预览
- 共享队列架构 — v0.10.0 后的核心调度模型 — 多任务共用一个调度器、Tab/worker 是全局资源
- 内页跟随策略 — 网站抓取深度 ≥ 2 时,从首页找哪些站内链接进入再抓的规则
- 域名状态机(SPEC-004 Phase 2 核心概念) — 网站采集中每个域名的状态分类、转换规则、TTL 设计
- 多阶段抓取 pipeline(SPEC-004 Phase 1) — 客户端 HEAD → GET → regex → tab fallback 四层决策,跳过死站/反爬/无 contact 站,省 tab 开销
- 扩展 reload 生命周期(MV3) — SW 重启 + chrome-extension tab 失效 + 双轨恢复机制全流程
- 正则演示组件(RegexTester) — 让用户即改即看的正则测试折叠组件,避免抽象正则改完不知道效果
- 解析层开关 — scraper.ts 把'反爬解码 / 黑名单 / 噪音过滤 / 手机层级 / 社媒过滤'全部剥离为独立可控开关
🚀 进行中的 specs (1)¶
⚠️ 未解决 issues (1)¶
- in-progress 0069-data-view-http-col-mstage-nested-scroll.md — data-view HTTP 列 mstage 漏改 + 嵌套滚动条(部分修)
给 AI 的快速指引¶
- 用户提需求/反馈 → 先存
docs/raw/,再评估转docs/specs/ - 修 bug → 落档
docs/issues/ - 架构变化 → 更新
docs/wiki/ - 首次描述工具 → 建
docs/rules/(按需建档元规则) - 提交前 → 跑
pnpm docs:check校验文档健康