多维种子+递归循环+竞争对手逆向穷尽行业关键词

Jan 21, 2026 — dawn

第一阶段：构建“全维度”种子库 (Seed List)

GKP的输出质量取决于输入。如果种子词不全，结果必然有遗漏。你需要准备三类种子：

产品/服务核心词： ebike, electric bike, electric bicycle.
属性修饰词：
- 规格： 750w, 48v, foldable, fat tire.
- 人群： for seniors, for commuters, for kids.
- 场景： mountain, city, hunting, beach.
搜索意图词（关键）：
- B2B/供应： wholesale, manufacturer, supplier, factory, bulk.
- 成交/B2C： buy, price, for sale, shop, deals.
- 调研/评价： review, vs, best, comparison, pros and cons.

第二阶段：执行“A-Z 组合爆炸”递归挖掘

这是防止遗漏的核心逻辑。

基础挖掘： 将第一阶段的种子词输入GKP，下载前1000个结果。
字母递归（Alphabet Soup）：
- 将核心词与字母组合，例如输入 ebike a、ebike b一直到 ebike z。
- GKP会对不同首字母的关联词产生不同的联想，这能逼出隐藏的数千个长尾词。
意图组合： 将“核心词 + 意图词”进行组合，例如 ebike manufacturer，这会触发GKP切换到B2B数据池，挖掘出完全不同的结果。

第三阶段：竞争对手 URL 逆向工程

很多词你可能想不出，但你的对手已经布好局了。

在GKP选择 “从网站开始 (Start with a website)”。
找到该行业全球前 10 名的品牌站、独立站和行业媒体。
循环操作：
- 输入对手的 首页URL（获取行业大词）。
- 输入对手的 核心分类页URL（获取精准类目词）。
- 输入对手的 爆款产品页URL（获取规格词和型号词）。
无遗漏策略： 至少扫描 20 个不同的竞争对手域名。

第四阶段：递归循环（The Loop Strategy）

这是确保“无遗漏”的关键闭环：

第一轮： 输入 broad seeds -> 得到结果集 A。
提取： 从结果集 A 中筛选出你之前没想到的 新词根（例如：你搜 ebike，结果里出现了 pedelec 或 moped）。
第二轮： 将这些 新词根 再次作为种子词输入GKP -> 得到结果集 B。
循环： 重复此过程，直到 GKP 返回的结果中不再出现新的词根为止。

第五阶段：120 维度清洗与自动分群

当你拿到了数万个词后，数据是乱的。你需要利用你目前项目中的 ExpertAnalyzer 进行处理：

语义去重： 利用 Token-Sort-Hash (指纹算法) 将 ebike for hunting 和 hunting ebike 合并，防止数据冗余。
意图打标： 自动识别哪些是“厂家词”、哪些是“测评词”。
难度仿真： 标注出哪些词是巨头垄断，哪些是蓝海（利用 yield_index）。