这个工具检查什么
它会读取 robots.txt 分组,判断主要 AI 搜索、训练、用户触发和控制 token 是被单独覆盖,还是只继承通用爬虫规则。
粘贴 robots.txt,检查主要 AI 搜索、训练、用户触发和控制 token 是允许、阻止还是规则不清,明确 AI 搜索抓取策略。
即时粘贴和检查。robots.txt 内容只保留在当前设备上。
粘贴 robots.txt 后,可检查 OpenAI、Anthropic、Google、Perplexity 和 Common Crawl 相关访问信号。
它会读取 robots.txt 分组,判断主要 AI 搜索、训练、用户触发和控制 token 是被单独覆盖,还是只继承通用爬虫规则。
robots.txt 会影响 AI 答案引擎、浏览型 Agent、模型训练爬虫和数据集爬虫能否访问公开页面,从而影响发现或引用。
优先处理混合规则,然后决定每个 AI 爬虫是为了可见性允许,还是为了内容控制阻止。
会检查 OAI-SearchBot、GPTBot、ChatGPT-User、ClaudeBot、Claude-SearchBot、Claude-User、Google-Extended、PerplexityBot、CCBot,以及通用爬虫规则。
如果你重视 AI 搜索可见性,应优先允许搜索型 Agent;训练型 Agent 要单独判断,取决于你是否希望内容进入模型训练相关流程。
不一样。Google-Extended 是 robots.txt 控制令牌,不是单独的 HTTP 爬虫 UA,也不控制普通 Google 搜索收录。
robots.txt 是给合作爬虫看的访问策略,不是对所有内容使用场景的法律或技术保证。