這個工具檢查什麼
它會讀取 robots.txt 分組,判斷主要 AI 搜尋、訓練、使用者觸發和控制 token 是被單獨覆蓋,還是只繼承通用爬蟲規則。
貼上 robots.txt,檢查主要 AI 搜尋、訓練、使用者觸發和控制 token 是允許、阻止還是規則不清,明確 AI 搜尋抓取策略。
即時貼上和檢查。robots.txt 內容只保留在目前裝置上。
貼上 robots.txt 後,可檢查 OpenAI、Anthropic、Google、Perplexity 和 Common Crawl 相關存取訊號。
它會讀取 robots.txt 分組,判斷主要 AI 搜尋、訓練、使用者觸發和控制 token 是被單獨覆蓋,還是只繼承通用爬蟲規則。
robots.txt 會影響 AI 答案引擎、瀏覽型 Agent、模型訓練爬蟲和資料集爬蟲能否存取公開頁面,從而影響發現或引用。
優先處理混合規則,然後決定每個 AI 爬蟲是為了可見性允許,還是為了內容控制阻止。
會檢查 OAI-SearchBot、GPTBot、ChatGPT-User、ClaudeBot、Claude-SearchBot、Claude-User、Google-Extended、PerplexityBot、CCBot,以及通用爬蟲規則。
如果你重視 AI 搜尋可見性,應優先允許搜尋型 Agent;訓練型 Agent 要單獨判斷,取決於你是否希望內容進入模型訓練相關流程。
不一樣。Google-Extended 是 robots.txt 控制令牌,不是單獨的 HTTP 爬蟲 UA,也不控制普通 Google 搜尋收錄。
robots.txt 是給合作爬蟲看的存取策略,不是對所有內容使用場景的法律或技術保證。