Что проверяет этот инструмент
Он читает группы robots.txt и проверяет, явно ли покрыты основные AI-краулеры для поиска, обучения, пользовательских действий и управления или они наследуют только общие правила.
Вставьте robots.txt и узнайте, разрешены, заблокированы или неясно описаны основные токены AI-поиска, обучения, пользовательских действий и управления до того, как AI-системы обнаружат ваши страницы.
Вставьте и проверьте мгновенно. Содержимое robots.txt остается на этом устройстве.
Вставьте robots.txt, чтобы проверить сигналы доступа OpenAI, Anthropic, Google, Perplexity и Common Crawl.
Он читает группы robots.txt и проверяет, явно ли покрыты основные AI-краулеры для поиска, обучения, пользовательских действий и управления или они наследуют только общие правила.
robots.txt может влиять на то, смогут ли AI-ответчики, браузерные агенты, краулеры обучения моделей и краулеры наборов данных достигать публичных страниц для обнаружения или цитирования.
Сначала исправьте смешанные правила, затем решите, разрешать ли каждому AI-краулеру доступ ради видимости или блокировать его ради контроля контента.
Проверьте технические сигналы, влияющие на обнаружение ответными системами и готовность к цитированию.
Создайте или проверьте файл обнаружения для агентов, который дополняет robots.txt.
Проверьте более широкие технические сигналы для обнаружения и использования AI-агентами.
Он проверяет OAI-SearchBot, GPTBot, ChatGPT-User, ClaudeBot, Claude-SearchBot, Claude-User, Google-Extended, PerplexityBot и CCBot, а также общее правило для всех краулеров.
Разрешайте поисковых агентов, если важна видимость в AI-поиске. Агентов обучения оценивайте отдельно, когда контроль повторного использования контента важнее.
Нет. Google-Extended — это управляющий токен robots.txt, а не отдельный HTTP User-Agent краулера, и он не управляет обычным присутствием в Google Search.
robots.txt — это политика доступа для кооперативных краулеров, а не юридическая или техническая гарантия против любого использования контента.