Índice del rastreador

Una gran muestra de rastreadores que son bloqueados por los sitios web.

71,6 %

de los sitios web tienen al menos un comando de prohibición parcial.

71,6 %

de los sitios web tienen al menos un comando de prohibición parcial.

Porcentaje de sitios web que bloquean explícitamente el agente de usuario % de sitios web que bloquean explícitamente y con el comando *. Empresa Propósito Agente de usuario
2,5 %62,5 %Open AIGPTGPTBot
2,1 %62,5 %Common Crawl FoundationArchivo web públicoCCBot
1,6 %62,5 %GoogleBard/Gemini/PaLM/BisonGoogle-Extended
0,6 %62,2 %OpenAIChat GPTchatgpt-user
1,8 %63,7 %AmazonAlexaamazonbot
0,5 %61,9 %Meta AILIaMAFacebookBot
0,5 %64,9 %BrandwatchMagpie Crawlermagpie-crawler
1,8 %64,9 %ByteDanceByteDance LLM N/ABytespider
0,5 %61,8 %AnthropicClaudeAnthropic-AI
1,6 %63,5 %AnthropicClaudeclaudebot
0,3 %62,5 %AnthropicClaudeclaude-web
0,4 %62,5 %PerplexityChatbotperplexitybot
0,3 %62,0 %CohereComando CohereCohere-AI
1,3 %62,8 %AppleModelos fundamentales de AppleApplebot-Extended
0,3 %64,7 %AppleSiriApplebot
0,3 %64,7 %Diffbotdatos de entrenamientodiffbot
1,4 %63,6 %MetaTodo Meta IAmeta-externalagent
0,2 %64,6 %OpenAISearchGPToai-searchbot
0,2 %64,7 %TimpiWilson IAtimpibot
0,1 %64,7 %webz.iowebzio-extendedwebzio-extended
0,1 %64,1 %GoogleBard/Gemini/PaLM/Bisongoogleother
0,01 %65,0 %Perplexityperplexity-IAperplexity-ai
0,1 %64,7 %MetaTodo Meta IAmeta-externalfetcher
Porcentaje de sitios web que bloquean explícitamente el agente de usuario % de sitios web que bloquean explícitamente y con el comando *. Empresa Propósito Agente de usuario
20,5 %83,5 %Open AIChat GPTgptbot
17,1 %84,1 %Common Crawl FoundationArchivo web públicoccbot
13,5 %84,8 %GoogleBard/Gemini/PaLM/Bisongoogle-extended
11,7 %83,4 %Open AIChat GPTchatgpt-user
12,2 %83,6 %AnthropicClaudeanthropic-ai
14,1 %83,4 %AnthropicClaudeclaudebot
10,2 %83,8 %AnthropicClaudeclaude-web
8,9 %83,6 %MetaLIaMAfacebookbot
12,4 %84,2 %ByteDanceByteDance LLM N/Abytespider
11,8 %83,4 %PerplexityChatbotperplexitybot
10,3 %84,2 %CohereComando Coherecohere-ai
8,9 %84,4 %Apple.comModelos fundamentales de Appleapplebot-extended
4,9 %86,1 %Brand WatchMagpie Crawlermagpie-crawler
7,3 %83,7 %AmazonAlexaamazonbot
3,3 %85,1 %AppleSiriapplebot
1,8 %85,5 %GoogleBard/Gemini/PaLM/Bisongoogleother
2,9 %85,6 %Webzwebzio-extendedwebzio-extended
4,2 %85,5 %TimpiWilson IAtimpibot
1,4 %86,4 %Perplexityperplexity-IAperplexity-ai
4,8 %85,9 %MetaTodo Meta IAmeta-externalfetcher
7,0 %83,6 %Open AIBuscar GPTOAI-searchbot
4,8 %85,9 %MetaTodo Meta IAmeta-externalagent
Metodología

Bright Data recopila los datos web públicos más buscados del mundo en miles de millones de sitios web importantes. A través de nuestro producto de cumplimiento, Bright Shield, recopilamos comandos de permiso y denegación para agentes de usuario en robot.txt de los sitios web que rastreamos. Nuestra muestra actual de sitios web es de 9 832 187 y hemos recopilado alrededor de 33 000 agentes de usuario únicos.

Nuestro equipo de investigación ha identificado el porcentaje de tiempo que cada agente de usuario de interés está bloqueado explícitamente dentro de nuestra muestra y cada agente de usuario que está bloqueado con el comando (*). También hacemos un seguimiento del porcentaje total de sitios web que no permiten ningún rastreador. Identificamos cada agente de usuario lo mejor posible por empresa, uso y un enlace que incluye información adicional, como por ejemplo, cómo bloquearlo.

¿Comentarios sobre los agentes de usuario? Envíe sus comentariospor correo electrónico a [email protected]

Última actualización: 2 de diciembre de 2025