¿Quién tiene derecho a acceder a la web?. El debate central gira en torno a una pregunta clave: ¿Debería un agente de IA que accede a sitios en nombre de un usuario ser tratado como un bot automatizado o como un humano navegando libremente?. Para algunos, como los usuarios que salieron en defensa de Perplexity en plataformas como Hacker News, la respuesta es clara: si un humano puede acceder a una web pública, su asistente de IA también debería poder hacerlo. Pero para muchos propietarios de sitios, esto no es tan simple. Ellos dependen del tráfico directo para generar ingresos y controlar cómo se consume su contenido.
Cloudflare, que ofrece herramientas para proteger millones de sitios del tráfico malicioso, realizó un experimento: creó un sitio web nuevo, con un archivo robots.txt que bloqueaba explícitamente a Perplexity, y luego le pidió al motor de búsqueda información sobre ese mismo sitio. A pesar de las restricciones, Perplexity fue capaz de responder, lo que sugiere que accedió al contenido por canales alternativos.
Según Cloudflare, esto ocurrió porque Perplexity utilizó un navegador que simulaba ser Google Chrome en macOS, evadiendo las restricciones de bots. Matthew Prince, CEO de Cloudflare, comparó esta conducta con la de «hackers norcoreanos», argumentando que algunas compañías de IA se comportan de manera encubierta e inaceptable.

Por su parte, Perplexity negó que el comportamiento proviniera de sus bots y aseguró que el acceso se generó a través de un servicio externo ocasional, argumentando que Cloudflare simplemente está utilizando la situación para hacer marketing. En una publicación de blog, la compañía defendió su postura y atacó directamente la capacidad de Cloudflare para distinguir entre agentes de IA legítimos y amenazas reales, afirmando que la diferencia entre rastreo automatizado y búsqueda por encargo del usuario es más que técnica: se trata de quién accede a la información.
El conflicto pone de manifiesto un problema de fondo: las reglas tradicionales de la web, como el respeto al archivo robots.txt, están siendo desafiadas por nuevas tecnologías que operan en la frontera entre lo automatizado y lo humano.
Cloudflare y el impacto de los bots IA en el tráfico web
Este enfrentamiento se da en un contexto donde el tráfico automatizado ya supera al humano por primera vez en la historia. Según el informe Bad Bot de Imperva, más del 50% del tráfico en línea es generado por bots, muchos de los cuales son utilizados por grandes modelos de lenguaje (LLM). Lo más preocupante es que el 37% del tráfico es calificado como malicioso, incluyendo scraping, intentos de login y otras prácticas nocivas.
Este fenómeno está generando nuevas amenazas para sitios pequeños y medianos, que se ven afectados por el consumo masivo de su contenido sin recibir visitas reales ni ingresos derivados. Hasta hace poco, los sitios web podían bloquear bots con CAPTCHA o herramientas como las de Cloudflare, mientras permitían rastreadores “buenos” como el de Google, que enviaban tráfico útil. Hoy, las LLM no envían tráfico: simplemente consumen contenido para responder preguntas.
¿Fin del tráfico web tradicional?
La consultora Gartner predice que el tráfico en motores de búsqueda caerá un 25% para 2026, mientras los asistentes de IA se convierten en el intermediario entre usuarios y la web. Aunque esto puede ser útil para el usuario, los sitios pierden control y monetización, lo que podría llevar a un bloqueo masivo de agentes IA, complicando aún más el acceso libre a la información.
Puedes revisar más información relativa a noticias de tecnología | Instagram | YouTube | Twitch | Patrocina Bytes and Bits


