Blog / AI
AI

Resolver el acceso web de los agentes (¡gratis!) con el MCP web, por Bright Data

El servidor Web MCP de Bright Data ofrece ahora herramientas de acceso web rápidas y gratuitas para los desarrolladores de agentes de IA.
7 min de lectura
Web MCP Server – Now with a Free Tier for Agent Developers blog image

El bloqueador número 1 para la web agéntica sigue siendo la “vieja web”: dinámica, con mucho JS, CAPTCHAs, paywalls, popups, throttling y HTML desordenado que los agentes no pueden analizar de forma fiable. Por eso hemos creado el MCP Web: para que los agentes puedan acceder a esa web antigua e interactuar con ella. También por eso decidimos dar un paso más y ofrecer gratuitamente las funciones básicas.

Como desarrollador principal y encargado del mantenimiento del MCP Web de Bright Data, desde el principio supimos que no se trataba de un MCP “normal”. La mayoría de los servidores MCP envuelven un único SaaS/API (como Gmail, HubSpot, GitHub), que es un problema ordenado y estructurado: un esquema y un modelo de autenticación, entradas y salidas predecibles y acciones repetibles con errores documentados.

Pero el MCP Web envuelve todo Internet.

Se integra con la web abierta, donde cada sitio es su propia “API” cambiante, las páginas se renderizan del lado del cliente, aparece el scroll infinito y los CAPTCHAs o el throttling pueden cambiar el comportamiento minuto a minuto. Web MCP absorbe ese caos con una navegación y una obtención resistentes, sesiones gestionadas y control regional, y una extracción que limpia el HTML desordenado y lo convierte en JSON/Markdown utilizable.

Qué es el MCP Web

Web MCP permite a su agente navegar por la web real. Maneja páginas renderizadas en JS y CAPTCHAs, y devuelve texto limpio que su modelo puede utilizar. Piense en ello como “acceso a Internet para agentes”, empaquetado como herramientas MCP.

¿Por qué gratis? El plan Gratuito te da justo lo que necesitas para empezar a construir y probar sin fricción de costes (además de lo suficiente para tus usos diarios). Incluye 5.000 peticiones/mes para el modo Rápido, exponiendo las dos herramientas cotidianas: resultados de búsqueda y “scrape as Markdown”. Eso es perfecto para que la mayoría de los agentes encuentren páginas y las lean de forma fiable.

Puede actualizar a Pro más adelante para cuando esté listo para clics, desplazamiento, capturas de pantalla y extracción estructurada de JSON (establezca PRO_MODE en la versión local o añada &pro=1 en la remota).

Inicio rápido y documentación

Tutorías guiadas

Ingeniería de un servidor MCP a escala web

Mientras que los MCP “normales” ofrecen herramientas deterministas a través de API fijas, el MCP web ofrece herramientas tolerantes a fallos a través de una Internet caótica para que los agentes puedan seguir actuando de forma fiable. Hacerlo bien conlleva grandes retos de ingeniería y una verdadera responsabilidad.

Enviar un MCP para toda la web significaba que teníamos que cumplir tres estrictas normas:

  • Ser ligero e inteligente, para no quemar fichas con sólo conectarse.
  • Ser escalable y eficaz, para que funcione con cargas de producción y no sólo en demostraciones.
  • Ser seguros y conformes, para que los equipos puedan desplegar con confianza

1) Ligereza e inteligencia (eficiencia simbólica sin simplificación)

En un principio, el MCP se distribuyó con más de 60 herramientas, pero los primeros usuarios nos enseñaron algo muy valioso: el 90% de las llamadas de los agentes utilizaban sólo dos herramientas de búsqueda y scrape-as-markdown.

Uso de la herramienta Web MCP de Bright Data

Sin embargo, los MCP típicos enumeran docenas de herramientas por adelantado. En MCP, el primer paso es /list/tools. Con más de 60 herramientas, sólo ese apretón de manos cuesta ~17.000 tokens 🤯 antes de hacer ningún trabajo real. También confundía los modelos y llevaba a malas elecciones de herramientas que lo hacían más lento y menos consistente.

Aprendimos que el coste de los tokens durante el handshake ahuyentaba a los usuarios mucho más que la latencia en tiempo de ejecución, y que el manejo de CAPTCHA era una apuesta de mesa: sin él, demasiadas páginas del mundo real simplemente fallaban.

Nuestra respuesta: dos modos.

Modo rápido (por defecto)

Exactamente dos herramientas:

  • search_engine → devuelve los resultados de las SERP
  • scrape_as_markdown → recupera cualquier URL como Markdown limpio y compatible con LLM.

Intercambio de datos casi nulo: metadatos de herramientas mínimos, confusión mínima
Cubre la gran mayoría de tareas de búsqueda y extracción
Rápido y adecuado para casos de uso en tiempo real

Por qué es importante scrape_as_markdown

La mayoría de las integraciones “web” se detienen en este punto debido a los CAPTCHAs y bloqueos, que se rompen en la web moderna.
scrape_as_markdown:

  • Funciona en sitios con mucho JS (renderización completa)
  • Resolución automática de CAPTCHA
  • Devuelve un Markdown limpio que los LLMs digieren mucho mejor que el HTML crudo.

Cuando necesite JSON estructurado (por ejemplo, datos de productos), cambie a Pro y utilice los raspadores verticales.

Modo Pro (opt-in)

  • La superficie completa de ~60 herramientas (comercio electrónico, redes sociales, noticias, inmobiliaria, finanzas, LinkedIn/HR, etc.)
  • Utiliza la API Web Scraper de Bright Data para devolver JSON estructurado cuando el flujo de trabajo lo requiere.
  • Se opta cuando la estructura vertical justifica el coste simbólico

Resultado: arranques más rápidos, menos fichas y agentes más contentos al elegir la herramienta adecuada.

Cómo activar Pro

  • Remoto/hosted: añada &pro=1 a su URL de conexión
  • STDIO/self-hosted: establecer PRO_MODE = true

2) Ser escalable y eficaz (diseñado para el tráfico del mundo real).

Mantuvimos la orquestación fuera de la ruta caliente, por lo que el tiempo de solicitud proviene del sitio de destino, no de Web MCP.

Visión general de la arquitectura:

  • Punta única MCP con una superficie de herramienta de dos modos
  • Orquestación de navegador sin cabeza para páginas con mucho JS o si se necesita alguna interacción con el sitio de destino.
  • Resolución automática de CAPTCHA y gestión de sesiones flexible
  • Capacidad de concurrencia ajustable y aislamiento por cuenta

En la práctica:

  • Baja sobrecarga de handshake (modo rápido) → tiempo de arranque mínimo
  • Raspado robusto en sitios reales ricos en JS
  • Capacidad operativa para trabajos por lotes y agentes de alto QPS

3) Ser seguro y cumplir la normativa (basado en el programa GDPR de Bright Data)

Web MCP es una fina envoltura sobre las API de Bright Data, por lo que hereda la postura de privacidad, seguridad y gobernanza de la plataforma (GDPR/CCPA) en lugar de volver a implementar controles en su agente. Más información en nuestro Centro de confianza.

La infraestructura y las políticas de Bright Data son las mismas que utilizan los clientes de producción, mientras que la capa MCP es mínima. La base legal de la plataforma está probada, con victorias en casos judiciales con Meta y X Corp que apoyan el acceso responsable a datos web públicos.

Lo que (intencionadamente) no está en Web MCP

Web MCP no añade sus propias capas de aislamiento, residencia, eliminación de información de identificación personal o limitación de tarifas; esas barreras de seguridad las gestionan las API/políticas de Bright Data y/o deben implementarse en su agente/aplicación de acuerdo con su postura de riesgo.

Inicio rápido y sencillo

from langchain_mcp_adapters.client import MultiServerMCPClient
from langgraph.prebuilt import create_react_agent

client = MultiServerMCPClient({
    "brightdata": {
        "url": "https://mcp.brightdata.com/sse?token=<API_TOKEN>",  # add &pro=1 to opt into Pro
        "transport": "sse",
    }
})

tools = await client.get_tools()  # Rapid mode returns the slim, high-value set
agent = create_react_agent("openai:gpt-4.1", tools)

# Your agent can now search and extract live sites reliably:
resp = await agent.ainvoke({"messages": "Find the latest guidance on US passport renewal fees and summarize the changes."})

Libre significa “sin excusas”

Si su agente no está conectado a la Web en directo, se equivocará con seguridad en las tareas urgentes. Con el nivel gratuito de Web MCP, puede solucionarlo hoy mismo.