Menú de Accesibilidad saltar al contenido
day1

MCP Launch Week Day 1

5 min de lectura

Semana de lanzamiento de MCP, día 1

Hoy damos inicio a la Semana de lanzamiento de MCP Web. Lanzamos Tool Groups, una nueva función de nuestro servidor MCP que resuelve el mayor cuello de botella en los flujos de trabajo de los agentes: la contaminación del contexto.

Ahora puede configurar su servidor MCP para que cargue solo las herramientas que necesita (por ejemplo, ?groups=social o ?groups=ecommerce), lo que reduce drásticamente el uso de tokens y aumenta la precisión del agente.

El problema: la trampa de «todas las herramientas»

En los inicios de MCP (y por «inicios» nos referimos a hace tres meses), el patrón estándar era sencillo: exponer todas las capacidades que ofrece su API como una herramienta.

Para Bright Data, eso es un problema. Nuestra red ofrece Conjuntos de datos para Amazon, LinkedIn, TikTok, Google Maps, Zillow, datos financieros y Scrapers sin procesar. Si cargáramos todos los Conjuntos de datos y Scrapers en el servidor, estaríamos exponiendo más de 200 herramientas distintas.

Cuando un cliente MCP (como Claude Desktop o Cursor) se conecta a un servidor, volca todas esas definiciones de herramientas (nombres, descripciones y esquemas JSON) en el System Prompt.

Esto crea dos problemas críticos:

  1. Contaminación del contexto: el LLM se distrae con 45 herramientas que no necesita. Podría alucinar un parámetro de una herramienta de Instagram mientras intenta extraer datos de Amazon.
  2. Ineficiencia de tokens: estás pagando por miles de tokens de entrada solo para definir las herramientas, antes incluso de que el usuario escriba «Hola».

La solución: grupos de herramientas con ámbito

Hemos refactorizado nuestro servidor MCP para que admita grupos de herramientas modulares. En lugar de un servidor monolítico, ahora puede tratar el servidor como un conjunto de capacidades combinables.

Hemos organizado nuestros conjuntos de datos en dominios lógicos:

  • COMERCIO ELECTRÓNICO: Amazon, Walmart, eBay, Google Shopping
  • REDES SOCIALES: TikTok, Instagram, Facebook, Reddit, X (Twitter)
  • NEGOCIOS: LinkedIn, Crunchbase, Google Maps, Zillow
  • INVESTIGACIÓN: repositorios GitHub, noticias Reuters, fuentes académicas
  • FINANZAS: Datos bursátiles, tendencias del mercado, noticias financieras
  • TIENDAS DE APLICACIONES: iOS App Store, Google Play
  • NAVEGADOR: El paquete completo de automatización del Navegador de scraping
  • ADVANCED_SCRAPING: Operaciones por lotes y utilidades de alto rendimiento

Cómo funciona

En segundo plano, hemos implementado una lógica de filtrado que intercepta la solicitud de inicialización. Cuando configura su cliente, solo tiene que añadir los grupos que necesite a la URL.

Para un agente de comercio electrónico:

https://mcp.brightdata.com/mcp?token=<SU-API-token>&groups=ecommerce
# O a través de variables de entorno para STDIO
GROUPS=ecommerce

Para un agente de análisis de redes sociales:

https://mcp.brightdata.com/mcp?token=<TU-API-token>&groups=social

Todo el mundo obtiene las herramientas básicas (search_engine y scrape_as_markdown) de forma predeterminada. A continuación, el servidor construye dinámicamente la lista de herramientas:

// Lógica simplificada de nuestro server.js
función build_allowed_tools(grupos = [], herramientas = []) {
    const permitido = nuevo Set(herramientas_básicas);
    for (let groupId of groups) {
        const group = GROUPS[groupId];
        if (group) {
             // Solo añadir herramientas específicas para este grupo
            group.tools.forEach(t => allowed.add(t));
        }
    }
    return allowed;
}

El futuro de la «ejecución de código» frente al presente de las «herramientas»

¿Por qué es tan importante esto ahora mismo?

Se está produciendo un cambio enorme en el sector. Los últimos artículos y demostraciones de Anthropic y Cloudflare destacan una tendencia hacia la «ejecución de código» y el «uso de ordenadores». La idea es que, en lugar de llamar a get_amazon_review(asin: «123»), el modelo simplemente escriba un script en Python o ejecute un comando bash para recuperar los datos por sí mismo.

Creemos firmemente en ese futuro. Permite que el modelo sea creativo en lugar de estar restringido por esquemas API rígidos.

Sin embargo, aún no hemos llegado a ese punto.

La mayoría de los clientes actuales de MCP siguen estando estrictamente centrados en las herramientas. Dependen de que el servidor defina explícitamente cada acción que puede realizar el modelo. Si se vierten 100 Conjuntos de datos en la ventana de contexto, el modelo se degrada.

Los grupos de herramientas son el puente. Le proporcionan la potencia de la enorme infraestructura de datos de Bright Data sin sobrecargar a la generación actual de agentes de IA. Mantienen limpia su ventana de contexto y agudo el razonamiento de su agente.

Impacto en el rendimiento

Al utilizar grupos de herramientas, hemos observado mejoras significativas en la fiabilidad de los agentes.

Comparación del consumo de tokens

A continuación se muestra una comparación que muestra la drástica reducción en el uso de tokens cuando se utilizan grupos de herramientas específicos en comparación con la carga de todas las herramientas (modo Prod con 62 herramientas a 7358 tokens):

Ideas clave:

  • Reducción de tokens del 78,5 % al 94,6 % en todos los grupos de herramientas en comparación con la carga de las 62 herramientas.
  • Los grupos de finanzas y viajes muestran la mejor optimización, con una reducción del 94,6 % (solo 401 tokens frente a 7358).
  • El grupo de redes sociales tiene el mayor uso de tokens, con 2823 tokens, debido a esquemas de herramientas más complejos, pero aún así ahorra un 61,6 %.
  • Mayor tasa de éxito en la selección de parámetros (el modelo es menos propenso a confundir linkedin_url con facebook_url).
  • Menor latencia en el handshake inicial.

Pruébelo

El servidor Web MCP es de código abierto y ya está disponible.

  • Para empezar: Consulte la documentación para configurar su primer agente.
  • Nivel gratuito: regístrese para obtener 5000 solicitudes gratuitas al mes en nuestras herramientas básicas (search_engine y scrape_as_markdown).

Feliz construcción.

¿Listo para empezar?
Explora el servidor MCP de la web y comienza a construir potentes agentes de IA.
Leer documentación Ver el Repositorio