Blog / AI
AI

Construir agentes de IA con capacidades de scraping en xpander.ai

Descubra cómo utilizar xpander.ai y Bright Data para crear agentes de IA sin código con scraping e integración de datos web en directo.
5 min de lectura
Build AI Agents with xpander.ai & Bright Data

En este artículo lo verá:

  • Qué es la plataforma xpander.ai y qué ofrece para construir agentes de IA.
  • Por qué los agentes de IA necesitan acceder a la web para ser realmente eficaces.
  • Cómo integrar las herramientas incorporadas de Bright Data en un agente xpander.ai para dotarlo de funcionalidad de web scraping.

Sumerjámonos.

¿Qué es xpander.ai?

Xpander.ai es una plataforma Backend-as-a-Service para construir agentes autónomos de IA. Es una solución sin código diseñada para ayudar a los desarrolladores empresariales a crear, probar y desplegar agentes de IA de forma eficiente. También incluye un SDK de código abierto para crear y ejecutar agentes de IA mediante programación.

La plataforma ofrece un entorno visual para definir flujos de trabajo multiagente y de colaboración. También permite adjuntar herramientas e integrarse con los sistemas de la empresa. Además, puede simular y probar el comportamiento de los agentes antes de ponerlos en marcha.

Las características clave incluyen:

  • Sistema de grafos de agentes: Garantiza la ejecución fiable de agentes en varios pasos.
  • Conectores Agentic: Permite a los agentes conectarse a diversos sistemas y API de terceros.

La importancia de los datos web recientes para la precisión de los agentes de IA

Independientemente de la plataforma, biblioteca o herramienta de creación de agentes de IA que elijas, existe una limitación fundamental. Es decir, los LLM sólo pueden realizar tareas y responder preguntas basándose en los datos con los que fueron entrenados. Esto supone un gran obstáculo a la hora de construir agentes de IA, de los que se espera que realicen acciones que van más allá de las capacidades estáticas de un LLM típico.

Así pues, para ser más precisos, operativos y eficaces, los agentes de IA necesitan acceder a la web. Deben poder leer páginas web y utilizar su contenido para fundamentar sus respuestas y decisiones. Al fin y al cabo, la web es una de las fuentes de datos más ricas y actualizadas.

Sin embargo, no basta con tener acceso a la web. La mayoría de los sitios aplican medidas anti-scraping y anti-bot para bloquear los rastreadores automatizados de IA. Esto significa que sus agentes necesitan herramientas potentes que les permitan extraer datos de las páginas web, y en un formato optimizado para el procesamiento de IA.

Eso es precisamente lo que ofrece la infraestructura de IA de Bright Data, disponibleen xpander.ai a través de conectores integrados. Entre sus muchas características, permite a sus agentes de IA sin código extraer datos frescos de más de 50 plataformas populares en formato JSON estructurado.

Bright Data se encarga de gestionar CAPTCHAs, prohibiciones de IP, límites de tasa y mucho más. Combinado con el creador de agentes de IA de xpander.ai, puede integrar todo esto sin escribir una sola línea de código. ¿El resultado? Un agente de IA listo para producción con acceso en tiempo real a datos web fiables.

Cómo integrar el conector de datos de Bright para crear un agente de raspado xpander.ai

En esta guía, aprenderá a construir un agente de IA en xpander.ai. En concreto, utilizará el conector Bright Data para dotar a su agente de la capacidad de raspar datos de la web.

Mostraremos cómo crear un agente de web scraping que pueda fundamentar sus respuestas recuperando datos en directo de Internet. Este es sólo un ejemplo de lo que es posible con la integración de xpander.ai + Bright Data. Puede adaptar fácilmente este enfoque a muchos otros casos de uso.

Nota: En cierto sentido, este ejemplo funciona como un flujo de trabajo agéntico RAG. La razón es que el conector de Bright Data actúa como componente de recuperación, obteniendo datos actualizados para que los utilice el agente.

Siga los siguientes pasos para crear su agente de raspado de IA sin código en xpander.

Requisitos previos

Para reproducir este tutorial, necesitas lo siguiente:

Si aún no los tienes, haz clic en los enlaces anteriores y sigue las instrucciones de configuración. ¡Vamos a empezar!

Paso nº 1: Crear un nuevo agente

Inicie sesión en xpander.ai y vaya al panel de control de su perfil. Haga clic en “Agente” en el menú de la izquierda y, a continuación, pulse el botón “Nuevo agente” para añadir un nuevo agente:

Pulsando el botón "Agentes > Nuevo Agente

Llegará a la siguiente página, con un formulario donde puede configurar su nuevo agente. Dele un nombre como “Agente Web Scraper”:

Llamando al nuevo agente "Agente Web Scraper".

Deje los demás ajustes de la pestaña “General” como están. Los valores por defecto son suficientes para una configuración simple como esta. Por defecto, xpander.ai utilizará el GPT-4o de OpenAI como modelo LLM.

¡Genial! Ahora tienes un nuevo agente de IA en blanco listo en xpander.ai.

Paso 2: Configurar Bright Data Tools para el Web Scraping

Ahora mismo, su agente sólo puede realizar acciones ofrecidas por el proveedor de LLM seleccionado. Ha llegado el momento de potenciarlo con capacidades de web scraping mediante Bright Data.

Para ello, vaya a la pestaña “Herramientas” de la página de su agente y haga clic en el botón “Añadir herramientas”:

Pulsar el botón "Añadir herramientas

A la derecha aparecerá un panel titulado “Añadir herramientas”. Busque “bright data” y seleccione la integración de Bright Data:

Selección del conector Bright Data

Aparecerá el siguiente modal:

Rellenar el formulario de configuración del conector Bright Data

Rellénalo como sigue:

  • Nombre del conector: Asigne un nombre a su conector de Bright Data (por ejemplo, “Conector de Bright Data”).
  • Modo de autenticación: Seleccione la opción “Clave API”.
  • Ámbito de autenticación:
    • Seleccione la opción “Usuario de integración”.
    • Pegue su clave API de Bright Data.
    • Seleccione la opción “Portador”. Esto pasará la clave de API en el encabezadoAutorización mediante el patrón Portador, que es un método de autenticación admitido por las API de Bright Data.

Una vez rellenado todo, pulse el botón “Guardar”.

Ahora, se le pedirá que seleccione las herramientas específicas de Bright Data que desea habilitar en su agente:

Selección de las herramientas de Bright Data para habilitar

Recomendamos seleccionar todas las herramientas para desbloquear todas las capacidades de raspado web. En el momento de escribir este artículo, las herramientas disponibles son:

  • Iniciar trabajo de recopilación de datos por ID de conjunto de datos: Inicia un trabajo de raspado para un conjunto de datos especificado mediante las API de Web Scraper.
  • Ejecutar petición proxy por URL: Envía una petición HTTP a través de la red proxy de Bright Data para acceder al contenido de cualquier página web.
  • Descargar instantánea de conjunto de datos por ID: Descarga una instantánea de un conjunto de datos en varios formatos, pasando los datos a la IA.

Una vez seleccionadas las herramientas deseadas, pulse el botón “Añadir al agente” en la esquina inferior derecha:

Pulsar el botón "Añadir al agente

La pestaña “Herramientas” de su agente mostrará ahora el conector de Bright Data con las herramientas que haya configurado:

Observe las herramientas de Bright Data configuradas

Observe que puede hacer clic en cualquier herramienta para ver o ajustar su configuración.

¡Fantástico! Su agente de IA ya está totalmente integrado con las herramientas de Bright Data y listo para rastrear la web.

Paso 3: Especialice su agente de AI Scraping

Ahora que su agente tiene acceso a las herramientas de Bright Data para el web scraping, dele un prompt de sistema personalizado. Esto indica al agente qué es y cómo debe operar.

Para ello, haz clic en la pestaña “Instrucciones” y pega algo como lo siguiente en el área de texto “Indicación del sistema”:

You are an AI agent capable of grounding your responses by scraping data from the web
Añadir un aviso del sistema a su agente

Para los agentes más especializados, también puede añadir reglas y objetivos personalizados.

¡Increíble! Su agente raspador xpander está listo.

Paso 4: Póngalo todo junto

Haga clic en el botón “Gráfico del agente” para ver el flujo de trabajo actual del agente de IA:

El grafo de agentes

Verá un único agente con acceso a las tres herramientas de Bright Data configuradas para el web scraping.

Bien hecho. Sólo queda probar el agente y verlo en acción.

Paso 5: Probar el Agente Web Scraper

Vuelva a la pestaña “Chat de prueba” y pruebe su agente con una pregunta como ésta:

Search for top 3 headphones under $100 and provide me info from their PDP's

Esto indica a su agente de raspado web que busque dinámicamente en Internet los 3 auriculares con un precio inferior a 100 dólares y recupere la información directamente de sus páginas de detalles del producto (PDP).

Como puede imaginar, un LLM estándar sería capaz de manejar este tipo de tarea sin acceso a herramientas de raspado dedicadas como las que proporciona Bright Data.

Pegue la solicitud en la entrada de chat y envíela a su agente:

El agente de raspado AI en acción

El agente utiliza las herramientas LLM y Bright Data para:

  1. Realiza una búsqueda en Internet y encuentra los 3 mejores auriculares.
  2. Para cada producto, inicie un trabajo de recopilación de datos y descargue los datos de Amazon.
  3. Resuma la información en una respuesta breve y precisa, con enlaces reales a las páginas de detalles de los productos de Amazon.

Si despliegas una de las secciones de herramientas de la interfaz, verás algo parecido a esto:

Los detalles de E/S de una llamada a una herramienta

Esto demuestra que, entre bastidores, el agente de IA detectó automáticamente qué herramientas de Bright Data debía utilizar para completar la tarea. En concreto, las llamaba con los parámetros adecuados para obtener datos frescos (en este caso, directamente de las páginas de productos de Amazon).

¡Et voilà! Ahora tiene un agente de raspado totalmente funcional en xpander.ai, impulsado por la infraestructura de datos de IA de Bright Data.

Próximos pasos

Ahora que ya dispone de un agente de raspado xpander alimentado por Bright-Data, puede:

Conclusión

En este artículo, ha aprendido a utilizar xpander.ai para construir un agente de raspado de IA sin código. Esto fue posible gracias al conector Bright Data, que expone herramientas avanzadas de scraping para su integración en agentes xpander.

Se trata de un ejemplo sencillo, pero es posible que desee crear agentes de IA más sofisticados. Para ello, necesita soluciones de confianza para obtener, validar y transformar el contenido web. Eso es exactamente lo que puede encontrar en la infraestructura de agentes de IA de Bright Data.

Cree hoy mismo una cuenta gratuita en Bright Data y empiece a explorar nuestras herramientas de datos preparadas para la IA.