Blog / AI
AI

Uso de Dify y Bright Data para la búsqueda en la Web

Vea cómo Dify puede buscar en la web y raspar resultados en directo utilizando un sencillo flujo de trabajo sin código con Bright Data.
6 min de lectura
Search the web with Dify

En esta guía aprenderás:

  • Por qué Dify es una potente plataforma para construir agentes de IA.
  • Por qué las capacidades de búsqueda en Internet son indispensables para los agentes de IA.
  • Cómo crear un agente de IA en Dify que pueda buscar en la Web.

Sumerjámonos.

Desbloqueando el desarrollo de la automatización del flujo de trabajo Agentic con Dify

Dify es una innovadora plataforma low-code/no-code diseñada para simplificar la creación de aplicaciones LLM. Se puede utilizar tanto en la nube como en versión de código abierto, y soporta flujos de trabajo agénticos.

Proporciona un editor visual intuitivo, permitiéndole construir y gestionar fácilmente complejas lógicas de IA con la funcionalidad de arrastrar y soltar. Dify trabaja con una amplia gama de LLMs, desde propietarios hasta de código abierto, dándole la flexibilidad de elegir el mejor modelo para su proyecto.

Al funcionar como un BaaS(Backend-as-a-Service), gestiona la infraestructura de IA por ti. Además, es compatible con extensiones y plugins para mejorar aún más sus capacidades. Esto abre la puerta a funcionalidades ampliadas dentro de sus aplicaciones de IA a través de integraciones de terceros.

Por qué los agentes de IA deben poder buscar en la web

La capacidad de los agentes de IA para buscar en la Web es una necesidad fundamental para lograr respuestas inteligentes y actualizadas. Las primeras iteraciones de LLM, como ChatGPT y Gemini, a menudo tenían dificultades para proporcionar información actual o de nicho. Esto se debe a que estaban limitados por la naturaleza estática de sus datos de entrenamiento.

Un salto importante en su precisión se produjo precisamente cuando se les dotó de la capacidad de buscar en la web.

ChatGPT mientras busca en la web para responder a una pregunta

Esta capacidad permite a LLM extraer información bajo demanda, con el objetivo final de ampliar su base de conocimientos para reducir las alucinaciones.

Al mismo tiempo, las funciones integradas de búsqueda en la web para los LLM suelen ser exclusivas de los modelos de pago. Además, no basta con “buscar en Internet”. La razón es que el gran volumen y la naturaleza no verificada de los datos de Internet pueden dar lugar a resultados imprecisos o irrelevantes.

El verdadero poder reside en tener acceso a datos SERP(Search Engine Results Page) fiables y verificados directamente de motores de búsqueda fiables como Google, Bing, DuckDuckGo y similares. Estos datos se basan en sofisticados algoritmos de clasificación que incluyen rigurosos controles de calidad.

Como resultado, los datos SERP garantizan una base mucho más fiable para que los agentes de IA sinteticen la información y generen respuestas bien informadas. Por eso, un caso de uso común en IA es crear un chatbot basado en RAG que aproveche los datos de las SERP.

Para proporcionar un flujo de trabajo de agente de Dify AI con datos SERP, puede utilizar el plugin Bright Data Dify. Entre las herramientas que ofrece hay una llamada “Search Engine“. Esta ofrece resultados de búsqueda en tiempo real de Google, Bing, Yandex y otros motores de búsqueda importantes conectándose a la API SERP de Bright Data.

Gracias a esta integración, sus agentes de IA sin código pueden aprovechar la inmensidad de la Web y beneficiarse al mismo tiempo de la credibilidad de los motores de búsqueda de confianza.

Construyendo un Agente de Inteligencia Artificial que pueda Buscar en la Web en Dify: Tutorial paso a paso

En esta sección guiada, construirá un flujo de trabajo de agente de IA que:

  1. Acepta una frase clave como entrada.
  2. Utiliza la herramienta “Motor de búsqueda” del plugin Bright Data para buscar en Google utilizando esa frase clave.
  3. Procesa los resultados de la búsqueda con un LLM.

Todo este proceso es totalmente visual, sin necesidad de codificación. Conectarás cada nodo a través de una sencilla interfaz de arrastrar y soltar para dar vida a tu agente de IA.

¡Construyamos ahora su flujo de trabajo de AI de búsqueda web sin código, impulsado por Bright Data en Dify!

Requisitos previos

Para seguir este tutorial sobre la construcción de un agente AI de búsqueda web en Dify, necesitarás lo siguiente:

Si aún no dispone de ellos, utilice los enlaces anteriores y siga las instrucciones de configuración.

Nota: Para el uso en producción, también necesitarás una clave API de un proveedor de LLM (como OpenAI, Anthropic o Gemini).

Paso 1: Configurar una integración LLM en Dify

Para utilizar un LLM en Dify, primero necesitas configurar la integración LLM. Comienza haciendo clic en la imagen de tu perfil y seleccionando “Configuración”:

Ir a la configuración

A continuación, vaya a la página “Proveedor de modelos”. Aquí, por ejemplo, puedes instalar el plugin del proveedor OpenAI:

Selección del plugin proveedor de OpenAI

Por defecto, dispones de 200 créditos de mensajes gratuitos. Para eliminar esta limitación, después de instalar el plugin, configura los ajustes de OpenAI añadiendo tu clave API de OpenAI:

Configuración de la clave API de OpenAI

Alternativamente, para una integración LLM gratuita y permanente, considere el uso del proveedor Gemini LLM. Algunos modelos de Gemini, como Flash 2.0, son de uso gratuito incluso a través de API.

¡Muy bien! Ahora está listo para comenzar a construir su flujo de trabajo Dify AI con capacidades de búsqueda web.

Paso 2: Instalar el plugin de Bright Data

Visite la página de versiones en el repositorio de GitHub para el plugin de Bright Data y descargue el archivo llamado brightdata_plugin.difypkg.

Para instalarlo en Dify, haga clic en “PLUGINS” para abrir el mercado de plugins, a continuación, seleccione “Instalar desde archivo de paquete local”:

Carga del último plugin de Bright Data para Dify

Elija el archivo local .difypkg que descargó anteriormente y pulse el botón “Instalar”:

Instalación del complemento Bright Data Web Scraper

¡Ya está! El plugin de Bright Data se ha instalado correctamente en Dify.

Paso 3: Diseñe su nueva aplicación Dify

Ahora que todo está configurado, usted está listo para comenzar a construir su agente de IA. Desde la página de inicio del espacio de trabajo de Dify, cree una nueva aplicación seleccionando “Crear desde blanco” como se muestra a continuación:

Seleccionar la opción "Crear a partir de un espacio en blanco

A continuación, elige “Flujo de trabajo” como tipo de aplicación, dale un nombre a tu aplicación de IA y haz clic en “Crear”:

Creación de un nuevo flujo de trabajo de IA

Esto generará un nuevo lienzo de flujo de trabajo en blanco:

Su nuevo flujo de trabajo con Dify

Antes de lanzarte a construir tu agente de IA sin código, tómate un momento para esbozar qué debe hacer el agente y qué nodos necesitarás. Para este tutorial, puedes lograr el objetivo a través de un simple flujo de trabajo de cuatro pasos con los siguientes nodos:

  1. Un nodo “Inicio” para definir la variable de entrada (la frase clave).
  2. Un nodo “Buscador” para buscar en la web utilizando esa frase clave.
  3. Un nodo “LLM” para analizar los resultados de la búsqueda y extraer información útil mediante una consulta personalizada.
  4. Un nodo “Fin” para mostrar el informe final generado por la IA.

¡Impresionante! Es hora de implementar su flujo de trabajo AI de búsqueda web en Dify.

Paso nº 4: Configurar el nodo “Inicio

Para empezar, haga clic en el nodo “Inicio” y seleccione “CAMPO DE ENTRADA”:

Configuración del nodo "Inicio

Establezca el “Tipo de campo” en “Texto corto”, ya que introducirá una consulta de texto corto como entrada. Nombre el campo de entrada search_topic. Esto representa la frase clave que el agente de IA utilizará para realizar la búsqueda web.

Haga clic en “Guardar” para confirmar:

Configuración de la variable de entrada search_topic

Muy bien. El nodo “Inicio” ya está correctamente configurado.

Paso nº 5: Integrar el nodo “Motor de búsqueda

Continúe haciendo clic en el icono “+” del nodo “Inicio”. A continuación, vaya a “Herramientas” > “Bright Data Web Scraper” > “Motor de búsqueda”:

La herramienta del motor de búsqueda de Bright Data

Este nodo plugin de Bright Data sirve de puente entre su flujo de trabajo de Dify y la infraestructura de IA de Bright Data. En concreto, la herramienta “Motor de búsqueda” permite a su agente de IA recuperar resultados de búsqueda en tiempo real directamente desde la web.

Ahora, haga clic en “Autorizar” e introduzca su token de API de Bright Data:

Inserción del token de la API de Bright Data

Una vez autorizado, el plugin de Bright Data se conectará a su cuenta.

Ahora, pase la variable de entrada que configuró anteriormente. En el campo “Consulta de búsqueda”, escriba “/” para ver las variables disponibles y seleccione search_topic. El nodo “Buscador” realizará una búsqueda web en vivo basada en la entrada del usuario:

Configuración de la entrada del nodo "Motor de búsqueda

Por último, en el menú desplegable “BUSCADOR”, elija el motor de búsqueda que desea utilizar (para este tutorial, utilizaremos Google):

Elegir un motor de búsqueda entre los de la lista

¡Estupendo! El nodo “Motor de búsqueda” de Bright Data ya está en su sitio.

Paso nº 6: Añadir el nodo “LLM

En el nodo “Motor de búsqueda”, haga clic en el icono “+” y seleccione el nodo “LLM”:

Añadir el nodo LLM

En la sección “MODELO”, haga clic en “Configurar modelo” y elija un LLM de la lista (por ejemplo, gpt-4):

Selección de un modelo LLM

En la sección “SISTEMA”, introduzca un mensaje como el siguiente:

You are an expert SEO analyst. You have been given data containing the results from a Google search.

Based on this information, please report on the following:
- Common Talking Points: What are the most common themes and keywords you see repeated in the search result titles and descriptions?
- Dominant Content Types: Based on the titles, what kind of articles seem to be ranking? (e.g., "What is...", "Top 10...", "Beginner's Guide...", "Vs...").

Also, report the URLs.

Search Results Data:
{{Search_engine.text}}

Este mensaje indica al LLM que:

  • Analice los resultados de búsqueda devueltos por el nodo “Motor de búsqueda”.
  • Extraiga temas recurrentes, formatos de contenido populares y URL asociadas, actuando como un analista SEO.

Nota: La variable {{Motor_busqueda.texto}} pasa la salida de texto del nodo “Motor_busqueda” directamente al prompt del LLM. En otras palabras, el LLM tiene acceso a los datos de búsqueda web en tiempo real devueltos por el nodo “Motor de búsqueda”.

A continuación se muestra el aspecto que tendrá la configuración del nodo “LLM”:

Añadir la solicitud de información al LLM

Fantástico. Sólo queda añadir el último nodo al flujo de trabajo.

Paso 7: Finalizar el flujo de trabajo de IA con un nodo “final

Complete su flujo de trabajo añadiendo un nodo “Fin”:

Añadir el nodo Fin

Este nodo devolverá la salida final generada por el LLM. Para configurar ese comportamiento, haga clic en la sección “VARIABLE DE SALIDA” y seleccione la variable de texto del nodo LLM:

Configuración del nodo final

Esta configuración garantiza que la respuesta final de su LLM (basada en los resultados en directo del motor de búsqueda) se devuelva como salida de todo el flujo de trabajo.

Paso nº 8: Ejecutar el flujo de trabajo de búsqueda web AI

Este es su flujo de trabajo final de búsqueda web AI en Dify, impulsado por la herramienta “Search Engine” de Bright Data:

Todo el flujo de trabajo de la IA de búsqueda en Internet

Para ejecutar el flujo de trabajo, haga clic en el botón “Ejecutar”. En el campo de entrada search_topic, escriba el tema que desea investigar (por ejemplo,“nuevos protocolos de IA“). A continuación, pulse “Iniciar ejecución” para lanzar el agente:

Ejecutar el flujo de trabajo de IA

Ahora se iniciará el flujo de trabajo. El nodo Bright Data realizará una búsqueda en vivo en Google, y el nodo LLM recibirá los resultados y generará el resumen según las instrucciones.

El resultado final aparecerá en la pestaña “Resultado”. Puede ser algo parecido a esto:

El resultado final

A continuación se muestra el resultado en forma de texto:

Common Talking Points: The most frequently mentioned themes and keywords in the search results are "AI protocols", "Model Context Protocol (MCP)", "Agent2Agent (A2A) protocol", "Agent Communication Protocol (ACP)", "AI integration", "AI agent communications", "non-deterministic behavior", "secure, two-way connections", "data sources", and "AI-powered tools". These terms suggest a focus on new methodologies and standards in AI technology, particularly in terms of communication and integration.

Dominant Content Types: The search results seem to include a mix of explanatory articles, guides, and news updates. There are multiple "What is..." type articles, explaining terms like MCP, A2A, and ACP. "A developer's guide to AI protocols..." and "What Every AI Engineer Should Know About A2A, MCP &..." are examples of guide-type articles, while titles like "Introducing the Model Context Protocol Anthropic" and "AI Will Be Governed by Protocols No One Has Agreed on yet" suggest news updates or announcements.
URLs:
1. https://www.anthropic.com/news/model-context-protocol
2. https://www.infoworld.com/article/4007686/a-developers-guide-to-ai-protocols-mcp-a2a-and-acp.html
3. https://www.businessinsider.com/ai-protocol-rules-future-2025-6
4. https://www.cio.com/article/3991302/ai-protocols-set-standards-for-scalable-results.html
5. https://www.forbes.com/sites/craigsmith/2025/04/07/how-a-simple-protocol-is-changing-everything-about-ai/
6. https://hackernoon.com/mcp-a2a-agp-acp-making-sense-of-the-new-ai-protocols
7. https://www.youtube.com/watch?v=rmphqjsc4Po
8. https://www.youtube.com/watch?v=CQywdSdi5iA
9. https://www.youtube.com/watch?v=TQXG4r0U2PQ
10. https://techstrong.ai/aiops/model-context-protocol-the-new-standard-for-ai-interoperability/
11. https://developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/
12. https://www.axios.com/2025/04/17/model-context-protocol-anthropic-open-source

Siguiendo las instrucciones, el modelo LLM informó de los resultados tal y como usted le indicó:

  • Identificados puntos de discusión comunes como “Protocolo de Contexto Modelo (MCP)” y “Protocolo Agente a Agente (A2A)”.
  • Tipos de contenido dominantes destacados, como guías para desarrolladores y artículos informativos.
  • Enumera las URL pertinentes para lecturas complementarias.

¡Et voilà! Ha creado con éxito un agente de IA que puede buscar información en la web en tiempo real y proporcionar información personalizada.

Conclusión

En este artículo, aprendiste cómo usar Dify para construir un flujo de trabajo de IA sin código capaz de buscar en la web. Esta funcionalidad es posible gracias al plugin Bright Data de Dify, que proporciona una herramienta de “motor de búsqueda” que recupera datos SERP en tiempo real de los principales motores de búsqueda.

Aunque éste es sólo un ejemplo, son posibles muchos otros casos de uso. Independientemente de sus objetivos específicos de flujo de trabajo de IA, los agentes eficaces necesitan acceso a herramientas para recuperar, validar y transformar datos web. Eso es precisamente lo que proporciona la infraestructura de IA de Bright Data.

Cree una cuenta gratuita en Bright Data y empiece hoy mismo a experimentar con nuestras herramientas de datos preparadas para la IA.