Blog / AI
AI

Utilice Dify para crear agentes de IA con capacidad de recuperación de datos

Aprenda a crear agentes de IA con Dify y Bright Data para la recuperación precisa de datos web en este sencillo tutorial.
5 min de lectura
Building AI agents with Dify

En este tutorial aprenderás:

  • Qué es Dify y por qué es una herramienta interesante para construir agentes de IA.
  • Por qué los agentes de IA necesitan acceder a datos web frescos y precisos para ofrecer resultados fiables.
  • Cómo crear un agente de IA con capacidades de recuperación de datos utilizando un flujo de trabajo Dify sin código.

Sumerjámonos.

¿Qué es Dify?

Dify es una plataforma de código abierto cada vez más popular para crear aplicaciones de IA generativa con LLM. Simplifica el proceso de desarrollo al ofrecer una interfaz visual sin código/con código reducido para crear flujos de trabajo de IA y canalizaciones RAG.

El gráfico de crecimiento por estrellas de GitHub para Dify

Puedes aprovechar Dify a través de su versión auto-alojada de código abierto o utilizarlo directamente en la nube sin configuración (como haremos aquí). Esencialmente, actúa como un BaaS(Backend-as-a-Service) para operaciones LLM.

Dify soporta una amplia gama de LLMs y ofrece amplias capacidades de integración a través de varios plugins. Estos permiten la conexión con diversos servicios y soluciones de terceros. En el momento de redactar este artículo, su mercado cuenta con unos 100 plugins y extensiones.

Los agentes de IA deben ser precisos y eficaces

Independientemente de la plataforma, biblioteca o herramienta de creación de agentes de IA que elijas, existe una limitación importante: para ser precisos, los agentes de IA necesitan datos de alta calidad. A este respecto, ten en cuenta que la Web es una de las fuentes de datos más ricas y fiables.

Por eso, para ser realmente eficaz, un agente de IA debe ser capaz de acceder y extraer datos directamente de las páginas web. Pero no basta con extraer el contenido en bruto. Los datos deben estar optimizados para su uso en IA, idealmente en formato Markdown.

Consejo profesional: Markdown es compacto y más fácil de procesar para los modelos de IA, lo que suele dar lugar a resultados más precisos, como confirman nuestras pruebas comparativas.

Es por eso que sus agentes de Dify AI necesitan un plugin que pueda extraer contenido estructurado como Markdown de cualquier página web. Eso es específicamente lo que ofrece el plugin Bright Data de Dify. Además de eso, permite a su agente de IA sin código extraer datos frescos de los motores de búsqueda y más de 50 plataformas populares en formato JSON estructurado.

El plugin Bright Data maneja todos los desafíos del web scraping por usted, incluyendo CAPTCHAs, bloqueos de IP, límites de tasa y más. Luego, gracias al constructor de flujo sin código de Dify, usted puede integrar todo en su agente de IA simplemente conectando nodos. El resultado es un agente de IA listo para producción con acceso a datos web fiables y en tiempo real.

Cómo integrar el plugin Bright Data en Dify para la creación de agentes de IA

En esta sección guiada, usted aprenderá cómo construir un agente de IA en Dify. En particular, se utilizará el plugin Bright Data como el motor de datos listo para la IA que alimenta el agente con información de confianza.

Vamos a caminar a través de la construcción de un simple agente de resumen que puede resumir el contenido de cualquier página web. Tenga en cuenta que esto es sólo un ejemplo para demostrar lo que es posible con la integración de Dify + Bright Data. Puede cubrir muchos otros casos de uso con la misma facilidad.

Nota: En cierto modo, el ejemplo elegido puede verse como un flujo de trabajo agéntico RAG. La razón es que el plugin Bright Data puede considerarse como el componente de recuperación en el proceso agéntico RAG.

Siga los siguientes pasos para crear un agente de IA sin código en Dify que acceda a datos web actualizados.

Requisitos previos

Para reproducir este tutorial y construir un agente de IA en Dify powered by Bright Data, necesitas lo siguiente:

Si aún no dispone de ellos, haga clic en los enlaces anteriores y siga las instrucciones de configuración.

Paso nº 1: Integración del LLM

Nota: Si ya tienes una integración LLM configurada en tu cuenta de Dify, puedes saltarte este paso.

Para construir un agente de IA en Dify, primero necesitas configurar un proveedor LLM. Para ello, inicia sesión en Dify y accede a tu panel de control. Haz clic en tu foto de perfil en la esquina superior derecha y selecciona la opción “Configuración”:

Seleccionar la opción "Ajustes

A continuación, en la barra lateral del modal, haz clic en la opción “Proveedor de modelos”. Aquí, puedes instalar el proveedor LLM que quieras utilizar. En este tutorial, nos basaremos en Gemini (que es de uso gratuito a través de la API):

Selección de Gemini como proveedor del modelo Dify

Pase el ratón por encima de la opción Gemini y pulse el botón “Instalar”. Una vez instalado, pulsa el botón “Configurar” y pega tu clave API de Gemini para completar la configuración:

Cómo pegar la clave API de Gemini

Después de eso, pulse “Configuración del modelo de sistema” para establecer Gemini como su proveedor global LLM en su cuenta Dify:

Configuración del modelo de sistema

Elija el modelo que desea utilizar. En este caso, seleccionaremos “Gemini 2.0 Flash” (que es gratuito a través de la API). A continuación, haz clic en “Guardar”:

Selección del modelo LLM

¡Perfecto! Su integración LLM en Dify está ahora completa.

Paso 2: Instalación del plugin de Bright Data

Ha llegado el momento de instalar el plugin Bright Data Dify. Para ello, haga clic en la opción “PLUGINS” situada en la barra lateral a la izquierda de su foto de perfil:

Haciendo clic en la opción "PLUGINS

En la sección Dify Plugin Marketplace, haga clic en el botón “Instalar Plugin”, luego elija la opción “GitHub”:

Seleccionar el botón de instalación de "GitHub

En el modal que aparece, pegue la URL de GitHub para el plugin Bright Data Dify:

https://github.com/Idanvilenski/BrightData_Dify_Plugin
Configuración de la URL de GitHub para el plugin Bright Data Dify

Seleccione la versión del plugin (se recomienda la última), elija el paquete del plugin y haga clic en “Siguiente”:

Instalación del plugin Bright Data Dify a través de GitHub

Haga clic en “Instalar” para finalizar la instalación del plugin. Una vez instalado, haga clic en la tarjeta del plugin. En el panel que se abre a la derecha, haga clic en el botón “Autorizar”:

Haga clic en Autorizar

Introduzca su código de acceso a la API de Bright Data y haga clic en “Guardar”:

Cómo guardar su clave API de Bright Data

¡Sorprendente! El plugin Bright Data Dify ya está instalado y sus herramientas listas para usar.

Paso 3: Crear una nueva aplicación de Dify

Ahora tiene todo en su lugar para crear su agente de resumen AI sin código. Vuelva a su panel de control de Dify y haga clic en “CREAR APP > Crear desde cero” para iniciar un nuevo proyecto de agente AI:

Hacer clic en la opción "Crear a partir de un espacio en blanco

Seleccione la plantilla “Flujo de trabajo”, denomine a su agente de IA algo así como “Agente de resumen de IA” y, a continuación, haga clic en “Crear” para inicializar la aplicación:

Inicializando su nuevo agente de IA en Dify

Verá el lienzo visual donde puede construir su agente conectando nodos:

El lienzo para crear tu lógica de agente de IA sin código

Aquí es donde definirás la lógica y el flujo de datos de tu agente de IA enlazando diferentes componentes. Fantástico.

Paso 4: Diseñar la lógica del agente de IA

Antes de implementar su agente de IA sin código, dedique algún tiempo a idear lo que el agente de IA necesita hacer. En este caso, el agente de IA debería:

  1. Recibir la URL de la página web a resumir.
  2. Pase la URL al complemento Bright Data para recuperar el contenido de su página en formato Markdown.
  3. Envía el contenido Markdown al LLM configurado con una solicitud para generar un resumen.
  4. Devuelve al usuario el contenido resumido.

En los siguientes cuatro pasos, usted implementará cada una de estas acciones conectando nodos y usando plugins en Dify.

Paso 5: Configurar el parámetro de entrada URL de la página

En primer lugar, haz clic en el nodo “START” y, a continuación, en el icono “+” para añadir una nueva variable de entrada:

Pulsar el botón "+".

En las opciones de tipo de entrada, seleccione el tipo de datos “Párrafo”. Es ideal para introducir texto como una URL. Nombra la entrada como page_url:

Definición de la entrada page_url "Párrafo

Asegúrate de que la opción “Requerido” está activada, ya que esta entrada es esencial para que este agente de IA funcione. Después de guardar, verás algo como esto:

Observe el parámetro de entrada page_url configurado

Vea cómo el nodo “START” muestra ahora su variable de entrada personalizada. ¡Bien hecho!

Paso 6: Recuperar el contenido Markdown con el plugin Bright Data

Haga clic en el botón “+” del nodo “START” y seleccione el plugin Bright Data. A continuación, elija la herramienta “Scrape As Markdown”:

Elección de la herramienta "Scrape As Markdown

Configure la herramienta estableciendo page_url como parámetro de entrada. Además, active la opción “RETRY ON FAILURE”. Esto permite que el complemento Bright Data reintente automáticamente si se produce un error durante el proceso de raspado:

Configuración de la herramienta "SCRAPE AS MARKDOWN" del plugin Bright Data

¡Maravilloso! El plugin Bright Data ahora tomará la URL proporcionada, raspará la página y devolverá su contenido en formato Markdown.

Paso 7: Integrar la lógica de síntesis del LLM

El siguiente paso es conectar un nodo LLM que resumirá el contenido Markdown devuelto por el plugin Bright Data. Haga clic en el icono “+” del nodo “Scrape As Markdown” y seleccione “LLM”:

Selección del nodo LLM

En la configuración del nodo “LLM”, establezca la entrada “CONTEXT” en la variable de texto, que es la salida de la herramienta “Scrape As Markdown”.

A continuación, escribe un aviso como el siguiente:

You are a summarization agent. Based on the Markdown content provided below, write a concise and helpful summary in no more than 150 words. Focus on capturing the key elements of the content.

Content:
{CONTEXT}
Añadir la indicación con el contexto

El nodo “LLM” actúa como el cerebro de su agente Dify AI, procesando los datos y generando el resumen. ¡Fantástico! Usted casi ha terminado con la lógica de construcción del agente de IA.

Paso nº 8: Devolver el resumen

Como paso final en su flujo de trabajo sin código del agente Dify AI, añada un nodo “Fin”:

Seleccionar un nodo "Fin

Configure el nodo “END” para utilizar la salida de texto del nodo LLM:

Configuración de la variable de salida "texto

Este nodo se encargará de devolver al usuario el contenido final resumido. ¡Misión completada! Su agente de resumen de IA sin código está listo para usar.

Paso 9: Pruebe su agente de IA

Esto es lo que su flujo de trabajo agente Dify AI completado debe ser similar:

El flujo de trabajo final del agente de IA de Dify

Con sólo cuatro nodos, has construido un agente de IA del mundo real con capacidades de resumen precisas.

Para probarlo, haz clic en el botón “Ejecutar” de la esquina superior derecha:

Pulsar el botón "Ejecutar

A continuación, introduzca la URL de la página que desea resumir. Para este ejemplo, tienes que utilizar un artículo de CNN Sports.

Pulse el botón “Iniciar ejecución” y verá que cada nodo se ejecuta en secuencia, volviéndose verde para indicar el éxito:

Ejecución del agente de IA

Esta es una posible salida que debería obtener:

This CNN article analyzes the epic French Open final between Carlos Alcaraz and Jannik Sinner, highlighting it as proof that men's tennis is in good hands for the future. Alcaraz's improbable comeback from two sets down against Sinner is described as a historic moment. The author notes that with the era of Djokovic, Federer, and Nadal ending, Alcaraz and Sinner have demonstrated that they are ready to fill the void. The rivalry between Alcaraz and Sinner is compared to the great rivalries of the past, with the potential to elevate the sport. Experts even suggest that Alcaraz and Sinner could beat Nadal at his best. The article emphasizes the high level of play and the exciting future of tennis with these two stars.

Se trata de un resumen conciso y contextual de menos de 150 palabras, tal y como se pedía. Fíjate en que el LLM también ha reconocido que la fuente del artículo es la CNN.

¡Et voilà! Usted acaba de construir un agente de resumen de IA completamente funcional en Dify, sin escribir una sola línea de código. Ese agente es capaz de procesar y resumir cualquier página web.

Conclusión

En este artículo, aprendiste cómo usar Dify para construir un agente de resumen de IA con un flujo de trabajo sin código. Para estar listo para producción, el agente necesita acceso a datos web públicos. Esto es posible gracias al plugin Bright Data de Dify, que expone herramientas avanzadas para la recuperación de datos listos para IA.

Ahora bien, esto era sólo un simple flujo de trabajo de ejemplo, pero es posible que desee construir agentes de IA más complejos. Para ello, necesita herramientas para recuperar, validar y transformar contenido web. Eso es exactamente lo que ofrece la infraestructura de IA de Bright Data.

Cree una cuenta gratuita de Bright Data y empiece a experimentar con nuestras herramientas de datos preparadas para la IA.