[Vídeo] Lo que 15 analistas de datos tienen que decir sobre los datos web

Más de quince científicos de datos, ingenieros de datos, ingenieros de MLOps y analistas de datos se reunieron recientemente para hablar sobre los últimos retos y oportunidades en materia de datos web y por qué las soluciones de Bright Data suponen un verdadero cambio revolucionario.
3 min de lectura

Una discusión especialmente notable que presentamos aquí, dirigida por Ken Jee, se centró en las perspectivas de los influencers sobre los datos web, junto con una entusiasta sesión de preguntas y respuestas en directo de los espectadores de Youtube.

Mark Freeman, científico de datos de una startup, inició el debate profundizando en lo que él denominó la «opacidad» de la recuperación de buenos datos web sin utilizar una herramienta de recopilación de datos como Bright Data.

«He tenido proyectos en los que intentábamos crear el MVP de algo y solo lidiar con dónde encontrar los datos era un gran desafío».

El influyente en datos de Internet e ingeniero Shashank Kalanithi continuó hablando de los puntos débiles comunes de los datos:

«Para mí, la parte más difícil de [cualquier proyecto] es obtener buenos datos. Intenté recopilar datos en tiempo real de varios sitios web de ofertas de empleo y casi siempre me bloquearon. Es una pena que los datos web públicos no siempre sean fácilmente accesibles».

El destacado ingeniero de MLOps, Miki Bazeley, continuó explicando los retos técnicos que existen hoy en día en la extracción de datos web y por qué soluciones como Bright Data son tan interesantes.«Especialmente si eres una empresa grande o una startup y estás intentando avanzar rápidamente, una de las mejores formas de hacerlo es no tener que ir despacio porque estás constantemente arreglando cosas».

Open Discussion on Web Data Collection
Debate abierto sobre la recopilación de datos web #BrightDataHouse

Zach Wilson, del canal de YouTube @Datawithzack, también describió con gran entusiasmo las ventajas de una herramienta automatizada como Bright Data.

Una de las cosas más comunes que las empresas pueden hacer con los datos web es obtener una mejor perspectiva de sus competidores. Si tienes una plataforma competitiva… no es que tus competidores te vayan a dar esos datos con solo una llamada. Te lo van a poner difícil, y ahí es donde los datos web pueden ser realmente poderosos. Debido a la naturaleza de los contratos, es probable que tu Scraper se rompa. Eso es lo que realmente me gusta de Bright Data. Puede validar tu rastreo».

El grupo, de acuerdo, profundizó entonces en las soluciones casi impecables de Bright Data. «Puede ser muy valioso externalizar… y, de nuevo, esa es una de las cosas realmente interesantes de Bright Data… Utilizan un sistema de Proxy increíble», dijo Ken Jee. «Si tienes una empresa y tu producto o tus modelos dependen de datos externos, eso puede ser muy poco fiable. Es muy difícil crear una infraestructura en torno a eso si cambia constantemente. Obviamente, Bright Data es la mejor solución porque ellos se encargan de mantenerla y tú, en esencia, se la externalizas a ellos».

A lo que Ken preguntó al grupo: «¿Es esa la mejor solución?».

El grupo de más de quince influyentes expertos en datos del mundo estuvo de acuerdo. De hecho, Bright Data es la solución de datos más interesante de la actualidad. No te pierdas el vídeo completo para ver todo el debate de los «vengadores de los datos», junto con su interesante opinión sobre la caja de herramientas que ofrece Bright Data.