Conjuntos de datos de GitHub
Los conjuntos de datos de GitHub ofrecen una fuente dinámica de datos que impulsa la innovación y permite a las empresas y a los investigadores extraer información valiosa
- Cientos de miles de registros disponibles
- Accede a los principales puntos de datos de Github
- Muestras de datos gratuitas de Github para descargar
Trusted by 20,000+ customers worldwide
Available datasets
Access fresh validated GitHub datasets. Ensure hassle-free data access by using ready-made scrapers.
- Demo data in JSON/CSV
- Fresh records
- Customize, enrich, and format the data
LinkedIn people profiles
Amazon products
LinkedIn company information
Instagram - Profiles
Crunchbase companies information
Linkedin job listings information
Google Maps businesses
Zillow properties listing information
Instagram - Posts
X (formerly Twitter) - Posts
LinkedIn posts
TikTok - Profiles
Facebook - Pages Posts by Profile URL
Shopee - products
Amazon Reviews
Walmart - products
Indeed job listings information
TikTok - Posts
Youtube - Videos posts
Employees business enriched dataset
Companies information enriched dataset
YouTube - Profiles
IMDB media
Airbnb Properties Information
Glassdoor companies overview information
X (formerly Twitter) - Profiles
TikTok Shop
Yahoo Finance business information
Google News
Shein- Products
Facebook - Comments
Booking Hotel Listings
Yelp businesses overview
Instagram - Reels
Otodom Poland
Google maps reviews
Instagram - Comments
Glassdoor job listings information
LinkedIn profiles Jobs Listings
Zoominfo companies information
Reddit- Posts
Glassdoor companies reviews
Amazon products global dataset
pitchbook companies information
Amazon sellers info
eBay
G2 software product overview
Amazon best seller products
Google Shopping
Github repository
Australia real estate properties
Facebook - Posts by group URL
Google Play Store
Facebook Marketplace
Home Depot US
Facebook - Posts by post URL
TikTok - Comments
Goodreads books
Booking Listings Search
Amazon Walmart
Amazon products search
Etsy
G2 software - product reviews
Zara - Products
Trustpilot business reviews
Yelp businesses reviews
Zillow price history
Indeed companies info
Zoopla properties listing information
World population
Reddit - Comments
Ikea - Products
Lazada - Products
Best Buy products
Pitchbook People Profiles
NBA players' stats
Target
Youtube - Comments
Myntra products
Google Play Store reviews
Ozon.ru products
Sephora products
Wikipedia articles
BBC news
OLX Brazil - marketplace ads
Pinterest - Posts
Realtor international properties listings
Facebook - Reels by profile URL
H&M - Products
Owler companies information
Facebook Events
Facebook Company Reviews
Xing social network
US lawyers directory
Webmotors Brasil - Cars Listings
Creative Commons Images
CNN news
Lowes.com
Google Shopping products search US
Digikey - Products
Wildberries.ru products
Zonaprop Argentina - Properties Listing
Walmart sellers info
Slintel 6sense company information
Tokopedia Products
Mouser - Products
Wayfair products
carsales.com.au - Cars Listings
Apple App Store reviews
Manta businesses
Pinterest - Profiles
Zalando products
Chileautos Chile - Cars Listings
Carsales Cars Listings search page information
Quora posts
Agoda Properties Listings
Asos - Products
Lazada - Reviews
Yapo Chile - marketplace ads
Lego - Products
VentureRadar company information
Bluesky - Posts
Inmuebles24 Mexico - Properties Listings
Naver products
Trustradius product reviews
Apple App Store
Creative Commons 3D Models
World zipcodes
Chanel Products
Metrocuadrado - Properties Listings
Hermes- Products
Home Depot CA
Top 500 Bluesky Profiles
Dior - Products
Vimeo - Videos posts
Lazada products search (GMV)
AE.com - Complete Products
Toctoc - Properties Listings
Mediamarkt.de products
Balenciaga.com - Products
Mango Products
Ashleyfurniture - Products
Infocasas Uruguay - Properties Listings
Toysrus - Products
Properati Argentina and Colombia - Properties Listings
Twitch - streams dataset
Fanatics.com - Products
Google Maps full information
Carters.com - Products
Zara Home Products
Prada.com - Products
Ysl.com - Products
Fendi Products
Crateandbarrel - Products
Loewe.com - Products
Delvaux - Products
Bottegaveneta.com - Products
Massimo Dutti - Products
Walmart - products zipcodes
Mybobs.com - Products
Celine.com - Products
Sleepnumber.com - Products
ChatGPT Search
Mattressfirm - Products
Berluti.com - Products
Montblanc - Products
llbean.com - Products
Raymourflanigan.com - Products
La-z-boy.com - Products
Moynat.com - Products
Zillow Full Properties Information
Zillow properties search page
LinkedIn people search
Google AI Mode Search
Walmart products search
Gemini Search
Perplexity Search
Grok Search
Snapchat posts
Agoda Listings Search
TikTok - Posts by URL Fast API
Bing Copilot Search
Perplexity Search - Places Tab
Snapchat profile
TikTok - Posts by Search URL Fast API
TikTok - Posts by Profile Fast API
Muestra del conjunto de datos de GitHub
El conjunto de datos del repositorio de GitHub proporciona información esencial sobre el mundo del «software» de código abierto. Con información completa sobre los lenguajes de codificación, los tamaños de los repositorios y las contribuciones de los usuarios, este conjunto de datos permite a los usuarios profundizar en las complejidades del desarrollo de «software».
Precios de conjuntos de datos
- Libres y validados
- Se actualiza cada mes
- JSON/CSV/Parquet
Suscripción a datos
Suscríbete para acceder a conjuntos de datos por un precio mucho más bajo.
Formatos de exportación de los archivos
JSON, NDJSON, JSON Lines, CSV, Parquet. Compresión opcional en .gz.
Entrega flexible
Snowflake, almacenamiento de Amazon S3, Google Cloud, Azure y SFTP.
Datos ajustables a escala
Ajusta la escala sin preocuparte por la infraestructura, por los servidores proxy o por los bloqueos.
Ahorro de costes
Personaliza cualquier conjunto de datos con filtros y con opciones de formato.
Mantenimiento de código
Los conjuntos de datos se mantienen en función de los cambios que se realicen en la estructura del sitio web.
Integraciones simplificadas
Saca partido de las integraciones con Snowflake y AWS.
Servicio de asistencia disponible las 24 horas del día
Un equipo exclusivo de expertos en datos está aquí para ayudarte.
Líderes en cumplimiento
Los datos se obtienen de forma ética y cumplen con todas las leyes de privacidad.
Consigue datos de Github estructurados y fiables
Te facilitamos los datos mientras tú te centras en lo demás
Datos web de gran volumen
Con nuestras funciones de desbloqueo y de rotación de las direcciones IP las 24 horas del día, garantizamos el acceso a todos los puntos de datos de un sitio web.
Datos para uso inmediato
Todos los aspectos del proceso de recopilación de datos se validan a fondo como parte de nuestro potente proceso de validación de datos.
Flujo de datos automatizado
Crea cronogramas personalizados para automatizar la entrega de datos y comprueba cómo los datos fluyen sin problemas hacia su almacenamiento.
Cómo utilizan las empresas los conjuntos de datos de GitHub
Actividad de desarrolladores
Participación de la comunidad
Mejora la participación
Preguntas frecuentes sobre el conjunto de datos de GitHub
¿Qué datos se incluyen en el conjunto de datos de GitHub?
El conjunto de datos de GitHub incluye diferentes puntos de datos que se adaptan a tus necesidades. Algunos de los puntos de datos incluyen: URL, ID, código, lenguaje de código, número de líneas, nombre de usuario, URL de usuario, tamaño, unidad de tamaño, número de tamaño, número de proyectos, número de bifurcaciones, número de estrellas y mucho más.
¿Puedo obtener actualizaciones para el conjunto de datos de GitHub que he comprado?
Sí, puedes obtener actualizaciones diarias, semanales, mensuales o personalizadas de tu conjunto de datos de GitHub.
¿Puedo comprar un subconjunto del conjunto de datos de GitHub?
Sí, puedes comprar un subconjunto de GitHub que incluirá solo los puntos de datos que necesites. Al comprar un subconjunto de datos, el precio se reduce de forma notable.
¿En qué formato recibiré el conjunto de datos de GitHub?
Los formatos de los conjuntos de datos son JSON, NDJSON, JSON Lines, CSV o Parquet. Si lo prefieres, los archivos se pueden comprimir en formato .gz.
¿Puedo raspar por mi cuenta datos públicos de GitHub?
Si no quieres comprar un conjunto de datos, puedes empezar a raspar datos de GitHub utilizando nuestra API de raspado para GitHub.
¿Puedo obtener una muestra de datos?
Sí, puedes solicitar datos de muestra para evaluar la calidad y la relevancia de la información facilitada. Es una buena forma de asegurarte de que satisface tus necesidades antes de decidirte por un conjunto de datos completo.
¿Puedo solicitar puntos de datos específicos del conjunto de datos de GitHub?
Sí, puedes solicitar puntos de datos específicos del conjunto de datos de GitHub adaptados a tus necesidades únicas, asegurándote de que recibes exactamente la información que necesitas para tus proyectos.
¿Es posible integrar el conjunto de datos de GitHub directamente en mis sistemas actuales?
Por supuesto, el conjunto de datos de GitHub ofrece una integración API sin fisuras, lo que te permite integrar sin esfuerzo los datos en tu CRM, herramientas de análisis o cualquier otro sistema que utilices, agilizando tus operaciones.