Conjuntos de datos de GitHub
El conjunto de datos de GitHub ofrece una visión completa del ecosistema del software de código abierto, proporcionando información detallada sobre los atributos de los repositorios y las contribuciones de los desarrolladores. Los puntos de datos clave incluyen los lenguajes de programación, el tamaño de los repositorios, las contribuciones de los usuarios, los problemas, las solicitudes de extracción, las bifurcaciones y otras métricas de participación, lo que lo convierte en un recurso inestimable para analizar las tendencias de desarrollo de software y la participación de la comunidad.
Confiado por 20,000+ clientes
Conjuntos de datos disponibles
- Datos de demostración en JSON/CSV
- Registros nuevos
- Personalice, enriquezca y formatee los datos.
LinkedIn people profiles
Amazon products
LinkedIn company information
Instagram - Profiles
Crunchbase companies information
Linkedin job listings information
Instagram - Posts
Zillow properties listing information
Google Maps full information
LinkedIn posts
X (formerly Twitter) - Posts
TikTok - Profiles
Youtube - Videos posts
Amazon Reviews
Facebook - Pages Posts by Profile URL
TikTok - Posts
Indeed job listings information
Companies information enriched dataset
Shopee - products
Walmart - products
Employees business enriched dataset
TikTok Shop
YouTube - Channels
Glassdoor companies overview information
Reddit- Posts
Google maps reviews
Airbnb Properties Information
X (formerly Twitter) - Profiles
IMDB media
Instagram - Reels
Booking Hotel Listings
Glassdoor companies reviews
Yahoo Finance business information
LinkedIn profiles Jobs Listings
Shein- Products
Instagram - Comments
Yelp businesses overview
Facebook - Comments
pitchbook companies information
Zoominfo companies information
Glassdoor job listings information
Amazon sellers info
eBay
Google Shopping
Amazon products global dataset
Github repository
Otodom Poland
G2 software product overview
Home Depot US
Facebook - Posts by group URL
Facebook Marketplace
Facebook - Posts by post URL
Etsy
Amazon best seller products
Australia real estate properties
Google Play Store
TikTok - Comments
Trustpilot business reviews
G2 software - product reviews
Amazon products search
Booking Listings Search
Goodreads books
Reddit - Comments
Facebook - Profiles
Yelp businesses reviews
World population
Youtube - Comments
Zillow price history
Amazon Walmart
Target
Zara - Products
Wikipedia articles
Facebook - Pages and Profiles
Pinterest - Posts
Indeed companies info
Best Buy products
Zoopla properties listing information
NBA players' stats
Lowes.com
Lazada - Products
Facebook Events
Ikea - Products
Walmart sellers info
OLX Brazil - marketplace ads
Sephora products
Realtor international properties listings
Xing social network
Ozon.ru products
Wayfair products
Facebook - Reels by profile URL
Google Shopping products search US
Digikey - Products
Creative Commons Images
Naver products
Facebook Company Reviews
Google Play Store reviews
Myntra products
Owler companies information
US lawyers directory
Mouser - Products
Webmotors Brasil - Cars Listings
H&M - Products
Manta businesses
Agoda Properties Listings
Apple App Store reviews
Tokopedia Products
Wildberries.ru products
Zonaprop Argentina - Properties Listing
VentureRadar company information
mercadolivre.com.br products
Quora posts
Carsales Cars Listings search page information
Pinterest - Profiles
Chileautos Chile - Cars Listings
Zalando products
Inmuebles24 Mexico - Properties Listings
Yapo Chile - marketplace ads
Asos - Products
Trustradius product reviews
Hermes- Products
World zipcodes
Vimeo - Videos posts
Bluesky - Posts
Lazada - Reviews
Costco products
Lego - Products
Home Depot CA
Kroger.com
Metrocuadrado - Properties Listings
Chanel Products
Lazada products search (GMV)
Dior - Products
Aliexpress products
Toctoc - Properties Listings
Infocasas Uruguay - Properties Listings
Alibaba
Top 500 Bluesky Profiles
Properati Argentina and Colombia - Properties Listings
Ashleyfurniture - Products
Macys.com
Snapchat posts
Fanatics.com - Products
AE.com - Complete Products
Crateandbarrel - Products
Mango Products
Apple App Store
Creative Commons 3D Models
Westelm products
apple shop products
Mediamarkt.de products
Balenciaga.com - Products
Autozone - products
Rona.ca products
Sephora Products
Toysrus - Products
chewy products
Loewe.com - Products
Carters.com - Products
Zara Home Products
Sally Beauty Products
llbean.com - Products
Prada.com - Products
Fendi Products
Hoka products
adidas products
Micro Center Products
Nike products
LLBean
Massimo Dutti - Products
Ysl.com - Products
Delvaux - Products
Dick’s Sporting Goods
Bottegaveneta.com - Products
Harbor Freight Products
Barnes & Noble Products
Mattressfirm - Products
Mybobs.com - Products
Free people
B&H Products
Samsung
Lululemon products
Rei
OLD NAVY Products
Sleepnumber.com - Products
Raymourflanigan.com - Products
Berluti.com - Products
Montblanc - Products
Nordstrom
Grainger
American Eagle
Ulta
Celine.com - Products
Advance Auto Parts
Flipkart Products unified schema
Overstock Products unified schema
Dell Products
Quince Products
Neiman Marcus
Instacart Products unified schema
La-z-boy.com - Products
Williams sonoma products
hp products
Bath & Body Works
Moynat.com - Products
Mercari Products
Bass Pro Shops
OUAI Products
Sweetwater
Samsclub products
Garmin Products
Sears Products
ACE products
Tatcha Products
Rona.ca products unified schema
Ferguson Home Products
Kohl's Products unified schema
Poshmark Products unified schema
Guitar Center Products
Vevor Products
Crateandbarrel - Products
Anthropologie Products
Victoria's Secret products
Threads - Profiles
iherb products
Fragrance Net Products
Saks Fifth Avenue products
Dior Products Unified Schema
GNC Products
Staples
Summit Racing Products
Newegg Products
Parts Geek
Macys Products unified schema
Coupang products
Abercrombie & Fitch
Lenovo Products
ON Products
Pottery barn products
H&M products
Bed Bath & Beyond
academy products
Zales
GameStop Products
Urban Outfitters
Newbalance products
Sony Electronics Products
vitamin shoppe products
J.Crew Products
Theordinary products
Paula's Choice Products
Underarmour Products
Athome products
Editorialist products
thorne products
Walgreens
AT&T Products
Backcountry products
Markandgraham products
Napa Online
Flooranddecor Products
Office Depot Products
Vitacost products
Stradivarius Products
Cabelas products
Bershka Products
Zara Home products
Terrain Products
Oxo Products
tractor supply products
World Market products
Belk products
Hobbylobby
Pottery Barn Teen
Adorama
Bloomingdale's
Sharkninja
Massimodutti
Michaels Products
LA Roche Posay Products
Dollar General Products
Bjs Products
scheels products
Containerstore products
Greenrow
Lyst
Rocksbox
Peoples Jewellers products
Zara.com products
Kiehl's Products
L'oreal Paris Products
Pull & Bear Products
Oysho
Pottery Barn Kids products
Clinique Products
Nature Made Products
Blick Art Products
Asics Products
Dillard's
Nintendo products
WebstaurantStore
LG Products
Converse Products
Famousfootwear Products
Naturium Products
Pet Smart Products
Rejuvenation
Ashley Furniture
Dermalogica Products
Sur La Table Products
Canon USA products
¿Necesitas datos de Github en tiempo real?
Usa nuestro
Github Scraper API
Filtra el conjunto de datos de Github con un solo prompt
Describe exactamente lo que necesitas y deja que la IA aplique los filtros perfectos en segundos.
- Describe las necesidades de datos en inglés simple
- La IA aplica filtros precisos automáticamente
- Reduce grandes conjuntos de datos a solo lo que te importa
- Reduce costos omitiendo datos irrelevantes
- Exporta los datos filtrados en tu formato preferido
Maximiza el valor con ahorros estratégicos de costos
Actualizaciones de datos inteligentes
Accede solo a "Nuevos registros" o "Registros actualizados", asegurándote de pagar solo por lo que necesitas
Paquetes de conjuntos de datos
Obtén mayor valor al comprar dos o más conjuntos de datos juntos, con descuentos exclusivos.
Descuentos por volumen
Obtén más por menos con ahorros significativos al comprar grandes conjuntos de datos o suscripciones de actualizaciones
Conjuntos de datos enriquecidos
Ahorra tiempo y recursos con conjuntos de datos prediseñados que combinan múltiples fuentes en un único conjunto de datos limpio
GitHub dataset sample
El conjunto de datos del repositorio GitHub proporciona información esencial sobre el mundo del software de código abierto. Con información completa sobre lenguajes de programación, tamaños de repositorios y contribuciones de los usuarios, este conjunto de datos permite a los usuarios profundizar en las complejidades del desarrollo de software.
Precios de Conjuntos de Datos
- Limpio y validado
- Actualización mensual
- JSON/CSV/Parquet
Potencie los agentes de IA al instante
Nuestros conjuntos de datos Github están optimizados para AI/LLM: claramente estructurados, bien documentados, con código y recetas para una fácil integración LLM/chatbot. recetas para una fácil integración LLM/chatbot.
Estructurado y limpio
Datos preprocesados con esquemas coherentes, perfectos para el entrenamiento y la inferencia de modelos de IA.
Ejemplos de códigos
Fragmentos de Python, Node.js, cURL, PHP, Go, Java y Ruby listos para usar que se integran fácilmente en los flujos de trabajo de IA.
Documentación
curl --request GET
--url https://api.brightdata.com/datasets/snapshots/{id}/download
--header 'Autorización: Portador '
importar solicitudes
url = "https://api.brightdata.com/datasets/snapshots/{id}/download"
headers = {"Authorization": "Bearer "}
response = requests.get(url, headers=headers)
print(respuesta.json())
const url = 'https://api.brightdata.com/datasets/snapshots/{id}/download';
const options = {method: 'GET', headers: {Authorization: 'Bearer '}, body: undefined};
try {
const response = await fetch(url, options);
const data = await response.json();
console.log(datos);
} catch (error) {
console.error(error);
}
HttpResponse response = Unirest.get("https://api.brightdata.com/datasets/snapshots/{id}/download")
.header("Authorization", "Portador ")
.asString();
requerir "uri
requiere "net/http
url = URI("https://api.brightdata.com/datasets/snapshots/{id}/download")
http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true
request = Net::HTTP::Get.new(url)
request["Authorization"] = 'Portador '
response = http.request(request)
puts respuesta.leer_cuerpo
Conjuntos de datos de GitHub adaptados a sus necesidades
Suscripción de datos
Suscríbase para acceder a los conjuntos de datos a un coste significativamente reducido.
Formatos de archivo
JSON, NDJSON, JSON Lines, CSV, Parquet. Compresión .gz opcional.
Entrega flexible
Snowflake, Amazon S3 bucket, Google Cloud, Azure y SFTP.
Datos escalables
Amplíe sin preocuparse por la infraestructura, los servidores proxy o los bloqueos.
Ahorro de costes
Personaliza cualquier conjunto de datos mediante filtros y opciones de formato.
Mantenimiento del código
Los conjuntos de datos se actualizan en función de los cambios en la estructura del sitio web.
Integraciones simplificadas
Benefíciese de las integraciones con Snowflake y AWS.
Asistencia 24/7
Un equipo especializado de profesionales de datos está aquí para ayudarte.
Líderes en cumplimiento
Los datos se obtienen de forma ética y cumplen todas las leyes de privacidad.
Obtenga datos de GitHub estructurados y fiables.
Te facilitamos los datos mientras tú te centras en lo demás
Datos web de gran volumen
Con nuestras funciones de desbloqueo y de rotación de las direcciones IP las 24 horas del día, garantizamos el acceso a todos los puntos de datos de un sitio web.
Datos para uso inmediato
Todos los aspectos del proceso de recopilación de datos se validan a fondo como parte de nuestro potente proceso de validación de datos.
Flujo de datos automatizado
Crea cronogramas personalizados para automatizar la entrega de datos y comprueba cómo los datos fluyen sin problemas hacia su almacenamiento.
Cómo utilizan las empresas los Conjuntos de datos de GitHub
Actividad de los desarrolladores
Participación de la comunidad
Mejora la participación
Preguntas frecuentes sobre el conjunto de datos Github
¿Puedo obtener actualizaciones para mi conjunto de datos Github adquirido?
Sí, puede obtener actualizaciones de su conjunto de datos Github de forma diaria, semanal, mensual o personalizada.
¿Puedo comprar un subconjunto del conjunto de datos Github?
Sí, puede adquirir un subconjunto de Github que incluirá solo los puntos de datos que necesite. Al adquirir un subconjunto, el coste se reduce considerablemente.
¿En qué formato recibiré el conjunto de datos Github?
Los formatos de los conjuntos de datos son JSON, NDJSON, JSON Lines, CSV o Parquet. Opcionalmente, los archivos se pueden comprimir en .gz.
¿Puedo obtener una muestra de datos?
Sí, puede solicitar datos de muestra para evaluar la calidad y la relevancia de la información proporcionada. Es una forma estupenda de asegurarse de que se ajusta a sus necesidades antes de comprometerse con un Conjunto de datos completo.
¿Puedo solicitar puntos de datos específicos del conjunto de datos Github?
Sí, puede solicitar puntos de datos específicos del conjunto de datos Github adaptados a sus necesidades particulares, lo que le garantiza que recibirá exactamente la información que necesita para sus proyectos.
¿Es posible integrar el conjunto de datos Github directamente en mis sistemas existentes?
Por supuesto, el conjunto de datos Github ofrece una integración perfecta con la API, lo que le permite integrar sin esfuerzo los datos en su CRM, herramientas de análisis o cualquier otro sistema que utilice, agilizando sus operaciones.