Fake news dataset

Detect and prevent the dissemination of false information.

  • Available as a custom dataset request
  • Get data from major social media and news websites
  • 100% compliant scraping
fake news datasets
                              {
  "type": "object",
  "fields": {
    "news_records": {
      "type": "array",
      "active": true,
      "items": {
        "type": "object",
        "fields": {
          "article_id": {
            "type": "text",
            "active": true,
            "sample_value": "FN12345"
          },
          "title": {
            "type": "text",
            "active": true,
            "sample_value": "Shocking Discovery in Ancient Pyramid"
          },
          "author": {
            "type": "text",
            "active": true,
            "sample_value": "John Doe"
          },
          "publication_date": {
            "type": "date",
            "active": true,
            "sample_value": "2023-10-01"
          },
          "source_name": {
            "type": "text",
            "active": true,
            "sample_value": "Unreliable News Network"
          },
          "source_url": {
            "type": "url",
            "active": true,
            "sample_value": "https://unreliablenews.com/article123"
          },
          "source_reliability_score": {
            "type": "number",
            "active": true,
            "sample_value": 2.3
          },
          "content": {
            "type": "text",
            "active": true,
            "sample_value": "An ancient pyramid reveals a shocking secret..."
          },
          "credibility_rating": {
            "type": "number",
            "active": true,
            "sample_value": 1.5
          },
          "fake_news_score": {
            "type": "number",
            "active": true,
            "sample_value": 4.8
          },
          "fact_checked": {
            "type": "boolean",
            "active": true,
            "sample_value": true
          },
          "fact_check_url": {
            "type": "url",
            "active": true,
            "sample_value": "https://factchecker.org/fake-news/shocking-discovery"
          },
          "tags": {
            "type": "array",
            "active": true,
            "items": {
              "type": "text",
              "sample_value": "conspiracy"
            }
          },
          "comments": {
            "type": "array",
            "active": true,
            "items": {
              "type": "object",
              "fields": {
                "comment_id": {
                  "type": "text",
                  "active": true,
                  "sample_value": "CMT001"
                },
                "user": {
                  "type": "text",
                  "active": true,
                  "sample_value": "JaneSmith123"
                },
                "comment_text": {
                  "type": "text",
                  "active": true,
                  "sample_value": "This sounds too strange to be true!"
                },
                "sentiment_score": {
                  "type": "number",
                  "active": true,
                  "sample_value": -0.7
                },
                "date": {
                  "type": "date",
                  "active": true,
                  "sample_value": "2023-10-02"
                }
              }
            }
          }
        }
      }
    },
    "url": {
      "type": "url",
      "required": true,
      "active": true,
      "sample_value": "https://example.com/fake_news_data"
    }
  }
}
                              
                            

Fake news dataset sample

Choose from fully managed or self-managed fake news datasets. Fully managed datasets provide a hands-off experience with data maintained by our partners, while self-managed datasets allow you to set up and customize data collection and validation rules. The fake news data points may include article title, author, publication date, source reliability, content credibility rating, and more.
EL PROCESO

Plataforma automatizada de creación de conjuntos de datos

Optimiza tu proceso de recopilación de datos para centrarte en lo importante.
  1. Configuración inicial

    Añade las URL de tu sitio web objetivo.

  2. Creación de muestras

    Obtén un esquema y una muestra generados por IA. Configura las reglas de validación.

  3. Prueba de concepto

    El raspador de datos se basa en el esquema y las reglas de validación.

  4. Recopilación y entrega de datos

    Los datos se recopilan y se entregan.

Precios de conjuntos de datos personalizados

CONJUNTO DE DATOS PERSONALIZADOS
Subscription
Starting from
$300/month
One time
Starting from
$1,000
Proof of Concept
One time
$500
  • Esquema y muestra generados por IA
  • Control de la validación de datos
  • Estimación en tiempo real de la cantidad de productos
  • Diario, semanal, mensual o personalizado

Fake news datasets tailored to your needs

Get easy to use, well-structured datasets for any use case

Suscripción a datos

Suscríbete para acceder a conjuntos de datos por un precio mucho más bajo.

Formatos de exportación de los archivos

JSON, NDJSON, JSON Lines, CSV, Parquet. Compresión opcional en .gz.

Entrega flexible

Snowflake, almacenamiento de Amazon S3, Google Cloud, Azure y SFTP.

Datos ajustables a escala

Ajusta la escala sin preocuparte por la infraestructura, por los servidores proxy o por los bloqueos.

Ahorro de costes

Personaliza cualquier conjunto de datos con filtros y con opciones de formato.

Mantenimiento de código

Los conjuntos de datos se mantienen en función de los cambios que se realicen en la estructura del sitio web.

Integraciones simplificadas

Saca partido de las integraciones con Snowflake y AWS.

Servicio de asistencia disponible las 24 horas del día

Un equipo exclusivo de expertos en datos está aquí para ayudarte.

Líderes en cumplimiento

Los datos se obtienen de forma ética y cumplen con todas las leyes de privacidad.

Get structured and reliable Fake news data

Te facilitamos los datos mientras tú te centras en lo demás

Datos web de gran volumen

Con nuestras funciones de desbloqueo y de rotación de las direcciones IP las 24 horas del día, garantizamos el acceso a todos los puntos de datos de un sitio web.

Datos para uso inmediato

Todos los aspectos del proceso de recopilación de datos se validan a fondo como parte de nuestro potente proceso de validación de datos.

Flujo de datos automatizado

Crea cronogramas personalizados para automatizar la entrega de datos y comprueba cómo los datos fluyen sin problemas hacia su almacenamiento.

How companies use Fake news datasets

Monitor publications

Verify the authenticity of news articles by analyzing specific data points that could potentially indicate on the validity of the article. Datapoints could include: source, date and time of publication and more.
Get dataset

Machine learning

Media companies can train their machine learning model using fake news datasets. Data points such as article text, headlines, author, or publication sources helps the ML detect and remove false information automatically, ensuring quality and credibility of their content.
Get dataset

Government and law enforcement

In the fight against disinformation and its negative effects on society, fake news datasets provide government agencies and law enforcement with a vital tool for tracking and monitoring false information.
Get dataset

Get your Fake news dataset today.