Cuentas Venezuela

Metodología

Cómo extraemos, procesamos y publicamos los datos.

Principios

  • Nunca publicamos datos personales identificables.
  • Toda visualización cita su fuente y fecha de extracción.
  • Las estimaciones se marcan explícitamente como tales.
  • El código del pipeline es público y auditable.

Flujo

  1. Extracción: pipelines Python descargan CSV/XLSX o consumen APIs oficiales (INE, Servicio Nacional de Migraciones, Superintendencia de Pensiones, SII, etc.).
  2. Transformación: limpieza, normalización de códigos territoriales (DPA chileno), reconciliación temporal con Polars y DuckDB.
  3. Almacenamiento: hechos en Parquet (object storage S3-compatible). Metadata y dimensiones en Postgres.
  4. Publicación: API agrega y sirve, frontend renderiza con cita y descarga directa.

Fuentes prioritarias

INE (Censo, ENE, EOD), Servicio Nacional de Migraciones, Superintendencia de Pensiones, SII, MINSAL/Fonasa, MINEDUC, Carabineros (con contexto), SJM y reportes ONU/OIM para estimaciones de irregularidad.