Metodología · Datos Chile · Cuentas Venezuela

Principios

Nunca publicamos datos personales identificables.
Toda visualización cita su fuente y fecha de extracción.
Las estimaciones se marcan explícitamente como tales.
El código del pipeline es público y auditable.

Flujo

Extracción: pipelines Python descargan CSV/XLSX o consumen APIs oficiales (INE, Servicio Nacional de Migraciones, Superintendencia de Pensiones, SII, etc.).
Transformación: limpieza, normalización de códigos territoriales (DPA chileno), reconciliación temporal con Polars y DuckDB.
Almacenamiento: hechos en Parquet (object storage S3-compatible). Metadata y dimensiones en Postgres.
Publicación: API agrega y sirve, frontend renderiza con cita y descarga directa.

Fuentes prioritarias

INE (Censo, ENE, EOD), Servicio Nacional de Migraciones, Superintendencia de Pensiones, SII, MINSAL/Fonasa, MINEDUC, Carabineros (con contexto), SJM y reportes ONU/OIM para estimaciones de irregularidad.