Metodología
Cómo extraemos, procesamos y publicamos los datos.
Principios
- Nunca publicamos datos personales identificables.
- Toda visualización cita su fuente y fecha de extracción.
- Las estimaciones se marcan explícitamente como tales.
- El código del pipeline es público y auditable.
Flujo
- Extracción: pipelines Python descargan CSV/XLSX o consumen APIs oficiales (INE, Servicio Nacional de Migraciones, Superintendencia de Pensiones, SII, etc.).
- Transformación: limpieza, normalización de códigos territoriales (DPA chileno), reconciliación temporal con Polars y DuckDB.
- Almacenamiento: hechos en Parquet (object storage S3-compatible). Metadata y dimensiones en Postgres.
- Publicación: API agrega y sirve, frontend renderiza con cita y descarga directa.
Fuentes prioritarias
INE (Censo, ENE, EOD), Servicio Nacional de Migraciones, Superintendencia de Pensiones, SII, MINSAL/Fonasa, MINEDUC, Carabineros (con contexto), SJM y reportes ONU/OIM para estimaciones de irregularidad.