Baixa
Puxa os DBCs direto do FTP do DATASUS. Seleção por subsistema, intervalo de datas e UF — nada mais, nada menos.
Um ETL de código aberto para o DATASUS. Baixa do FTP, converte DBC → DBF → DuckDB, enriquece com IBGE e CID-10, e escreve parquet particionado — tudo em um comando. Feito para pesquisadores que precisam dos dados com facilidade e precisão.
pip install datasus-etl Puxa os DBCs direto do FTP do DATASUS. Seleção por subsistema, intervalo de datas e UF — nada mais, nada menos.
DBC → DBF → DuckDB → Parquet, tudo em um processo, sem CSV intermediário. Inserts em streaming mantêm o uso de memória previsível em leituras de muitos GB.
Junta códigos IBGE de municípios (5.571 entradas), validação CID-10 e mapeamentos categóricos automaticamente. A saída já vem com schema limpo.
Navegue pela interface web local, consulte com DuckDB SQL, ou leia os parquets particionados de qualquer lugar — polars, pandas, R, Arrow.
Instale o app, clique no atalho, escolha uma pasta. Selecione subsistema e intervalo de datas. O aplicativo baixa e processa tudo localmente. Consulta via interface web com dropdowns e filtros — sem precisar de SQL.
Veja o tutorial →
O mesmo instalador expõe o comando datasus
completo. Pipelines automatizados, API Python e DuckDB como
superfície de consulta. A saída é parquet particionado
(Hive) — plugável no seu stack existente.
Desenvolvido por Nycholas Maia em colaboração técnica com Paulo Alves Maia (FUNDACENTRO) dentro do grupo de pesquisa do CNPq "Mudanças Climáticas e Segurança e Saúde no Trabalho".
Grupo de pesquisa no CNPq ↗
O botão detecta o seu SO. A tabela completa de plataformas,
checksums e notas de instalação está na página de download.
Cada release é cortada a partir do arquivo
VERSION
do repositório — o mesmo número aparece no rodapé do app e em
datasus version.