datasus-etl
Tutorial Para iniciantes

Do zero à primeira consulta.

Oito passos. Sem terminal. Sem SQL. Escrito para pesquisadores e clínicos que querem os dados sem o desvio pela engenharia de dados.

  1. 01

    Instalar o aplicativo

    Vá para a página de Download, escolha o instalador do seu sistema e execute. No Windows, clique em Avançar algumas vezes. No macOS (Apple Silicon), arraste o app para a pasta Aplicativos. No Linux, dê permissão de execução ao AppImage e abra. Você não precisa instalar Python nem banco de dados à parte.

  2. 02

    Abrir pelo atalho

    Depois de instalar, encontre o "DataSUS ETL" no Menu Iniciar (Windows), na pasta Aplicativos (macOS) ou no lançador de aplicativos (Linux). Clique. Uma janela abre no seu navegador padrão — esse é o aplicativo.

  3. 03

    Escolher onde os dados vão ficar

    A primeira tela pergunta onde guardar os arquivos baixados. Escolha uma pasta com bastante espaço livre (um subsistema completo pode ocupar 10–40 GB ao longo de vários anos). HD externo funciona. O app cria uma subpasta chamada datasus_db/ dentro da pasta escolhida.

  4. 04

    Escolher o subsistema

    O app cobre o SIHSUS (internações hospitalares) e o SIM (mortalidade). Escolha o que responde à sua pergunta. Para um primeiro teste rápido, o SIM de um único estado é o menor e mais rápido.

  5. 05

    Escolher datas e estados

    Selecione o intervalo de datas (início e fim) e uma ou mais UFs. O app mostra quantos arquivos vão ser baixados e o tamanho total antes de você confirmar.

  6. 06

    Acompanhar a execução

    Clique em Iniciar. Uma tela de progresso mostra cada etapa em tempo real: download dos arquivos brutos, conversão do formato DBC para um formato legível, carga no DuckDB, transformações e enriquecimento, e por fim a gravação dos Parquets. Você pode deixar em uma aba de segundo plano.

  7. 07

    Onde os arquivos ficam

    Ao terminar, os dados estão na pasta que você escolheu, dentro de datasus_db/<subsistema>/. Os arquivos são salvos no formato Parquet, organizados por UF, então você pode pegar só o recorte de que precisa.

  8. 08

    Explorar pelo app — ou por SQL

    A página de Consulta deixa você navegar pelas tabelas, filtrar por coluna e exportar para CSV ou Excel sem escrever SQL. Se você já domina SQL, abra o shell do DuckDB pela página de Status e faça suas próprias consultas diretamente nos Parquets.

Quebrou algo?

O aplicativo está em desenvolvimento ativo. Se uma tela não bater com este tutorial ou se uma mensagem de erro não fizer sentido, abra uma issue no GitHub — descreva o que você clicou e o texto exato do erro. Você terá resposta.

Aprofundando

Quando quiser automatizar — cron, processamento em lote, leitura direta dos Parquets em R ou Python — veja a documentação técnica (em inglês). O mesmo aplicativo expõe uma CLI completa.