Explorando o Censo Demográfico

O Censo Demográfico é uma das mais importantes fontes de dados sobre as características e condições de vida da população brasileira. Nesta aula, você vai aprender como baixar e manipular os dados das diversas edições do censo demográfico do Brasil de 1960 a 2022 usando o pacote {censobr} na linguagem de programação R.

A oficina também vai demonstrar como o {censobr} permite trabalhar com grandes bases de dados (larger-than-memory data) e ser integrado com o pacote {geobr} para visualização espacial de dados em diferentes escalas geográficas.

{censobr} e {geobr}

O {censobr} é um pacote de R para acessar os dados e documentação dos censos demográficos do Brasil (Pereira e Barbosa 2023). O pacote disponibiliza microdados da amostra de todas as edições do censo demográfico desde 1960 (mais informações no site do pacote).

Por sua vez, o {geobr} é um pacote para baixar dados espaciais oficiais do Brasil (Pereira e Gonçalves 2019). Ele inclui uma ampla variedade de dados geoespaciais disponíveis em várias escalas geográficas e para diversos anos, como municípios, regiões metropolitanas, biomas, estabelecimentos de saúde, etc (veja a lista completa no site do pacote).

Instalando pacotes de R para essa aula

Para esta aula, você vai precisar dos pacotes abaixo instalados na máquina. A maneira mais simples de fazer isso é executando o código abaixo. Isso pode levar alguns minutos, caso seja a primeira vez que você instala esses pacotes.

pkgs <- c(
  'censobr',
  'geobr',
  'arrow',
  'dplyr',
  'ggplot2',
  'quantreg',
  'sf'
  )

install.packages(pkgs)

Referências

Pereira, Rafael H. M., e Rogério J. Barbosa. 2023. censobr: Download Data from Brazil’s Population Census. CRAN. https://doi.org/10.32614/CRAN.package.censobr.
Pereira, Rafael H. M., e Caio N. Gonçalves. 2019. geobr: Download Official Spatial Data Sets of Brazil. CRAN. https://doi.org/10.32614/CRAN.package.geobr.