Introdução

Etapas de uma análise de dados

Na seção “Conceitos básicos”, abordamos alguns conceitos importantes para começar a programar em R.

Nesta seção, cada aula apresentará uma etapa comum quando realizamos uma análise de dados.

A figura abaixo ilustra algumas etapas comuns em uma análise de dados, conforme apresentado no livro “R para Ciência de Dados”:

Processo de ciência de dados, por Wickham, Çetinkaya-Rundel e Grolemund

O principal pacote que utilizaremos é o tidyverse. O tidyverse é uma coleção de pacotes em R desenvolvidos com o objetivo de facilitar etapas de análise de dados. Os pacotes do tidyverse compartilham uma filosofia comum e são projetados para funcionar bem juntos.

Pacotes principais (core packages) do tidyverse. Fonte: Site do tidyverse.

Pacotes principais (core packages) do tidyverse. Fonte: Site do tidyverse.

Portanto, é importante checar se o tidyverse está instalado e carregá-lo no início de cada aula:

library("tidyverse")
── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
✔ dplyr     1.1.4     ✔ readr     2.1.5
✔ forcats   1.0.0     ✔ stringr   1.5.1
✔ ggplot2   3.5.1     ✔ tibble    3.2.1
✔ lubridate 1.9.3     ✔ tidyr     1.3.1
✔ purrr     1.0.2     
── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag()    masks stats::lag()
ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors

O livro “R para Ciência de Dados” foi escrito por pessoas que trabalham (ou trabalharam) no desenvolvimento do tidyverse, e é uma excelente referência para estudar mais. Para cada aula, indicaremos seções do livro que podem ser úteis para aprofundar o conteúdo.