Uma Função, Uma Visualização: ggpairs

Créditos da Imagem: Canva

A função ggpairs do pacote GGally permite construir uma matriz de gráficos com um determinado conjunto de dados. Sua análise exploratória ficará muito mais rica com esse tipo de visualização.

Assista neste link como funciona a função. O código está disponível logo abaixo.

##%######################################################%##
#                                                          #
####            UMA FUNCAO, UMA VISUALIZACAO            ####
#                                                          #
##%######################################################%##

# CARREGANDO OS PACOTES
library(titanic)
library(GGally)

# LENDO E FILTRANDO OS DADOS
data("titanic_train")
dados <- titanic_train[,-c(1,4,9,11)]
str(dados)

# CONVERTENDO VARIAVEIS
dados$Survived <- as.factor(dados$Survived)
dados$Pclass <- as.factor(dados$Pclass)
dados$Sex <- as.factor(dados$Sex)
dados$Embarked <- as.factor(dados$Embarked)

# CORRIGINDO O ESPACO EM BRANCO DA VARIAVEL EMBARKED
levels(dados$Embarked) <- c(NA, "C", "Q", "S")

# PEGANDO OS DADOS COMPLETOS
dados <- dados[complete.cases(dados),]

# FUNCAO GGPAIRS

# ARGUMENTOS UPPER OU LOWER
# continuous: e.g. “points” (lower default), “smooth”, 
# “smooth_loess”, “density”, “cor” (upper default), or “blank”

# combo: e.g. “box”, “box_no_facet” (upper default), 
# “dot”, “dot_no_facet”, “facethist”, “facetdensity”, 
# “denstrip”, or “blank”

# discrete: e.g. “ratio”, “facetbar”, or “blank”

# ARGUMENTO DIAG

# continuous: “densityDiag”, “barDiag”, “blankDiag”
# discrete: “barDiag”, “blankDiag”

g <- ggpairs(
  data = dados,
  # columns = 1:ncol(dados),
  mapping = aes(colour = Survived),
  title = "Avaliação das Variáveis Par a Par",
  upper = list(
    continuous = wrap("cor", size = 3),
    combo = "box_no_facet",
    discrete = "count",
    na = "na"
  ),
  lower = list(
    continuous = "smooth",
    combo = "facethist",
    discrete = "facetbar",
    na = "na"
  ),
  diag = list(
    continuous = "densityDiag",
    discrete = "barDiag",
    na = "naDiag"
  )
)
g

# MUDANDO AS CORES

for(i in 1:g$nrow) {
  for(j in 1:g$ncol){
    g[i,j] <- g[i,j] + 
      scale_fill_manual(values=c("#00AFBB", "#FC4E07")) +
      scale_color_manual(values=c("#00AFBB", "#FC4E07"))  
  }
}
g

Veja o resultado final:

png

Letícia Raposo
Letícia Raposo
Professora Adjunta

Biomédica e matemática de formação, atualmente é professora de Estatística da UNIRIO. Ama programar nas horas vagas acompanhada de um bom café. ☕

Relacionados