Uma Função, Uma Visualização: ggpairs
A função ggpairs
do pacote GGally
permite construir uma matriz de gráficos com um determinado conjunto de dados. Sua análise exploratória ficará muito mais rica com esse tipo de visualização.
Assista neste link como funciona a função. O código está disponível logo abaixo.
##%######################################################%##
# #
#### UMA FUNCAO, UMA VISUALIZACAO ####
# #
##%######################################################%##
# CARREGANDO OS PACOTES
library(titanic)
library(GGally)
# LENDO E FILTRANDO OS DADOS
data("titanic_train")
dados <- titanic_train[,-c(1,4,9,11)]
str(dados)
# CONVERTENDO VARIAVEIS
dados$Survived <- as.factor(dados$Survived)
dados$Pclass <- as.factor(dados$Pclass)
dados$Sex <- as.factor(dados$Sex)
dados$Embarked <- as.factor(dados$Embarked)
# CORRIGINDO O ESPACO EM BRANCO DA VARIAVEL EMBARKED
levels(dados$Embarked) <- c(NA, "C", "Q", "S")
# PEGANDO OS DADOS COMPLETOS
dados <- dados[complete.cases(dados),]
# FUNCAO GGPAIRS
# ARGUMENTOS UPPER OU LOWER
# continuous: e.g. “points” (lower default), “smooth”,
# “smooth_loess”, “density”, “cor” (upper default), or “blank”
# combo: e.g. “box”, “box_no_facet” (upper default),
# “dot”, “dot_no_facet”, “facethist”, “facetdensity”,
# “denstrip”, or “blank”
# discrete: e.g. “ratio”, “facetbar”, or “blank”
# ARGUMENTO DIAG
# continuous: “densityDiag”, “barDiag”, “blankDiag”
# discrete: “barDiag”, “blankDiag”
g <- ggpairs(
data = dados,
# columns = 1:ncol(dados),
mapping = aes(colour = Survived),
title = "Avaliação das Variáveis Par a Par",
upper = list(
continuous = wrap("cor", size = 3),
combo = "box_no_facet",
discrete = "count",
na = "na"
),
lower = list(
continuous = "smooth",
combo = "facethist",
discrete = "facetbar",
na = "na"
),
diag = list(
continuous = "densityDiag",
discrete = "barDiag",
na = "naDiag"
)
)
g
# MUDANDO AS CORES
for(i in 1:g$nrow) {
for(j in 1:g$ncol){
g[i,j] <- g[i,j] +
scale_fill_manual(values=c("#00AFBB", "#FC4E07")) +
scale_color_manual(values=c("#00AFBB", "#FC4E07"))
}
}
g
Veja o resultado final: