Gráfico de dispersão R
Gráficos de dispersão
Você aprendeu no capítulo Plot que a plot()
função é usada para plotar números uns contra os outros.
Um "gráfico de dispersão" é um tipo de gráfico usado para exibir a relação entre duas variáveis numéricas e plota um ponto para cada observação.
Ele precisa de dois vetores de mesmo comprimento, um para o eixo x (horizontal) e outro para o eixo y (vertical):
Exemplo
x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <-
c(99,86,87,88,111,103,87,94,78,77,85,86)
plot(x, y)
Resultado:
A observação no exemplo acima deve mostrar o resultado de 12 carros passando.
Isso pode não estar claro para alguém que vê o gráfico pela primeira vez, então vamos adicionar um cabeçalho e rótulos diferentes para descrever melhor o gráfico de dispersão:
Exemplo
x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <-
c(99,86,87,88,111,103,87,94,78,77,85,86)
plot(x, y, main="Observation
of Cars", xlab="Car age", ylab="Car speed")
Resultado:
Para recapitular, a observação no exemplo acima é o resultado de 12 carros passando.
O eixo x mostra a idade do carro.
O eixo y mostra a velocidade do carro quando ele passa.
Há alguma relação entre as observações?
Parece que quanto mais novo o carro, mais rápido ele anda, mas isso pode ser uma coincidência, afinal só registramos 12 carros.
Comparar parcelas
No exemplo acima, parece haver uma relação entre a velocidade do carro e a idade, mas e se plotarmos as observações de outro dia também? O gráfico de dispersão nos dirá mais alguma coisa?
Para comparar o gráfico com outro gráfico, use a points()
função:
Exemplo
Desenhe dois gráficos na mesma figura:
# day one, the age and speed of 12 cars:
x1 <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y1 <- c(99,86,87,88,111,103,87,94,78,77,85,86)
# day two, the age and speed of 15 cars:
x2 <-
c(2,2,8,1,15,8,12,9,7,3,11,4,7,14,12)
y2 <-
c(100,105,84,105,90,99,90,95,94,100,79,112,91,80,85)
plot(x1, y1,
main="Observation of Cars", xlab="Car age", ylab="Car speed", col="red",
cex=2)
points(x2, y2, col="blue", cex=2)
Resultado:
Nota: Para poder ver a diferença da comparação, você deve atribuir cores diferentes aos gráficos (usando o col
parâmetro). O vermelho representa os valores do dia 1, enquanto o azul representa o dia 2. Observe que também adicionamos o cex
parâmetro para aumentar o tamanho dos pontos.
Conclusão da observação: Ao comparar os dois gráficos, acho seguro dizer que ambos nos dão a mesma conclusão: quanto mais novo o carro, mais rápido ele dirige.