Gráfico de dispersão R


Gráficos de dispersão

Você aprendeu no capítulo Plot que a plot()função é usada para plotar números uns contra os outros.

Um "gráfico de dispersão" é um tipo de gráfico usado para exibir a relação entre duas variáveis ​​numéricas e plota um ponto para cada observação.

Ele precisa de dois vetores de mesmo comprimento, um para o eixo x (horizontal) e outro para o eixo y (vertical):

Exemplo

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y)

Resultado:

A observação no exemplo acima deve mostrar o resultado de 12 carros passando.

Isso pode não estar claro para alguém que vê o gráfico pela primeira vez, então vamos adicionar um cabeçalho e rótulos diferentes para descrever melhor o gráfico de dispersão:

Exemplo

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y, main="Observation of Cars", xlab="Car age", ylab="Car speed")

Resultado:

Para recapitular, a observação no exemplo acima é o resultado de 12 carros passando.

O eixo x mostra a idade do carro.

O eixo y mostra a velocidade do carro quando ele passa.

Há alguma relação entre as observações?

Parece que quanto mais novo o carro, mais rápido ele anda, mas isso pode ser uma coincidência, afinal só registramos 12 carros.


Comparar parcelas

No exemplo acima, parece haver uma relação entre a velocidade do carro e a idade, mas e se plotarmos as observações de outro dia também? O gráfico de dispersão nos dirá mais alguma coisa?

Para comparar o gráfico com outro gráfico, use a points()função:

Exemplo

Desenhe dois gráficos na mesma figura:

# day one, the age and speed of 12 cars:
x1 <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y1 <- c(99,86,87,88,111,103,87,94,78,77,85,86)

# day two, the age and speed of 15 cars:
x2 <- c(2,2,8,1,15,8,12,9,7,3,11,4,7,14,12)
y2 <- c(100,105,84,105,90,99,90,95,94,100,79,112,91,80,85)

plot(x1, y1, main="Observation of Cars", xlab="Car age", ylab="Car speed", col="red", cex=2)
points(x2, y2, col="blue", cex=2)

Resultado:

Nota: Para poder ver a diferença da comparação, você deve atribuir cores diferentes aos gráficos (usando o colparâmetro). O vermelho representa os valores do dia 1, enquanto o azul representa o dia 2. Observe que também adicionamos o cexparâmetro para aumentar o tamanho dos pontos.

Conclusão da observação: Ao comparar os dois gráficos, acho seguro dizer que ambos nos dão a mesma conclusão: quanto mais novo o carro, mais rápido ele dirige.