Pandas - Plotagem



Plotagem

Pandas usa o plot()método para criar diagramas.

Podemos usar o Pyplot, um submódulo da biblioteca Matplotlib para visualizar o diagrama na tela.

Leia mais sobre Matplotlib em nosso Tutorial Matplotlib .

Exemplo

Importe pyplot do Matplotlib e visualize nosso DataFrame:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot()

plt.show()

Os exemplos nesta página usam um arquivo CSV chamado: 'data.csv'.

Baixar data.csv ou abrir data.csv


Gráfico de dispersão

Especifique que você deseja um gráfico de dispersão com o kindargumento:

kind = 'scatter'

Um gráfico de dispersão precisa de um eixo x e um eixo y.

No exemplo abaixo, usaremos "Duração" para o eixo x e "Calorias" para o eixo y.

Inclua os argumentos x e y assim:

x = 'Duration', y = 'Calories'

Exemplo

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')

plt.show()

Resultado

Lembre-se: no exemplo anterior, aprendemos que a correlação entre "Duração" e "Calorias" era 0.922721, e concluímos com o fato de que maior duração significa mais calorias queimadas.

Ao olhar para o gráfico de dispersão, eu vou concordar.

Vamos criar outro gráfico de dispersão, onde há um relacionamento ruim entre as colunas, como "Duration" e "Maxpulse", com a correlação 0.009403:

Exemplo

Um gráfico de dispersão onde não há relacionamento entre as colunas:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')

plt.show()

Resultado


w3schools CERTIFIED . 2021

Obter certificação!

Complete os módulos do Pandas, faça os exercícios, faça o exame e você se tornará certificado pela w3schools!

$ 10 INSCRIÇÃO

Histograma

Use o kindargumento para especificar que você deseja um histograma:

kind = 'hist'

Um histograma precisa de apenas uma coluna.

Um histograma nos mostra a frequência de cada intervalo, por exemplo, quantos treinos duraram entre 50 e 60 minutos?

No exemplo abaixo usaremos a coluna "Duração" para criar o histograma:

Exemplo

df["Duration"].plot(kind = 'hist')

Resultado

Nota: O histograma nos diz que houve mais de 100 treinos que duraram entre 50 e 60 minutos.


Teste-se com exercícios

Exercício:

Insira uma sintaxe correta para visualizar os dados no DataFrame como um diagrama (plotagem).

df.()