Ciência de dados - plotando funções lineares
O conjunto de dados do relógio esportivo
Dê uma olhada no nosso conjunto de dados de saúde:
Duração | Pulso_média | Max_Pulse | Caloria_Queima | Horas_Trabalho | Horas_Sono |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Plote os dados existentes em Python
Agora, podemos primeiro plotar os valores de Average_Pulse contra Calorie_Burnage usando a biblioteca matplotlib.
A plot()
função é usada para fazer um gráfico binning hexagonal 2D dos pontos x,y:
Exemplo
import matplotlib.pyplot as plt
health_data.plot(x ='Average_Pulse',
y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)
plt.show()
Exemplo explicado
- Importe o módulo pyplot da biblioteca matplotlib
- Plote os dados de Average_Pulse contra Calorie_Burnage
kind='line'
nos diz que tipo de enredo queremos. Aqui, queremos ter uma linha reta- plt.ylim() e plt.xlim() nos dizem em qual valor queremos que o eixo comece. Aqui, queremos que o eixo comece do zero
- plt.show() nos mostra a saída
O código acima produzirá o seguinte resultado:
A saída do gráfico
Como podemos ver, existe uma relação entre Average_Pulse e Calorie_Burnage. Calorie_Burnage aumenta proporcionalmente com Average_Pulse. Isso significa que podemos usar Average_Pulse para prever Calorie_Burnage.
Por que a linha não é totalmente desenhada para o eixo y?
A razão é que não temos observações onde Average_Pulse ou Calorie_Burnage são iguais a zero. 80 é a primeira observação de Average_Pulse e 240 é a primeira observação de Calorie_Burnage.
Olhe para a linha. O que acontece com a queima de calorias se o pulso médio aumentar de 80 para 90?
Podemos usar a linha diagonal para encontrar a função matemática para prever a queima de calorias.
Como se vê:
- Se o pulso médio é de 80, a queima de calorias é de 240
- Se o pulso médio for de 90, a queima de calorias é de 260
- Se o pulso médio for 100, a queima de calorias é 280
Existe um padrão. Se o pulso médio aumenta em 10, a queima de calorias aumenta em 20.