Ciência de dados - plotando funções lineares


O conjunto de dados do relógio esportivo

Dê uma olhada no nosso conjunto de dados de saúde:

Duração Pulso_média Max_Pulse Caloria_Queima Horas_Trabalho Horas_Sono
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Plote os dados existentes em Python

Agora, podemos primeiro plotar os valores de Average_Pulse contra Calorie_Burnage usando a biblioteca matplotlib.

A plot()função é usada para fazer um gráfico binning hexagonal 2D dos pontos x,y:

Exemplo

import matplotlib.pyplot as plt

health_data.plot(x ='Average_Pulse', y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)

plt.show()

Exemplo explicado

  • Importe o módulo pyplot da biblioteca matplotlib
  • Plote os dados de Average_Pulse contra Calorie_Burnage
  • kind='line'nos diz que tipo de enredo queremos. Aqui, queremos ter uma linha reta
  • plt.ylim() e plt.xlim() nos dizem em qual valor queremos que o eixo comece. Aqui, queremos que o eixo comece do zero
  • plt.show() nos mostra a saída

O código acima produzirá o seguinte resultado:

Função linear

A saída do gráfico

Como podemos ver, existe uma relação entre Average_Pulse e Calorie_Burnage. Calorie_Burnage aumenta proporcionalmente com Average_Pulse. Isso significa que podemos usar Average_Pulse para prever Calorie_Burnage.



Por que a linha não é totalmente desenhada para o eixo y?

A razão é que não temos observações onde Average_Pulse ou Calorie_Burnage são iguais a zero. 80 é a primeira observação de Average_Pulse e 240 é a primeira observação de Calorie_Burnage.

Função linear

Olhe para a linha. O que acontece com a queima de calorias se o pulso médio aumentar de 80 para 90?

Função linear

Podemos usar a linha diagonal para encontrar a função matemática para prever a queima de calorias.

Como se vê:

  • Se o pulso médio é de 80, a queima de calorias é de 240
  • Se o pulso médio for de 90, a queima de calorias é de 260
  • Se o pulso médio for 100, a queima de calorias é 280

Existe um padrão. Se o pulso médio aumenta em 10, a queima de calorias aumenta em 20.