Funções de ciência de dados


Este capítulo mostra três funções comumente usadas ao trabalhar com Data Science: max(), min() e mean().


O conjunto de dados do relógio esportivo

Duração Pulso_média Max_Pulse Caloria_Queima Horas_Trabalho Horas_Sono
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

O conjunto de dados acima consiste em 6 variáveis, cada uma com 10 observações:

  • Duração - Quanto tempo durou a sessão de treinamento em minutos?
  • Average_Pulse - Qual foi o pulso médio da sessão de treinamento? Isso é medido por batimentos por minuto
  • Max_Pulse - Qual foi o pulso máximo da sessão de treino?
  • Calorie_Burnage - Quantas calorias foram queimadas na sessão de treino?
  • Hours_Work - Quantas horas trabalhamos em nosso trabalho antes da sessão de treinamento?
  • Hours_Sleep - Quanto dormimos na noite anterior ao treino?

Usamos sublinhado (_) para separar strings porque o Python não pode ler o espaço como separador.



A função max()

A função Python max()é usada para encontrar o valor mais alto em uma matriz.

Exemplo

Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_max)

A função min()

A função Python min()é usada para encontrar o valor mais baixo em uma matriz.

Exemplo

Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_min)

A função média()

A função NumPy mean()é usada para encontrar o valor médio de uma matriz.

Exemplo

import numpy as np

Calorie_burnage = [240, 250, 260, 270, 280, 290, 300, 310, 320, 330]

Average_calorie_burnage = np.mean(Calorie_burnage)

print(Average_calorie_burnage)

Escrevemos np. na frente de mean para informar ao Python que queremos ativar a função mean da biblioteca Numpy .