Funções de ciência de dados
Este capítulo mostra três funções comumente usadas ao trabalhar com Data Science: max(), min() e mean().
O conjunto de dados do relógio esportivo
Duração | Pulso_média | Max_Pulse | Caloria_Queima | Horas_Trabalho | Horas_Sono |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
O conjunto de dados acima consiste em 6 variáveis, cada uma com 10 observações:
- Duração - Quanto tempo durou a sessão de treinamento em minutos?
- Average_Pulse - Qual foi o pulso médio da sessão de treinamento? Isso é medido por batimentos por minuto
- Max_Pulse - Qual foi o pulso máximo da sessão de treino?
- Calorie_Burnage - Quantas calorias foram queimadas na sessão de treino?
- Hours_Work - Quantas horas trabalhamos em nosso trabalho antes da sessão de treinamento?
- Hours_Sleep - Quanto dormimos na noite anterior ao treino?
Usamos sublinhado (_) para separar strings porque o Python não pode ler o espaço como separador.
A função max()
A função Python max()
é usada para encontrar o valor mais alto em uma matriz.
Exemplo
Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)
print
(Average_pulse_max)
A função min()
A função Python min()
é usada para encontrar o valor mais baixo em uma matriz.
Exemplo
Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)
print
(Average_pulse_min)
A função média()
A função NumPy mean()
é usada para encontrar o valor médio de uma matriz.
Exemplo
import numpy as np
Calorie_burnage =
[240, 250, 260, 270, 280, 290, 300, 310, 320, 330]
Average_calorie_burnage =
np.mean(Calorie_burnage)
print(Average_calorie_burnage)
Escrevemos np. na frente de mean para informar ao Python que queremos ativar a função mean da biblioteca Numpy .