Ciência de dados - Tabela de banco de dados
Tabela de banco de dados
Uma tabela de banco de dados é uma tabela com dados estruturados.
A tabela a seguir mostra uma tabela de banco de dados com dados de saúde extraídos de um relógio esportivo:
Duração | Pulso_média | Max_Pulse | Caloria_Queima | Horas_Trabalho | Horas_Sono |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Este conjunto de dados contém informações de uma sessão de treinamento típica, como duração, pulso médio, queima de calorias, etc.
Estrutura da tabela de banco de dados
Uma tabela de banco de dados consiste em coluna(s) e linha(s):
Coluna 1 | Coluna 2 | Coluna 3 | Coluna 4 | Coluna 5 | Coluna 6 | |
Duração | Pulso_média | Max_Pulse | Caloria_Queima | Horas_Trabalho | Horas_Sono | |
---|---|---|---|---|---|---|
Linha 1 | 30 | 80 | 120 | 240 | 10 | 7 |
Linha 2 | 30 | 85 | 120 | 250 | 10 | 7 |
Linha 3 | 45 | 90 | 130 | 260 | 8 | 7 |
Linha 4 | 45 | 95 | 130 | 270 | 8 | 7 |
Linha 5 | 45 | 100 | 140 | 280 | 0 | 7 |
Linha 6 | 60 | 105 | 140 | 290 | 7 | 8 |
Linha 7 | 60 | 110 | 145 | 300 | 7 | 8 |
Linha 8 | 60 | 115 | 145 | 310 | 8 | 8 |
Linha 9 | 75 | 120 | 150 | 320 | 0 | 8 |
Linha 10 | 75 | 125 | 150 | 330 | 8 | 8 |
Uma linha é uma representação horizontal de dados.
Uma coluna é uma representação vertical de dados.
Variáveis
Uma variável é definida como algo que pode ser medido ou contado.
Exemplos podem ser caracteres, números ou tempo.
No exemplo abaixo, podemos observar que cada coluna representa uma variável.
Duração | Pulso_média | Max_Pulse | Caloria_Queima | Horas_Trabalho | Horas_Sono |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Existem 6 colunas, o que significa que existem 6 variáveis (Duration, Average_Pulse, Max_Pulse, Calorie_Burnage, Hours_Work, Hours_Sleep).
Existem 11 linhas, o que significa que cada variável tem 10 observações.
Mas se existem 11 linhas, como é que existem apenas 10 observações?
É porque a primeira linha é o rótulo, o que significa que é o nome da variável.