Ciência de dados - Tabela de banco de dados


Tabela de banco de dados

Uma tabela de banco de dados é uma tabela com dados estruturados.

A tabela a seguir mostra uma tabela de banco de dados com dados de saúde extraídos de um relógio esportivo:

Duração Pulso_média Max_Pulse Caloria_Queima Horas_Trabalho Horas_Sono
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Este conjunto de dados contém informações de uma sessão de treinamento típica, como duração, pulso médio, queima de calorias, etc.


Estrutura da tabela de banco de dados

Uma tabela de banco de dados consiste em coluna(s) e linha(s):

Coluna 1 Coluna 2 Coluna 3 Coluna 4 Coluna 5 Coluna 6
Duração Pulso_média Max_Pulse Caloria_Queima Horas_Trabalho Horas_Sono
Linha 1 30 80 120 240 10 7
Linha 2 30 85 120 250 10 7
Linha 3 45 90 130 260 8 7
Linha 4 45 95 130 270 8 7
Linha 5 45 100 140 280 0 7
Linha 6 60 105 140 290 7 8
Linha 7 60 110 145 300 7 8
Linha 8 60 115 145 310 8 8
Linha 9 75 120 150 320 0 8
Linha 10 75 125 150 330 8 8

Uma linha é uma representação horizontal de dados.

Uma coluna é uma representação vertical de dados.


Variáveis

Uma variável é definida como algo que pode ser medido ou contado.

Exemplos podem ser caracteres, números ou tempo.

No exemplo abaixo, podemos observar que cada coluna representa uma variável.

Duração Pulso_média Max_Pulse Caloria_Queima Horas_Trabalho Horas_Sono
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Existem 6 colunas, o que significa que existem 6 variáveis ​​(Duration, Average_Pulse, Max_Pulse, Calorie_Burnage, Hours_Work, Hours_Sleep).

Existem 11 linhas, o que significa que cada variável tem 10 observações.

Mas se existem 11 linhas, como é que existem apenas 10 observações?

É porque a primeira linha é o rótulo, o que significa que é o nome da variável.