Ciência de Dados - O que são dados?


O que é Dados?

Os dados são uma coleção de informações.

Um dos propósitos da Data Science é estruturar os dados, tornando-os interpretáveis ​​e fáceis de trabalhar.

Os dados podem ser classificados em dois grupos:

  • Dados estruturados
  • Dados não estruturados

Dados não estruturados

Dados não estruturados não são organizados. Devemos organizar os dados para fins de análise.

Dados não estruturados

Dados não estruturados


Dados estruturados

Os dados estruturados são organizados e mais fáceis de trabalhar.

Dados estruturados


Como estruturar dados?

Podemos usar um array ou uma tabela de banco de dados para estruturar ou apresentar dados.

Exemplo de uma matriz:

[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]

O exemplo a seguir mostra como criar um array em Python:

Exemplo

Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)

É comum trabalhar com conjuntos de dados muito grandes em Data Science.

Neste tutorial, tentaremos facilitar ao máximo o entendimento dos conceitos de Data Science. Portanto, trabalharemos com um pequeno conjunto de dados de fácil interpretação.