Ciência de Dados - O que são dados?
O que é Dados?
Os dados são uma coleção de informações.
Um dos propósitos da Data Science é estruturar os dados, tornando-os interpretáveis e fáceis de trabalhar.
Os dados podem ser classificados em dois grupos:
- Dados estruturados
- Dados não estruturados
Dados não estruturados
Dados não estruturados não são organizados. Devemos organizar os dados para fins de análise.
Dados estruturados
Os dados estruturados são organizados e mais fáceis de trabalhar.
Como estruturar dados?
Podemos usar um array ou uma tabela de banco de dados para estruturar ou apresentar dados.
Exemplo de uma matriz:
[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
O exemplo a seguir mostra como criar um array em Python:
Exemplo
Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)
É comum trabalhar com conjuntos de dados muito grandes em Data Science.
Neste tutorial, tentaremos facilitar ao máximo o entendimento dos conceitos de Data Science. Portanto, trabalharemos com um pequeno conjunto de dados de fácil interpretação.