Ciência de Dados - Introdução à Estatística
Introdução à Estatística
Estatística é a ciência de analisar dados.
Quando criamos um modelo de previsão, devemos avaliar a confiabilidade da previsão.
Afinal, de que vale uma previsão, se não podemos confiar nela?
Estatísticas descritivas
Vamos primeiro cobrir algumas estatísticas descritivas básicas.
A estatística descritiva resume características importantes de um conjunto de dados, como:
- Contar
- Soma
- Desvio padrão
- Percentil
- Média
- etc.
É um bom ponto de partida para se familiarizar com os dados.
Podemos usar a describe()
função em Python para resumir os dados:
Exemplo
print (full_health_data.describe())
Saída:
Você vê algo interessante aqui?