Ciência de Dados - Introdução à Estatística


Introdução à Estatística

Estatística é a ciência de analisar dados.

Quando criamos um modelo de previsão, devemos avaliar a confiabilidade da previsão.

Afinal, de que vale uma previsão, se não podemos confiar nela?


Estatísticas descritivas

Vamos primeiro cobrir algumas estatísticas descritivas básicas.

A estatística descritiva resume características importantes de um conjunto de dados, como:

  • Contar
  • Soma
  • Desvio padrão
  • Percentil
  • Média
  • etc.

É um bom ponto de partida para se familiarizar com os dados.

Podemos usar a describe()função em Python para resumir os dados:

Exemplo

print (full_health_data.describe())

Saída:

Descrição do estado

Você vê algo interessante aqui?