Tutorial Python

Python HOME Introdução ao Python Introdução ao Python Sintaxe do Python Comentários do Python Variáveis ​​Python Tipos de dados Python Números Python Conversão de Python Strings Python Booleanos Python Operadores Python Listas Python Tuplas Python Conjuntos Python Dicionários Python Python Se... Senão Python While Loops Python para loops Funções do Python Python Lambda Matrizes Python Classes/objetos Python Herança Python Iteradores Python Escopo do Python Módulos Python Datas em Python Matemática Python Python JSON Python RegEx Python PIP Python Tente...Exceto Entrada do usuário Python Formatação de String Python

Manipulação de arquivos

Manipulação de arquivos Python Arquivos de leitura do Python Python Gravar/Criar Arquivos Arquivos de exclusão do Python

Módulos Python

Tutorial NumPy Passo a passo do Panda Tutorial Scipy

Python Matplotlib

Introdução ao Matplotlib Introdução ao Matplotlib Matplotlib Pyplot Plotagem Matplotlib Marcadores Matplotlib Linha Matplotlib Etiquetas Matplotlib Grade Matplotlib Subtramas do Matplotlib Dispersão Matplotlib Barras Matplotlib Histogramas Matplotlib Gráficos de pizza Matplotlib

Aprendizado de máquina

Começando Modo Mediano Médio Desvio padrão Percentil Distribuição de dados Distribuição normal de dados Gráfico de dispersão Regressão linear Regressão Polinomial Regressão múltipla Régua Treinar/Teste Árvore de decisão

Python MySQL

Introdução ao MySQL MySQL Criar banco de dados MySQL Criar Tabela Inserir MySQL Seleção do MySQL MySQL Onde MySQL Ordenar por Excluir MySQL Tabela de descarte do MySQL Atualização do MySQL Limite do MySQL Associação do MySQL

Python MongoDB

Introdução ao MongoDB Banco de dados de criação do MongoDB Criar coleção do MongoDB Inserir MongoDB MongoDB Find Consulta do MongoDB Classificação do MongoDB Excluir MongoDB Coleção de Drops do MongoDB Atualização do MongoDB Limite do MongoDB

Referência Python

Visão geral do Python Funções incorporadas do Python Métodos de string do Python Métodos de lista do Python Métodos de dicionário Python Métodos de Tupla Python Métodos de conjunto do Python Métodos de arquivo Python Palavras-chave Python Exceções do Python Glossário Python

Referência do Módulo

Módulo Aleatório Módulo de solicitações Módulo de Estatísticas Módulo de matemática cMódulo de matemática

Python Como fazer

Remover duplicatas de lista Inverter uma string Adicionar dois números

Exemplos de Python

Exemplos de Python Compilador Python Exercícios de Python Teste do Python Certificado Python

Aprendizado de Máquina - Desvio Padrão


O que é desvio padrão?

O desvio padrão é um número que descreve a dispersão dos valores.

Um desvio padrão baixo significa que a maioria dos números está próxima do valor médio.

Um desvio padrão alto significa que os valores estão espalhados por uma faixa mais ampla.

Exemplo: Desta vez registramos a velocidade de 7 carros:

speed = [86,87,88,86,87,85,86]

O desvio padrão é:

0.9

Significando que a maioria dos valores está dentro do intervalo de 0,9 do valor médio, que é 86,4.

Vamos fazer o mesmo com uma seleção de números com um intervalo mais amplo:

speed = [32,111,138,28,59,77,97]

O desvio padrão é:

37.85

Significando que a maioria dos valores está dentro da faixa de 37,85 do valor médio, que é 77,4.

Como você pode ver, um desvio padrão mais alto indica que os valores estão espalhados por uma faixa mais ampla.

O módulo NumPy possui um método para calcular o desvio padrão:

Exemplo

Use o método NumPy std()para encontrar o desvio padrão:

import numpy

speed = [86,87,88,86,87,85,86]

x = numpy.std(speed)

print(x)

Exemplo

import numpy

speed = [32,111,138,28,59,77,97]

x = numpy.std(speed)

print(x)


Variação

A variação é outro número que indica a dispersão dos valores.

Na verdade, se você tirar a raiz quadrada da variância, você obtém o desvio padrão!

Ou vice-versa, se você multiplicar o desvio padrão por ele mesmo, obtém a variância!

Para calcular a variação, você deve fazer o seguinte:

1. Encontre a média:

(32+111+138+28+59+77+97) / 7 = 77.4

2. Para cada valor: encontre a diferença da média:

 32 - 77.4 = -45.4
111 - 77.4 =  33.6
138 - 77.4 =  60.6
 28 - 77.4 = -49.4
 59 - 77.4 = -18.4
 77 - 77.4 = - 0.4
 97 - 77.4 =  19.6

3. Para cada diferença: encontre o valor quadrado:

(-45.4)2 = 2061.16
 (33.6)2 = 1128.96
 (60.6)2 = 3672.36
(-49.4)2 = 2440.36
(-18.4)2 =  338.56
(- 0.4)2 =    0.16
 (19.6)2 =  384.16

4. A variância é o número médio dessas diferenças quadradas:

(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2

Felizmente, o NumPy tem um método para calcular a variância:

Exemplo

Use o método NumPy var()para encontrar a variação:

import numpy

speed = [32,111,138,28,59,77,97]

x = numpy.var(speed)

print(x)

Desvio padrão

Como aprendemos, a fórmula para encontrar o desvio padrão é a raiz quadrada da variância:

1432.25 = 37.85

Ou, como no exemplo anterior, use o NumPy para calcular o desvio padrão:

Exemplo

Use o método NumPy std()para encontrar o desvio padrão:

import numpy

speed = [32,111,138,28,59,77,97]

x = numpy.std(speed)

print(x)

Símbolos

O Desvio Padrão é frequentemente representado pelo símbolo Sigma: σ

A variação é frequentemente representada pelo símbolo Sigma Square: σ 2


Resumo do capítulo

O Desvio Padrão e a Variação são termos frequentemente usados ​​em Machine Learning, por isso é importante entender como obtê-los e o conceito por trás deles.