Tutorial Python

Python HOME Introdução ao Python Introdução ao Python Sintaxe do Python Comentários do Python Variáveis ​​Python Tipos de dados Python Números Python Conversão de Python Strings Python Booleanos Python Operadores Python Listas Python Tuplas Python Conjuntos Python Dicionários Python Python Se... Senão Python While Loops Python para loops Funções do Python Python Lambda Matrizes Python Classes/objetos Python Herança Python Iteradores Python Escopo do Python Módulos Python Datas em Python Matemática Python Python JSON Python RegEx Python PIP Python Tente...Exceto Entrada do usuário Python Formatação de String Python

Manipulação de arquivos

Manipulação de arquivos Python Arquivos de leitura do Python Python Gravar/Criar Arquivos Arquivos de exclusão do Python

Módulos Python

Tutorial NumPy Passo a passo do Panda Tutorial Scipy

Python Matplotlib

Introdução ao Matplotlib Introdução ao Matplotlib Matplotlib Pyplot Plotagem Matplotlib Marcadores Matplotlib Linha Matplotlib Etiquetas Matplotlib Grade Matplotlib Subtramas do Matplotlib Dispersão Matplotlib Barras Matplotlib Histogramas Matplotlib Gráficos de pizza Matplotlib

Aprendizado de máquina

Começando Modo Mediano Médio Desvio padrão Percentil Distribuição de dados Distribuição normal de dados Gráfico de dispersão Regressão linear Regressão Polinomial Regressão múltipla Régua Treinar/Teste Árvore de decisão

Python MySQL

Introdução ao MySQL MySQL Criar banco de dados MySQL Criar Tabela Inserir MySQL Seleção do MySQL MySQL Onde MySQL Ordenar por Excluir MySQL Tabela de descarte do MySQL Atualização do MySQL Limite do MySQL Associação do MySQL

Python MongoDB

Introdução ao MongoDB Banco de dados de criação do MongoDB Criar coleção do MongoDB Inserir MongoDB MongoDB Find Consulta do MongoDB Classificação do MongoDB Excluir MongoDB Coleção de Drops do MongoDB Atualização do MongoDB Limite do MongoDB

Referência Python

Visão geral do Python Funções incorporadas do Python Métodos de string do Python Métodos de lista do Python Métodos de dicionário Python Métodos de Tupla Python Métodos de conjunto do Python Métodos de arquivo Python Palavras-chave Python Exceções do Python Glossário Python

Referência do Módulo

Módulo Aleatório Módulo de solicitações Módulo de Estatísticas Módulo de matemática cMódulo de matemática

Python Como fazer

Remover duplicatas de lista Inverter uma string Adicionar dois números

Exemplos de Python

Exemplos de Python Compilador Python Exercícios de Python Teste do Python Certificado Python

Aprendizado de máquina - gráfico de dispersão


Gráfico de dispersão

Um gráfico de dispersão é um diagrama onde cada valor no conjunto de dados é representado por um ponto.

O módulo Matplotlib possui um método para desenhar gráficos de dispersão, ele precisa de dois arrays de mesmo comprimento, um para os valores do eixo x e outro para os valores do eixo y:

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]

y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

A xmatriz representa a idade de cada carro.

A ymatriz representa a velocidade de cada carro.

Exemplo

Use o scatter()método para desenhar um diagrama de dispersão:

import matplotlib.pyplot as plt

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

plt.scatter(x, y)
plt.show()

Resultado:

Gráfico de dispersão explicado

O eixo x representa idades e o eixo y representa velocidades.

O que podemos ler no diagrama é que os dois carros mais rápidos tinham 2 anos e o carro mais lento tinha 12 anos.

Nota: Parece que quanto mais novo o carro, mais rápido ele anda, mas isso pode ser uma coincidência, afinal só registramos 13 carros.



Distribuições de dados aleatórios

No Machine Learning, os conjuntos de dados podem conter milhares ou até milhões de valores.

Você pode não ter dados do mundo real quando estiver testando um algoritmo, talvez seja necessário usar valores gerados aleatoriamente.

Como aprendemos no capítulo anterior, o módulo NumPy pode nos ajudar com isso!

Vamos criar dois arrays preenchidos com 1000 números aleatórios de uma distribuição normal de dados.

A primeira matriz terá a média definida como 5,0 com um desvio padrão de 1,0.

A segunda matriz terá a média definida como 10,0 com um desvio padrão de 2,0:

Exemplo

Um gráfico de dispersão com 1000 pontos:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)

plt.scatter(x, y)
plt.show()

Resultado:

Gráfico de dispersão explicado

Podemos ver que os pontos estão concentrados em torno do valor 5 no eixo x e 10 no eixo y.

Também podemos ver que o spread é maior no eixo y do que no eixo x.