Aprendizado de máquina
Machine Learning está fazendo o computador aprender estudando dados e estatísticas.
Machine Learning é um passo na direção da inteligência artificial (IA).
Machine Learning é um programa que analisa dados e aprende a prever o resultado.
Onde começar?
Neste tutorial, voltaremos à matemática e estudaremos estatística e como calcular números importantes com base em conjuntos de dados.
Também aprenderemos a usar vários módulos Python para obter as respostas de que precisamos.
E aprenderemos a fazer funções capazes de prever o resultado com base no que aprendemos.
Conjunto de dados
Na mente de um computador, um conjunto de dados é qualquer coleção de dados. Pode ser qualquer coisa, desde um array até um banco de dados completo.
Exemplo de uma matriz:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
Exemplo de um banco de dados:
Carname | Cor | Era | Velocidade | AutoPass |
BMW | vermelho | 5 | 99 | S |
Volvo | Preto | 7 | 86 | S |
VW | cinzento | 8 | 87 | N |
VW | Branco | 7 | 88 | S |
Ford | Branco | 2 | 111 | S |
VW | Branco | 17 | 86 | S |
Tesla | vermelho | 2 | 103 | S |
BMW | Preto | 9 | 87 | S |
Volvo | cinzento | 4 | 94 | N |
Ford | Branco | 11 | 78 | N |
Toyota | cinzento | 12 | 77 | N |
VW | Branco | 9 | 85 | N |
Toyota | azul | 6 | 86 | S |
Ao olhar para a matriz, podemos adivinhar que o valor médio é provavelmente em torno de 80 ou 90, e também podemos determinar o valor mais alto e o valor mais baixo, mas o que mais podemos fazer?
E olhando para o banco de dados podemos ver que a cor mais popular é o branco, e o carro mais antigo tem 17 anos, mas e se pudéssemos prever se um carro tinha um AutoPass, apenas olhando os outros valores?
É para isso que serve o Machine Learning! Analisando dados e prevendo o resultado!
Em Machine Learning é comum trabalhar com conjuntos de dados muito grandes. Neste tutorial, tentaremos facilitar ao máximo o entendimento dos diferentes conceitos de aprendizado de máquina e trabalharemos com pequenos conjuntos de dados fáceis de entender.
Tipos de dados
Para analisar dados, é importante saber com que tipo de dados estamos lidando.
Podemos dividir os tipos de dados em três categorias principais:
- Numérico
- Categórico
- Ordinal
Os dados numéricos são números e podem ser divididos em duas categorias numéricas:
- Dados discretos
- números que são limitados a números inteiros. Exemplo: O número de carros que passam. - Dados contínuos
- números que são de valor infinito. Exemplo: o preço de um item ou o tamanho de um item
Dados categóricos são valores que não podem ser comparados entre si. Exemplo: um valor de cor ou quaisquer valores sim/não.
Dados ordinais são como dados categóricos, mas podem ser comparados uns com os outros. Exemplo: notas escolares onde A é melhor que B e assim por diante.
Conhecendo o tipo de dados de sua fonte de dados, você poderá saber qual técnica usar ao analisá-los.
Você aprenderá mais sobre estatísticas e análise de dados nos próximos capítulos.