Dados do Exemplo 2
O Exemplo 2 usa o mesmo código-fonte do Exemplo 1.
Mas, como outro conjunto de dados é usado, o código deve coletar outros dados.
Coleção de dados
Os dados usados no Exemplo 2 são uma lista de objetos da casa:
{
"Avg. Area Income": 79545.45857,
"Avg. Area House Age": 5.682861322,
"Avg. AreaNumberofRooms": 7.009188143,
"Avg. Area Number of Bedrooms": 4.09,
"Area Population": 23086.8005,
"Price": 1059033.558,
},
{
"Avg. Area Income": 79248.64245,
"Avg. Area House Age": 6.002899808,
"Avg. AreaNumberofRooms": 6.730821019,
"Avg. Area Number of Bedrooms": 3.09,
"Area Population": 40173.07217,
"Price": 1505890.915,
},
O conjunto de dados é um arquivo JSON armazenado em:
https://github.com/meetnandu05/ml1/blob/master/house.jsonDados de limpeza
Ao se preparar para o aprendizado de máquina, é sempre importante:
- Remova os dados que você não precisa
- Limpe os dados de erros
Remover dados
Uma maneira inteligente de remover dados desnecessários, é extrair apenas os dados que você precisa .
Isso pode ser feito iterando (fazendo um loop) seus dados com uma função de mapa .
A função abaixo pega um objeto e retorna apenas x e y das propriedades Horsepower e Miles_per_Gallon do objeto:
function extractData(obj) {
return {x:obj.Horsepower, y:obj.Miles_per_Gallon};
}
Remover erros
A maioria dos conjuntos de dados contém algum tipo de erro.
Uma maneira inteligente de remover erros é usar uma função de filtro para filtrar os erros.
O código abaixo retorna false se uma das propriedades (x ou y) contiver um valor nulo:
function removeErrors(obj) {
return obj.x != null && obj.y != null;
}
Buscando dados
Quando você tiver suas funções de mapa e filtro prontas, poderá escrever uma função para buscar os dados.
async function runTF() {
const jsonData = await fetch("cardata.json");
let values = await jsonData.json();
values = values.map(extractData).filter(removeErrors);
}
Plotando os dados
Aqui está algum código que você pode usar para plotar os dados:
function tfPlot(values, surface) {
tfvis.render.scatterplot(surface,
{values:values, series:['Original','Predicted']},
{xLabel:'Rooms', yLabel:'Price',});
}