1.定义问题
这个项目通过分析批发销售数据集(Wholesale customers data)来判断销售商品来源于哪个渠道。
- FRESH:新鲜商品年度支出
- MILK::牛奶商品年度支出
- GROCERY:杂货商品年度支出
- FROZEN:冷冻品年度支出
- DETERGENTS_PAPER: 清洁剂和纸制品的年度支出(百万美元)(连续)
- DELICATESSEN: 熟食产品年度支出(百万美元)
- CHANNEL: 销售渠道,horeca(酒店/餐厅/咖啡厅)或Retail(零售渠道8) ;horeca取1,Retail取2
8)REGION:销售地区,Lison, Oporto or Other;Lison取1,Oporto取2,Other取3
- 导入数据
本数据从UCI机器学习仓库下载(http://archive.ics.uci.edu/ml/datasets/Wholesale+customers#)
import pandas as pd
from sklearn import model_selection
import numpy as np
from sklearn import neighbors
import matplotlib.pyplot as plt
import numpy as np
from sklearn import