代码如下 .Knn最近邻算法模拟
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
import warnings
warnings.filterwarnings('ignore')
data = pd.DataFrame({'name':['北京遇上西雅图','喜欢你','疯狂动物城','战狼2','力王','敢死队'],
'fight':[3,2,1,101,99,98],
'kiss':[104,100,81,10,5,2],
'type':['Romance','Romance','Romance','Action','Action','Action']})
print('-------')
plt.scatter(data[data['type'] == 'Romance']['fight'],data[data['type'] == 'Romance']['kiss'],color = 'r',marker = 'o',label = 'Romance')
plt.scatter(data[data['type'] == 'Action']['fight'],data[data['type'] == 'Action']['kiss'],color = 'g',marker = 'o',label = 'Action')
plt.grid()
plt.legend()
knn = neighbors.KNeighborsClassifier()
knn.fit(data[['fight','kiss']], data['type'])
s = pd.DataFrame([18,90])
print(type(s))
print(type(s))
knn.predict([18,90])
# knn.predict([[18,90],[12,90]])
运行会报错
根据错误添加reshape(-1,1)
又会报错
根据测试部分旧版本不报错,我的版本是python3.8
新版本的python sklearn库中,所有的数据都应该是二维矩阵。
解决方案
双中括号变为DataFrame即可
运行一下
成功解决
原因:一个中括号的话默认的是pd.Series,而我新版的KNN预测predict函数要接受DataFrame,所以要用双中括号变为DataFrame
思考
为什么外面pd.DataFrame([18,90])也是转化为DataFrame但是仍然报第二个错误呢?
看一下双中括号和单括号的区别
代码块如下
s_dou = pd.DataFrame([[18,90]])
s_sin = pd.DataFrame([18,90])
print(type(s_dou))
print(type(s_sin))
print(s_dou)
print(s_sin)
运行结果直接上图
报错原因:
DataFrame是以列为索引的,所以当我们单中括号作为参数时,第一个参数会有两个而第二个参数一个没有,所以会报错。转化为双括号之后会有两列每列一个参数,所以运行成功。同样这也是为什么array.reshape(-1,1)后会报同样的错误。