K近邻KNeighborsRegressor--StandardScaler标准化--mean_squared_error均方根误差学习笔记

最新推荐文章于 2024-05-18 12:25:51 发布

弎见

最新推荐文章于 2024-05-18 12:25:51 发布

阅读量927

点赞数 1

分类专栏：机器学习入门文章标签： numpy pandas 机器学习 K近邻算法

本文链接：https://blog.csdn.net/sanjianjixiang/article/details/100594051

版权

np.abs() : 计算数值各元素运算的绝对值

import numpy as np
np.abs([1,-2,3,-4])

Out:
array([1, 2, 3, 4])

DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)[source]
DataFrame可以是Series、DataFrame

n的含义是抽样的个数，是整数；frac是浮点数，是抽样的比例
replace为True含义为数据本身改变，为False含义为数据本身未改变 , 需要定义新变量接收
weights的含义是给抽样所在axis的每个元素赋值抽样权重，所以weights的长度必须和所在axis的长度相同，不然会报错，缺失值的weights会被设置为0，如果weights加和不等于1，会被normalized到加和为1，inf和-inf值不被允许
axis的含义是抽样的方向，axis=0，对行进行抽样，axis=1，对列进行抽样
random_state是用来复现结果的

DataFrame数据类型有千位分隔符和货币符 , 即为"$10,000.00"时 , 怎么转换为int或者float类型 :

from scipy.spatial import distance

from sklearn.neighbors import KNeigborsRegressor

knn = KNeighborsRegressor()
cols = ['A','B']
knn.fit(train_data[cols],train_data['C'])
ret = knn.predict(test_df[cols]

关注