sklearn（四）----标准化数据，这里normalization就是scaling

最新推荐文章于 2024-02-22 10:10:41 发布

梦游--

最新推荐文章于 2024-02-22 10:10:41 发布

阅读量920

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhouguangfei0717/article/details/77448474

版权

标准化数据

这里normalization就是scaling

这里是在说属性差别很大对训练有不好的影响，这是我们就要用scaling

例子：

from sklean import preprocessing#标准化模块

import numpy as np

a=np.array([[10,2.7,3.6]

[-100,5,-2]

[120,20,40]],dtype=np.float64)

print(a)

print(preprocessing.scale(a))#标准化a

今天我们要做的是：

from sklean import preprocessing#标准化模块

import numpy as np

from sklearn.cross_validation import train_test_split #把数据分为两部分，

#一部分为测试，一部分为训练

from sklearn.datasets.samples_generator import make_classification#生成数据

from sklearn.svm import SVC#模型，这个应该是支持上良机的模型

import matplotlib.pyplot as plt

X,y=make_classificatdant=0,

n_informative=2,random_state=22,n_clusters_per_class=1,scale=100)

#这里简单说一下里面的含义，有300个例子，有两个属性，n_informative这个是属性相关的个数为二

#random_state随机产生数据，每次数据产生的是一样的）

plt.scatter(X[:,0],X[:,1],c=y)

plt.show()

结果是：

X=preprocessing.scale(X)这里其实还有一种写法，就是我们想规定数据标准化的取值范围

# X=preprocessing.minmax_scale(X,feature_range=(0,1))这个是默认的

X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.3)

clf=SVC()

clf.fit(X_train,y_tarin)

#print(clf.predict(X_test))

print(clf.score(X_test,y_test))#上章已经说过他的意思了，打印准确度

结果是：如果用标准化准确率可以达到百分之九十多

但是没有用scale他的准确度只有四十多

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。