scikit简介

最新推荐文章于 2022-11-11 17:26:41 发布

0点51胜

最新推荐文章于 2022-11-11 17:26:41 发布

阅读量4.2k

点赞数

分类专栏：机器学习 python 文章标签： scikit python 数字识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dss875914213/article/details/82903111

版权

python 同时被 2 个专栏收录

96 篇文章 3 订阅

订阅专栏

45 篇文章 2 订阅

订阅专栏

1.scikit-learn示例

1)数据采集和标记

from sklearn import datasets
digits=datasets.load_digits()

2)特征选择

直观方法，直接使用图片的每一个像素点。8*8=64

数据需要保存为样本个数*特征向量格式的array对象

3)数据清洗

把采集到的、不适合用做机器学习训练的数据进行预处理。

例把200*200分辨率压缩到8*8

4)模型选择

5)模型训练

(1)把数据分为训练集和测试机

from sklearn.cross_validation import train_test_split

Xtrain,Xtest,Ytrain,Ytest=train_test_split(digits.data,digits.target,test_size=0.20,random_state=2)

(2)训练模型

from sklearn import svm

clf=svm.SVC(gamma=0.0001,C=100.)

clf.fit(Xtrain,Ytrain)

6)模型测试

clf.score(Xtest,Ytest)

7)模型保存与加载

from sklearn.externals import joblib

joblib.dump(clf,'c:/users/tianhun/Desktop/digits_svm.pkl')

clf2=joblib.load('c:/users/tianhun/Desktop/digits_svm.pkl')

2.scikit-learn一般性原理和通用规则

1)评估模型对象

学习机器学习算法的原理，其中一项非常重要的任务是了解不同机器学习算法有哪些可调参数，这些参数的意义，以及其对算法的影响。

工程应用，调整算法参数，实现效率和准确度的平衡

2)模型接口

fit()训练模型接口有监督，fit(X,y)进行训练无监督，fit(X)

predict()预测接口分类还可用predict_proba()输出属于各种类型的可能性，predict只输出最高可能性的类型无监督，聚类分析

score()评价模型接口分越高越好。有些模型不能只用score()评价要用查准率和召回率来衡量

transform 无监督例PCA算法对数据进行降维

3)模型检验

score()

sklearn.metrics抱下面有一系列检测模型的方法

4)模型选择

参考文献

https://blog.csdn.net/qq_34562093/article/details/78973039

《scikit-learn机器学习》

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

0点51胜 CSDN认证博客专家 CSDN认证企业博客

码龄9年

329: 原创

1万+: 周排名

7452: 总排名

64万+: 访问

: 等级

6834: 积分

6683: 粉丝

478: 获赞

102: 评论

1066: 收藏

私信

关注

热门文章

分类专栏

ffmpeg 21篇
音视频 28篇
obs 4篇
c/c++ 24篇
directX 13篇
windows 19篇
cmake 4篇
visual studio 1篇
nginx 1篇
h264 1篇
工作 2篇
刷题 71篇
毕业设计
英语 4篇
嵌入式 23篇
机器学习 45篇
linux 10篇
python 96篇
git 6篇
计算机网络 5篇
其他 14篇

最新评论

PPT 弹出无法加载MathType 简单方便 (亲测有效)
@xf744: 感谢！已解决删除注册表之后还弹窗可能是没删干净，选择最大的目录再搜索，可以找得全还不行的话可以直接搜索Math Type，把相关的都删掉我搜Math Type之后发现之前有一个Math Type AddIn找漏了，删完之后就没有弹窗了，感谢博主
国旗识别作业用到python的知识点整理
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接；(3)增加条理清晰的目录。
wireshark 过滤 post 请求
早起不会写代码: sslog里面要写什么吗
windows下c++程序与python程序间通信
-Phoenix--: 万分感谢!! 新年快乐!!🎉🎉
[obs] 编译记录
o_longzhong: __std_find_trivial_1 问题需要用vs2022编译。或者用vs2019自己编译vpl库https://github.com/intel/libvpl。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。