《Web安全之机器学习入门》一 3.4　效果验证

最新推荐文章于 2024-07-24 12:41:54 发布

weixin_33883178

最新推荐文章于 2024-07-24 12:41:54 发布

阅读量139

点赞数

文章标签： web安全数据结构与算法人工智能

原文链接：https://yq.aliyun.com/articles/212636

版权

3.4　效果验证

效果验证是机器学习非常重要的一个环节，最常使用的是交叉验证。常见的验证过程如图3-15所示。以SVM为例，导入SVM库以及Scikit-Learn自带的样本库datasets：

>>> import numpy as np
>>> from sklearn.model_selection import train_test_split
>>> from sklearn import datasets
>>> from sklearn import svm

获取样本数据：

>>> iris = datasets.load_iris()
>>> iris.data.shape, iris.target.shape
((150, 4), (150,))

为了保证效果，使用函数train_test_spli随机分割样本为训练样本和测试样本：

>>> X_train, X_test, y_train, y_test = train_test_split(
...     iris.data, iris.target, test_size=0.4, random_state=0)
>>> X_train.shape, y_train.shape
((90, 4), (90,))
>>> X_test.shape, y_test.shape
((60, 4), (60,))

调用SVM进行训练：

>>> clf = svm.SVC(kernel='linear', C=1).fit(X_train, y_train)

判断预测结果与测试样本标记的结果，得到准确率：

>>> clf.score(X_test, y_test)
0.96...

screenshot

为了提高验证的准确度，比较常见的方法是使用K折交叉验证。所谓K折交叉验证，就是初始采样分割成K个子样本，一个单独的子样本被保留作为验证模型的数据，其他K-1个样本用来训练。交叉验证重复K次，每个子样本验证一次，平均K次的结果或者使用其他结合方式，最终得到一个单一估测。三折交叉验证原理图见图3-16。这个方法的优势在于，同时重复运用随机产生的子样本进行训练和验证，每次的结果验证一次，十折交叉验证是最常用的。还是上面的例子，十折交叉验证实现如下：

>>> from sklearn.model_selection import cross_val_score
>>> clf = svm.SVC(kernel='linear', C=1)
>>> scores = cross_val_score(clf, iris.data, iris.target, cv=5)
>>> scores
array([ 0.96...,  1.  ...,  0.96...,  0.96...,  1.        ])

screenshot

weixin_33883178

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

weixin_33883178 CSDN认证博客专家 CSDN认证企业博客

码龄9年

159: 原创

-: 周排名

45万+: 总排名

133万+: 访问

: 等级

7631: 积分

6200: 粉丝

186: 获赞

23: 评论

1069: 收藏

私信

关注

热门文章

最新评论

负数在计算机中的储存方式
做而论道_CS: 所谓的补码，就是这么来的。补码，也就是正常的二进制数。补码，与符号位原码反码，都没有半点关系。所以，在计算机中：　只有二进制数；　根本就没有什么 “符号位原码反码补码”！进位，应该是小学的知识点。但是，计算机专家们，都是从小就迷上了计算机。该学的知识，都稀里糊涂的：　加法中进位，是怎么来的？　舍弃进位，结果又应该如何计算？　正数，为什么能当负数呢？　加法，怎么就成了减法？　。。。这些简单的事，计算机专家们，可以说是一窍不通！没有办法，只好编造一套瞎话：　机器数真值符号位原码反码补码正数三码相同　负数取反加一符号位不变模符号位也参加运算 ... 一个简单的算术题，居然要用这么多垃圾来解释！老外的算术水平，由此可见一斑。计算机专家写的这些，明显就是【拿个鞋拔子当做玉如意】。假货，不仅仅在古董行业才有啊！我们的老师，数学水平，当然不会这么差。但是由于对老外盲目的崇拜迷信，也就只能跟风了。于是，就在大学课堂上，兜着圈子讲解小学知识，呵呵也不知道，多年来，有多少学生因此挂科。而且，还把这些没有任何理论依据的谎言，列为考研的内容！真是毁人不倦坑人不浅！
负数在计算机中的储存方式
做而论道_CS: 计算机的字长，是固定的。八位机，只会做：　八位＋八位＝一个进位、八位的和。八位二进制的范围是：0000 0000 ~ 1111 1111。与其等效的十进制是：0 ~ 255。最大值 255，就可以当做 “负一” 来使用。如　27－1 = 26，八位机将如下计算：　　　0001 1011　　(这就是 27) 　　＋1111 1111　　(这就是－1) －－－－－－－－－－ (进 1 ) 0001 1010 舍弃进位，只取八位的和，就是 26。看到了吗：　当你舍弃了进位，　　你就用加法，实现了减法运算。－－－－－－－－－－－－－－－－－－－ 99、255，都能当－1！这是为什么呢？　绝对不是 “符号位原码反码补码取反加一 ... ” 　而是你舍弃了进位。也可以说，是在计算时【减去了进位】！那就把【减进位】算进去吧。两位十进制的进位，是：10^2 = 100。　加上 99，实际上是加：99－100 = －1。　加上 98，实际上是加：98－100 = －2。　。。。八位二进制的进位，是：2^8 = 256。　加 255，也就是加上：255－256 = －1。　加 254，也就是加上：254－256 = －2。　。。。这些正数，与其负数的关系式，你一定能看出来：　正数 = 256 ＋负数。这些正数，就被计算机专家，称为 “补码” 了。本来，这是一个简单的算术题。计算机专家，偷了梁换了柱，就 “发明了补码”！
负数在计算机中的储存方式
做而论道_CS: 虽然，计算机使用二进制数。但是，二进制数，也是数。二进制数，和十进制数，是雷同的。并非是什么：　机器数、原码、反码、补码！　符号位，更是根本就不存在的。所谓的 “补码”，也并非二进制才有。在任何进制中，都是存在的。－－－－－－－－－－－－－－－－－－－ “补码” 的来源，仅是出自一个小学的算术题而已。并非是计算机专家的发明。你看两位十进制数：0 ~ 99。可以有：　27 + 99 = (一百) 26 　27 － 1 = 26 如果忽略进位，这两种算法的功能，不就是相同的吗？即，舍弃了进位：　正数，就能当负数使用！　加法，也就可以实现减法运算！同理，在计算机中舍弃进位：　就可以省掉减法器，简化硬件！　只需配置一个加法器，就能走遍天下！＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝你只要【忽略进位】：　你就能懂得 “补码” 的来源与意义。＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝
R语言ggplot2-labs 函数
景铮: 请问如何加大图中lab的字体呢？
使用MutationObserver监控dom树实现水印的不可删除属性。
汉武大帝·: 当在节点样式中操作属性时，回调函数一直执行，最后浏览器卡死，怎么设置只重绘一次就行

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。