python 支持向量机预测结果相同_使用Scikit学习支持向量机时，预测总是相同的...

最新推荐文章于 2023-08-04 22:08:06 发布

weixin_39897449

最新推荐文章于 2023-08-04 22:08:06 发布

阅读量414

点赞数

文章标签： python 支持向量机预测结果相同

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39897449/article/details/113966080

版权

我认为问题是数据被分成训练和测试的方式。您已经采集了前3000个样本用于培训，剩下的190个样本用于测试。我发现，通过这样的训练，分类器可以为所有测试样本生成真正的类标签(score=1.0)。我还注意到，数据集的最后190个样本具有相同的类标签，即'N'。因此，你得到的结果是正确的。在

我建议您使用test_size=.06将数据集拆分为train并通过^{}进行测试(这大约相当于190/3190，不过为了使结果的可视化更容易，我在下面的示例运行中使用了test_size=.01)。为了简单起见，我还建议您使用^{}对特性的分类值进行编码。在

以下是完整的代码(我已经自由地执行了一些重构)：import numpy as np

from sklearn.preprocessing import OneHotEncoder, LabelEncoder

from sklearn.model_selection import ShuffleSplit

from sklearn import svm

data = np.loadtxt(r'splice.data', delimiter=',', dtype='string')

bases = {'A': 0, 'C': 1, 'D': 2, 'G': 3, 'N': 4, 'R': 5, 'S': 6, 'T': 7}

X_base = np.asarray([[bases[c] for c in seq.strip()] for seq in data[:, 2]])

y_class = data[:, 0]

enc = OneHotEncoder(n_values=len(bases))

lb = LabelEncoder()

enc.fit(X_base)

lb.fit(y_class)

X = enc.transform(X_base).toarray()

y = lb.transform(y_class)

rs = ShuffleSplit(n_splits=1, test_size=.01, random_state=0)

train_index, test_index = rs.split(X).next()

train_X, train_y = X[train_index], y[train_index]

test_X, test_y = X[test_index], y[test_index]

clf = svm.SVC(kernel="rbf")

clf.fit(train_X, train_y)

predictions = clf.predict(test_X)

演示：

^{pr2}$

注意：确保您的sklearn版本是0.18.1，否则上面的代码可能无法工作。在

weixin_39897449

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。