python sklearn svm_python – sklearn SVM表现非常糟糕

最新推荐文章于 2022-09-26 11:09:24 发布

YoLmer Bloody

最新推荐文章于 2022-09-26 11:09:24 发布

阅读量363

点赞数

文章标签： python sklearn svm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42522912/article/details/114391192

版权

我有9164分,其中4303被标记为我想要预测的类,4861被标记为不是该类.它们没有重复点.

df = pd.DataFrame(dataset)

train, validate, test = np.split(df.sample(frac=1), [int(.6*len(df)), int(.8*len(df))])

train_labels = construct_labels(train)

train_data = construct_data(train)

test_labels = construct_labels(test)

test_data = construct_data(test)

def predict_labels(test_data, classifier):

labels = []

for test_d in test_data:

labels.append(classifier.predict([test_d]))

return np.array(labels)

def construct_labels(df):

labels = []

for index, row in df.iterrows():

if row[2] == 'Trump':

labels.append('Atomium')

else:

labels.append('Not Trump')

return np.array(labels)

def construct_data(df):

first_row = df.iloc[0]

data = np.array([first_row[1]])

for index, row in df.iterrows():

if first_row[0] != row[0]:

data = np.concatenate((data, np.array([row[1]])), axis=0)

return data

然后：

>>> classifier = SVC(verbose=True)

>>> classifier.fit(train_data, train_labels)

[LibSVM].......*..*

optimization finished, #iter = 9565

obj = -2718.376533, rho = 0.132062

nSV = 5497, nBSV = 2550

Total nSV = 5497

SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,

decision_function_shape=None, degree=3, gamma='auto', kernel='rbf',

max_iter=-1, probability=False, random_state=None, shrinking=True,

tol=0.001, verbose=True)

>>> predicted_labels = predict_labels(test_data, classifier)

>>> for p, t in zip(predicted_labels, test_labels):

... if p == t:

... correct = correct + 1

并且我在1833年只得到正确的943个标签(= len(test_labels)) – > (943 * 100/1843 = 51.4％)

我怀疑我在这里错过了一些重要的时间,也许我应该将parameter设置为分类器以进行更精致的工作或其他什么？

注意：第一次在这里使用SVM,所以你可能认为理所当然,我甚至可能没想到……

尝试：

我去了,并将负面例子的数量减少到4303(与正例相同).这略微提高了准确性.

在答案后编辑：

>>> print(clf.best_estimator_)

SVC(C=1000.0, cache_size=200, class_weight='balanced', coef0=0.0,

decision_function_shape=None, degree=3, gamma=0.0001, kernel='rbf',

max_iter=-1, probability=False, random_state=None, shrinking=True,

tol=0.001, verbose=False)

>>> classifier = SVC(C=1000.0, cache_size=200, class_weight='balanced', coef0=0.0,

... decision_function_shape=None, degree=3, gamma=0.0001, kernel='rbf',

... max_iter=-1, probability=False, random_state=None, shrinking=True,

... tol=0.001, verbose=False)

>>> classifier.fit(train_data, train_labels)

SVC(C=1000.0, cache_size=200, class_weight='balanced', coef0=0.0,

decision_function_shape=None, degree=3, gamma=0.0001, kernel='rbf',

max_iter=-1, probability=False, random_state=None, shrinking=True,

tol=0.001, verbose=False)

我也尝试了clf.fit(train_data,train_labels),它也执行了相同的操作.

用数据编辑(数据不是随机的)：

>>> train_data[0]

array([ 20.21062112, 27.924016 , 137.13815308, 130.97432804,

... # there are 256 coordinates in total

67.76352596, 56.67798138, 104.89566517, 10.02616417])

>>> train_labels[0]

'Not Trump'

>>> train_labels[1]

'Trump'

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python sklearn svm_python – sklearn SVM表现非常糟糕

我有9164分,其中4303被标记为我想要预测的类,4861被标记为不是该类.它们没有重复点.df = pd.DataFrame(dataset)train, validate, test = np.split(df.sample(frac=1), [int(.6*len(df)), int(.8*len(df))])train_labels = construct_labels(train)tr...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。