西瓜书《机器学习》课后答案——Chapter6_6.3

6.3 选择两个UCI数据集,分别用线性核和高斯核训练一个SVM,并与BP神经网络和C4.5决策树进行实验比较。
解答:
(1) 准备libsvm的训练数据与测试数据

从UCI网站上选择了Iris数据集,这个数据集总共分为3类,每类50个样本,每个实例有四个属性。数据保存在bezdekIris.txt文件中,举一个样本为例:

5.1,3.5,1.4,0.2,Iris-setosa

书中也没有介绍解决多分类问题的SVM,所以这里还是训练两分类SVM。我们取Iris数据集中的任意两类作为实验数据。其中每类各取40个组成训练集,剩下10个组成测试集。用下面的程序生成libsvm的格式化数据:

#-*- coding:gbk -*-
"""
Author: Victoria
Created on 2017.9.30 17:30
"""
pos_train_num = 0
neg_train_num = 0
f1 = open("../../数据/bezdekIris.txt", "r")
f2 = open("iris_train.txt", "w")
f3 = open("iris_test.txt", "w")
for line in f1:
    x1, x2, x3, x4, cate = line.strip().split(",")
    if cate=="Iris-setosa":
        if neg_train_num<40:
            f2.write("{} 1:{} 2:{} 3:{} 4:{}\n".format(0, x1, x2, x3, x4))
            neg_train_num += 1
        else:
            f3.write(
  • 5
    点赞
  • 45
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值