SVM系列

该系列将通过以下几部分来讲述SVM:

  1. SVM优化目标
    • 这篇主要讲SVM的基本思想以及优化目标的推演
    • 软件间隔
    • 支持向量
  2. SVM求解--对偶
    • 这篇主要讲SVM优化目标的对偶问题,即如何将难以求解的优化目标转出容易求解的对偶问题
  3. SVM求解--smo
    • 这篇主要讲SVM对偶问题的高效求解算法--smo
  4. 非线性SVM--kernel
    • 这篇主要讲非线性SVM,即通过kernel来实现非线性分类
    • 常用的几个kernel的说明与对比
  5. SVM与带正则的LR的区别与联系
    • 通过前面几篇的介绍,可以发现SVM的思想其实与正则化regularization思想很类似。regularization的目标是将分类误差​最小化,条件是w^Tw\leq C;SVM的目标是w^Tw最小化,条件是y_i(w^Tx_i+b)\geq1。有趣的是,regularization与SVM的目标和限制条件分别对调了。其实,考虑的内容是类似的,效果也是相近的。

如有不当之处,欢迎指正交流。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是基于Python的代码,使用SVM算法来构建一个模型,以预测某一炮的数据是否为False或True: ```python import h5py import numpy as np from sklearn.svm import SVC from sklearn.metrics import accuracy_score from tqdm import tqdm # 数据集路径 train_path = 'train/' test_path = 'test/' val_path = 'val/' # 读取HDF5文件中的数据 def read_hdf5_file(file): with h5py.File(file, 'r') as f: data = f['diagnosis'][:] label = f['diagnosis'].attrs['IsDisrupt'] return data, label # 加载数据集 def load_dataset(path): data = [] labels = [] for file in tqdm(os.listdir(path)): if file.endswith('.hdf5'): file_path = os.path.join(path, file) d, l = read_hdf5_file(file_path) data.append(d) labels.append(l) return np.vstack(data), np.hstack(labels) # 训练模型 def train_model(train_data, train_labels): clf = SVC(kernel='linear') clf.fit(train_data, train_labels) return clf # 测试模型 def test_model(model, test_data, test_labels): y_pred = model.predict(test_data) accuracy = accuracy_score(test_labels, y_pred) return accuracy # 加载训练集、测试集和验证集 train_data, train_labels = load_dataset(train_path) test_data, test_labels = load_dataset(test_path) val_data, val_labels = load_dataset(val_path) # 训练模型 model = train_model(train_data, train_labels) # 测试模型 test_accuracy = test_model(model, test_data, test_labels) val_accuracy = test_model(model, val_data, val_labels) # 输出测试集和验证集的准确率 print('Test Accuracy:', test_accuracy) print('Validation Accuracy:', val_accuracy) ``` 这段代码的主要步骤包括: 1. 读取HDF5文件中的数据,使用`read_hdf5_file`函数实现。 2. 加载训练集、测试集和验证集,使用`load_dataset`函数实现。 3. 训练模型,使用`train_model`函数实现。 4. 测试模型,使用`test_model`函数实现。 5. 输出测试集和验证集的准确率。 为了减少模型构建时间,我们使用`load_dataset`函数一次性将所有数据加载到内存中,这样在训练和测试模型时就不需要再次读取文件。同时,我们使用`tqdm`库来显示数据加载的进度。在训练模型时,我们使用SVM算法,并使用线性核函数。在测试模型时,我们使用准确率作为评估指标。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值