基于Python的高光谱SVM分类建模

支持向量机(SVM)是一种经典的有监督分类模型,它通过学习最优分类超平面将不同类别的样本分开。当面对高维小样本数据时,SVM能够很好地平衡模型复杂度和分类性能,是高光谱分类的常用方法。

在Python中,我们可以方便地使用Scikit-learn库实现SVM分类模型。以下Python代码展示了一个完整的高光谱SVM分类建模流程,主要步骤如下:

  1. 数据读取:使用Pandas库读取训练集和测试集数据,存储为DataFrame格式。其中每行对应一个样本,列表示不同的光谱波段,最后一列为类别标签。

  2. 数据划分:将DataFrame划分为特征X和标签y两部分,X为样本的光谱特征向量,y为对应的类别标签。

  3. 模型训练:创建SVM分类器,使用RBF核函数进行非线性映射。通过网格搜索选择最优的惩罚系数C和核函数参数gamma,提高分类性能。使用训练集数据拟合模型。

  4. 模型评估:使用训练好的模型对训练集和测试集进行预测,计算分类准确率,评估模型性能。

  5. 结果分析:绘制混淆矩阵,直观展现不同类别的分类情况,分析模型的优势和局限性。

高光谱数据集分为训练集和测试集两个csv文件导入(代码最后一行),其中,csv文件中,第一行为高光谱波段,最后一列为分类标签。

import pandas as pd
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
from sklearn.model_selection import GridSearchCV
from sklearn.metrics import confusion_matrix
import matplotlib.pyplot as plt
import seaborn as sns

# 读取数据
def load_data(train_path, test_path):
    # 加载训练集
    train_data = pd.read_csv(train_path)
    X_train = train_data.iloc[:, :-1]  # 选择除了最后一列之外的所有列作为特征
    y_train = train_data.iloc[:, -1]   # 选择最后一列作为标签

    # 加载测试集
    test_data = pd.read_csv(test_path)
    X_test = test_data.iloc[:, :-1]  # 选择除了最后一列之外的所有列作为特征
    y_test = test_data.iloc[:, -1]   # 选择最后一列作为标签
    
    return X_train, y_train, X_test, y_test

# SVM模型训练和测试
def svm_model(train_path, test_path):
    # 加载数据
    X_train, y_train, X_test, y_test = load_data(train_path, test_path)
    
    # 创建SVM分类器,使用RBF核函数和网格搜索
    param_grid = {
        'C': [0.1, 1, 10, 100, 200, 500],
        'gamma': [10, 1, 0.1, 0.01, 0.001],
        'kernel': ['rbf']
    }
    svc = SVC()
    clf = GridSearchCV(svc, param_grid, refit=True, verbose=2)
    
    # 训练模型
    clf.fit(X_train, y_train)
    
    # 输出最佳参数
    print("最佳参数: ", clf.best_params_)
    
    # 计算训练集准确率
    y_train_pred = clf.predict(X_train)
    train_accuracy = accuracy_score(y_train, y_train_pred)
    print("训练集准确率: ", train_accuracy)
    
    # 测试模型
    y_pred = clf.predict(X_test)

    # 计算测试集准确率
    test_accuracy = accuracy_score(y_test, y_pred)
    print("测试集准确率: ", test_accuracy)
    
    # 绘制混淆矩阵
    cm = confusion_matrix(y_test, y_pred)
    plt.figure(figsize=(10, 7))
    sns.heatmap(cm, annot=True, fmt="d", cmap="Blues")
    plt.xlabel('Predicted')
    plt.ylabel('True')
    plt.title('Confusion Matrix')
    plt.show()


# 调用svm_model函数,需要替换下面的'train.csv'和'test.csv'为你的CSV文件路径
svm_model(r"train.csv",r"test.csv")

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值