Python光谱建模——XGBoost

最新推荐文章于 2024-07-28 22:58:54 发布

csh学习中

最新推荐文章于 2024-07-28 22:58:54 发布

阅读量365

点赞数 8

文章标签： python

本文链接：https://blog.csdn.net/qq_42629547/article/details/140521747

版权

话不多说，光谱数据集通过csv文件导入，安装对应的库后运行代码即可

import pandas as pd
import xgboost as xgb
from sklearn.metrics import accuracy_score, confusion_matrix
from sklearn.preprocessing import LabelEncoder
import matplotlib.pyplot as plt
import seaborn as sns

# 读取训练和测试数据
train_df = pd.read_csv('train.csv')
test_df = pd.read_csv('test.csv')

# 分离特征和标签
X_train = train_df.iloc[:, :-1]
y_train = train_df.iloc[:, -1]

X_test = test_df.iloc[:, :-1]
y_test = test_df.iloc[:, -1]

# 编码标签
label_encoder = LabelEncoder()
y_train = label_encoder.fit_transform(y_train)
y_test = label_encoder.transform(y_test)

# 创建DMatrix
dtrain = xgb.DMatrix(X_train, label=y_train)
dtest = xgb.DMatrix(X_test, label=y_test)

# 设置参数
params = {
    'objective': 'multi:softmax',  # 多分类
    'num_class': len(label_encoder.classes_),  # 分类数
    'eval_metric': 'mlogloss',  # 多分类log损失
    'max_depth': 6,
    'eta': 0.3,
    'verbosity': 1,
    'nthread': 4
}

# 训练模型
num_round = 100
bst = xgb.train(params, dtrain, num_round)

# 预测
preds = bst.predict(dtest)

# 计算准确率
accuracy = accuracy_score(y_test, preds)
print(f'Accuracy: {accuracy * 100:.2f}%')

# 计算混淆矩阵
cm = confusion_matrix(y_test, preds)
cm_display_labels = label_encoder.classes_

# 绘制混淆矩阵
plt.figure(figsize=(10, 8))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=cm_display_labels, yticklabels=cm_display_labels)
plt.xlabel('Predicted')
plt.ylabel('True')
plt.title('Confusion Matrix')
plt.show()

运行后