机器学习多分类问题小白入门

最新推荐文章于 2024-06-13 18:32:50 发布

梦中713

最新推荐文章于 2024-06-13 18:32:50 发布

阅读量876

点赞数

文章标签：机器学习分类 python

本文链接：https://blog.csdn.net/m0_52079970/article/details/125873156

版权

第一次接触lightgbm框架解决基础的多分类问题，用的是自带的鸢尾花数据集。

在JupyterLab进行python代码的编写。

关于JupyterLab第一天调试时候遇到了一些报错，比如在pip install 时要选好运行环境，我当时在main环境下加载这些包，但在python3的环境里进行运行，导致报错浪费了很多时间。如下图片

代码实现部分：

# 加载数据
iris = datasets.load_iris()
print(iris) // datasets自带的数据集已经把特征和数据分好了可以直接在数组里分着调用
X = iris.data //150行4列的数组
y = iris.target // 一个关于种类[0 1 2 2 1 2.....]的数组
iris_train = iris.data
iris_target = iris.target
labels = iris.target_names

//将数据集分割成训练集和测试级

X_train,X_test,y_train,y_test=train_test_split(iris.data,iris.target,test_size=0.2)

//在字典里对lightgbm的一些参数的设定

params = {
'task': 'train',
'boosting_type': 'gbdt', # 设置提升类型
'objective': 'multiclass',
'metric' : {'multi_logloss'}, # 评估函数
'num_leaves': 31, # 叶子节点数
'learning_rate': 0.05, # 学习速率
'feature_fraction': 0.9, # 建树的特征选择比例
'bagging_fraction': 0.8, # 建树的样本采样比例
'bagging_freq': 5, # k 意味着每 k 次迭代执行bagging
'verbose': -1 , # <0 显示致命的, =0 显示错误 (警告), >0 显示信息
'num_class': 3,

} # 目标函数a%matplotlib inline

//将数据集转化为lgb的dataset形式

train_data=lgb.Dataset(X_train,label=y_train)
validation_data=lgb.Dataset(X_test,label=y_test)

//对模型进行训练

clf=

最低0.47元/天解锁文章

梦中713

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
机器学习多分类问题小白入门

/在这里发现多分类是不支持pr曲线和roc曲线的绘制，报错提示只有二分类才可以，因此我们将多分类问题转化为几个二分类问题，分类别进行画图。'verbose'-1,#0显示信息。#[,i]切片取某一列的所有行，y_score[,i]第i个类的分类结果性能。plt.ylabel('Precision',fontsize=16)#x和y轴标签。print('准确率',accuracy_score(y_test,y_pred))...
复制链接

扫一扫