项目实训纪录（纪录5）

最新推荐文章于 2024-07-25 13:44:24 发布

同心勰力

最新推荐文章于 2024-07-25 13:44:24 发布

阅读量68

点赞数

文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44316742/article/details/118566742

版权

2.技术与实现

(1)操作流程

对数据进行逻辑回归建模的过程一般包括：

数据准备
- 装载数据集，熟悉数据结构和含义
- 必要的预处理操作：处理缺失/重复值、文本字段的数值化转换、标准化/归一化处理
- 拆分训练集和测试集
模型训练
- 使用训练集训练模型，获取最优的权重参数。可以使用批量梯度下降算法、随机梯度下降算法来获得最优权重参数
- 必要的情况下可以调整某些超参数（例如阈值 $K$ 、惩罚系数 $\lambda$ 等），本例将引入L2惩罚系数作为超参数
性能验证
- 使用训练好的模型预测新的样本(包括测试样本)
- 使用测试数据集来验证模型的性能
- 在有条件的情况下，可以通过绘制决策边界线来查看模型的的分类效果

(2)技术手段

sklearn.linear_model模块
- LogisticRegression类：逻辑回归算法实现
sklearn.metrics模块
- precision_score, recall_score, f1_score函数，分别用于计算精度、召回率、F1 Score
- classification_repor函数：生成性能指标报告
2.技术与实现

(1)数据准备

在进行线性回归建模前，应做好下列数据准备：

构造样本的特征矩阵 $X$ 。矩阵中的每一行代表一个样本的各个特征值
构造样本的结果向量 $Y$ 。向量中每个元素代表一个样本的结果值
将 $X$ 和 $Y$ 按一定比例切分成训练样本 (X_train, y_train) 和测试样本 (X_test, y_test)

(2)使用sklearn.linear_model.LogisticRegression

使用方法与LinearRegression类似
如果需要使用高阶函数，则需要先手动生成特征的各阶值，形成高维数组，然后将高维数组送到fit函数中进行训练
可以通过参数 $C$ 来设置惩罚系数。 $C=\dfrac{1}{\lambda}$
如果标签类别多于2个，可以通过指定multi_class='multinomial’使得LogisticRegression能够处理多分类的情形

(3)使用sklearn.metrics

confusion_matrix用于生成【混淆矩阵】，矩阵中各个元素值恰好就是TP/FP/TN/FN的样本数量
sklearn.metrics中提供了precision_score, recall_score, f1_score等函数，可分别用于计算各类性能指标
classification_report：生成性能指标报告

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
项目实训纪录（纪录5）

2.技术与实现(1)操作流程对数据进行逻辑回归建模的过程一般包括：数据准备装载数据集，熟悉数据结构和含义必要的预处理操作：处理缺失/重复值、文本字段的数值化转换、标准化/归一化处理拆分训练集和测试集模型训练使用训练集训练模型，获取最优的权重参数。可以使用批量梯度下降算法、随机梯度下降算法来获得最优权重参数必要的情况下可以调整某些超参数（例如阈值KKK、惩罚系数λ\lambdaλ等），本例将引入L2惩罚系数作为超参数性能验证使用训练好的模型预测新的样本(包括测试样本)使
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。