Logistic Regression(LR)杂记

最新推荐文章于 2024-07-08 18:23:29 发布

xmpp10

最新推荐文章于 2024-07-08 18:23:29 发布

阅读量263

点赞数

分类专栏：机器学习文章标签：逻辑回归经验

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

Logistic Regression(LR)应用经验

1. LR < SVM/GBDT/RandomForest ?

LR能以概率的形式输出结果，而非只是0,1判定
LR的可解释性强，可控度高(你要给老板讲的嘛…)
训练快，feature engineering之后效果赞
添加feature太简单…

2.关于样本处理

样本量太大怎么办？

离散化后用one-hot编码处理成0,1值
如果要用连续值，注意做scaling
试试spark Mllib
试试采样(注意采样方式：日期 or 用户 or 行为)

注意样本的平衡

对样本分布敏感

下采样(样本量足的情况下)，上采样(样本数量不太足)
修改loss function，给不同权重
采样后的predict结果，用作排序OK，用作判定请还原

3.关于特征处理

离散化

映射到高维空间，用linear的LR(快，且兼具更好的分割性)
稀疏化，0,1向量内积乘法运算速度快，计算结果方便存储，容易扩展；
离散化后，给线性模型带来一定的非线性
模型稳定，收敛度高，鲁棒性好在一定程度上降低了过拟合风险

通过组合特征引入个性化因素

注意特征的频度

区分特征重要度
可以产出层次判定模型

聚类/Hash

增强了极度稀疏的特征表达力
减小了模型，加速运算

4.关于算法调优

假设只看模型

选择合适的正则化(L1, L2, L1+L2)
正则化系数C
收敛的阈值e，迭代轮数
调整loss function给定不同权重
Bagging或其他方式的模型融合
最优化算法选择(‘newton-cg’, ‘lbfgs’, ‘liblinear’, ‘sag’)
小样本liblinear，大样本sag，多分类‘newton-cg’和‘lbfgs’(当然你也可以用liblinear和sag的one-vs-rest)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Logistic Regression(LR)杂记

Logistic Regression(LR)杂记应用经验1. LR < SVM/GBDT/RandomForest ? LR能以概率的形式输出结果，而非只是0,1判定 LR的可解释性强，可控度高(你要给老板讲的嘛…) 训练快，feature engineering之后效果赞
复制链接

扫一扫

专栏目录

xmpp10 CSDN认证博客专家 CSDN认证企业博客

码龄12年

17: 原创

25万+: 周排名

82万+: 总排名

8万+: 访问

: 等级

994: 积分

24: 粉丝

36: 获赞

4: 评论

153: 收藏

私信

关注

热门文章

分类专栏

python 6篇
机器学习 9篇
深度学习 2篇
C++ 8篇
剑指offer 7篇
tensorflow 2篇
数学相关 2篇
数据结构 3篇

最新评论

Python图像逐像素点取邻域数据
AAAmazing: im1 = im1['im1']这一步是什么意思，还望解答，感谢
Python图像逐像素点取邻域数据
HaleyLiu: 博主您好，请问可以对分类后的影像（tif格式）用这个方法，获得3×3邻域内的土地类型吗
Matplotlib绘制树形图
阳仔要健康: def plotNode这个函数 createPlot.ax1.annotate（）这里报错是什么情况？？？
Tensorflow系列二：入门
hanchengzhi123: 关于 tf.get_variable()函数定义变量的问题，文中所用方式跑出来有bug“ v = tf.get_variable("v",initializer=tf.zeros_initializer(shape=[1])) TypeError: __init__() got an unexpected keyword argument 'shape' ” 是不是应该改为“v = tf.get_variable("v", shape=[1],initializer=tf.zeros_initializer()) ”

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。