自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

鱼奶奶的花园

北冥有鱼

  • 博客(4)
  • 收藏
  • 关注

原创 集成学习整理:Boosting & Bagging

一、集成学习将若干弱分类器组合生成一个强分类器;弱分类器:指分类准确率只稍好于随机猜测的分类器(错误率<50%);分为两大流派:bagging和boosting;核心:如何实现数据多样性,从而实现弱分类器的多样性;特点:(1)将多个分类方法聚集在一起,以提高分类的准确率(这些算法可以是不同的算法,也可以是相同的算法。);(2)集成学习法由训练数据构建一组基分类器,然后...

2019-04-01 16:25:11 544

原创 IV WOE & 评分卡 & 分箱

数据分箱:对连续变量离散化;实际上就是按照属性值划分的子区间,可以简单理解为分段处理(不同的是对特征进行分箱后,需要对分箱的每组进行woe编码进行分箱评估,才能放进模型训练);意义: 1.模型更稳定,特征离散化后,起到简化逻辑回归模型的作用,降低过拟合风险; 2.变量离散化后对异常数据有很强的鲁棒性; 3.将逻辑回归模型转换为评分卡形式的时候,分箱也是必须的...

2019-04-21 12:35:41 7222

原创 线性回归和对率回归

线性回归:根据样本学习从x到y的映射关系,如y=W^T·x+b,利用这个映射关系对未知数据进行预估,因为y是连续实值,故为回归问题; ·损失函数:最小二乘;平方损失函数·正则化:L1正则化: Lasso回归;产生稀疏权值矩阵(指很多元素为0,只有少数是非零值的矩阵,也就是得到的线性回归模型大部分系数为0);可用于特征选择,使模型在大量特征中只关注那些非...

2019-04-20 14:37:59 2406

原创 论文理解《Learning from Synthetic Data for Crowd Counting in the Wild》

CVPR2019 主页:https://gjy3035.github.io/GCC-CL/index.html才发现之前一直看的人群计数总结也是这位作者的:https://github.com/gjy3035/Awesome-Crowd-Counting#GWTA-CCNN ,很赞!解决问题:真实场景中存在多变的环境、更拥挤的人群,现存的方法不能很好解决问题;除此之外,因为数...

2019-04-01 10:43:22 3072

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除