数据挖掘
知天易or逆天难
为往圣继绝学
展开
-
SVM详细讲解
转自:https://blog.csdn.net/myarrow/article/details/512619711. 目标 SVM是一个二类分类器,它的目标是找到一个超平面,使用两类数据离超平面越远越好,从而对新的数据分类更准确,即使分类器更加健壮。 支持向量(Support Vetor):就是离分隔超平...转载 2018-04-15 20:02:51 · 72244 阅读 · 5 评论 -
使用sklearn进行数据预处理之Binarizer,LabelEncoder,LabelBinarizer,OneHotEncoder
前言数据预处理的过程中经常需要对数据进行数值化等处理,比如将性别男女转换为计算机可以理解的1和0,还有将数值化的1,2,3,4,5按照阈值3转换为0,0,0,1,1等,下面介绍一下sklearn提供的类。Binarizer这个就是根据阈值将数值型转变为二进制型,阈值可以进行设定,另外只能对数值型数据进行处理,且传入的参数必须为2D数组,也就是不能是Series这种类型,shape为...原创 2018-04-19 19:19:19 · 12906 阅读 · 3 评论 -
CTR预估模型1-FM
前言很久没更新过东西了,想记录一下学习过程,开一个CTR预估的系列,希望可以一直坚持更新吧~FM背景LR的缺点:线性模型无法学习特征间的交互信息特征组合对于实际的效果显著人为进行特征交叉由于用户行为的稀疏导致参数无法有效更新特征组合的有效性举个简单的例子,在预测一个用户是否会对剃须刀感兴趣时,性别男+剃须刀的组合特征相应权重可能更大,意味着二者共同出现时感兴趣的可能性...原创 2019-05-23 00:22:13 · 463 阅读 · 0 评论