特征工程
BYR_jiandong
这个作者很懒,什么都没留下…
展开
-
连续特征离散化达到更好的效果,特征选择的工程方法
http://www.zhihu.com/question/31989952连续特征的离散化:在什么情况下将连续的特征离散化之后可以获得更好的效果?Q:CTR预估,发现CTR预估一般都是用LR,而且特征都是离散的。为什么一定要用离散特征呢?这样做的好处在哪里?A: 在工业界,很少直接将连续值作为逻辑回归模型的特征输入,而是将连续特征离散化为一系列0、1特征交给逻辑回归模型,这样做的原创 2015-11-23 13:19:37 · 9659 阅读 · 4 评论 -
处理离散型特征和连续型特征共存的情况 归一化 论述了对离散特征进行one-hot编码的意义
处理离散型特征和连续型特征并存的情况,如何做归一化。参考博客进行了总结:https://www.quora.com/What-are-good-ways-to-handle-discrete-and-continuous-inputs-together总结如下:1、拿到获取的原始特征,必须对每一特征分别进行归一化,比如,特征A的取值范围是[-1000,1000],特征B的取值范围是原创 2015-10-27 14:45:09 · 14314 阅读 · 0 评论