![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
jacobwe
请我去我去
展开
-
特征工程
目前业界有句话被广为流传: “数据和特征决定了机器学习的上限,而模型与算法则是逼近这个上限而已。” 因此,特征工程做得好,我们得到的预期结果也就好。 那特征工程到底是什么呢?在此之前,我们得了解特征的类型:文本特征、图像特征、数值特征和类别特征等。我们知道计算机并不能直接处理非数值型数据,那么在我们要将数据灌入机器学习算法之前,就必须将数据处理成算法能理解的格式,有时甚至需要对数据进行一些组合处理如分桶、缺失值处理和异常值处理等。 这也就是特征工程做的事:提取和归纳特征,让算法最大程度地利用数据,从而得到更原创 2020-12-03 21:21:43 · 126 阅读 · 0 评论 -
多路召回1130
推荐多路召回是对各个模型出的结果进行混合排序的过程,以达到推荐结果曝光最大,一般会有基于用户兴趣,热点,内容的原创 2020-11-30 20:34:02 · 95 阅读 · 0 评论 -
数据分析-补
补原创 2020-11-27 22:22:34 · 70 阅读 · 0 评论 -
EDA
一,缺失数据概要 1 .缺失原因 分为无意的,有意的,不存在。 2.缺失类型 ,缺失分为完全随机缺失,随机缺失,完全非随机缺失 3.缺失处理方法 删除法,数据补充(替换补充,拟合补充),虚拟变量,不处理 二,缺失数据的类型 1,缺失分为完全随机缺失,随机缺失,完全非随机缺失 2 完全缺失- MCAR(missing completely ...原创 2020-03-23 22:44:32 · 984 阅读 · 0 评论