机器学习
文章平均质量分 63
机器学习
bearx...
攻城狮
展开
-
数据缺失值处理一(sklearn)
在数据采集准备阶段,往往由于人为或数据本身的因素导致最终的数据集含有缺失值,此时我们就面临一个问题,缺失数据如何去处理?其实无非就两种选择,一是删除缺失值所在的样本数据或列列数据;二是填充缺失数据的样本,使其数据保持完整。删除方案:首先要明确,对于数据量小的数据集,删除操作无疑不是最优的,因为数据量本身就不大。至于是删除行数据还是列数据,一般会选择删除样本数据(行),因为特征属性是提前决定好的。但如果特征的缺失值过于严重,那么就应该考虑删除该特征数据了。填充方案:对于缺失..原创 2021-01-04 21:53:35 · 1063 阅读 · 2 评论 -
数据特征处理之数值型数据(归一化)
什么是特征处理?通过特定的统计方法(数学方法)将待处理数据转换为算法要求的数据的这个过程称为特征处理。数值型数据归一化方案:归一化的特点对原始数据进行归一化处理后使其映射到指定范围内(通常默认是[0,1]之间)降低数据附带的量纲影响,使不同的特征具有相同的尺度(Scale),进而具有可比性(公平性)【注】 归一化也被称为最大最小标准化(min-max Normalization)、调节比例(Rescaling)我们常用的归一化...原创 2020-12-21 22:46:14 · 2303 阅读 · 0 评论 -
统计学和机器学习到底有什么区别?
该文章原文出自微信公众号:大数据文摘,原文链接https://mp.weixin.qq.com/s/xCJBowXS89UlHA07R8WNuw大数据文摘出品来源:medium编译:周家乐、狗小白、蒋宝尚统计学和机器学习之间的界定一直很模糊。无论是业界还是学界一直认为机器学习只是统计学批了一层光鲜的外衣。而机器学习支撑的人工智能也被称为“统计学的外延”例如,...转载 2019-05-12 14:58:55 · 6145 阅读 · 0 评论