大数据&云计算
onesilver
大道至简,知易行难
展开
-
机器学习之数据预处理(数据诊断)
数据诊断作为数据分析和建模流程里面的第一环,也是最基本的一环,通过数据诊断可以认识数据整体特征的情况,从而可以对数据更好的分析和建模,做一些特征工程和数据预处理。数据诊断的目的:了解特征的分布,缺失和异常统计指标可直接用于数据预处理方便更好的对数据分析和建模数据诊断统计指标介绍:均值(mean)/中位数(median)/最大值/最小值计数类缺失值/方差分位点/值的频原创 2018-01-23 19:29:09 · 2049 阅读 · 0 评论 -
机器学习发展历史及常见算法
机器学习从历史数据找出规律数据代替expert业务系统的发展历史基于专家经验基于统计-分维度统计机器学习-在线学习机器学习模式离线机器学习-通过定时任务来训练算法,具有缺点,不具有实时性。在线学习-实时学习机器学习的典型应用关联规则-啤酒和纸尿裤-购物篮分析-捆绑销售-货物摆放位置的挑战-数据挖掘聚类-用户细分精准营销朴素贝叶斯-垃圾邮件识别原创 2018-01-17 23:18:45 · 1159 阅读 · 0 评论