数据处理
Sinpoint
统计分析者一枚
展开
-
Python玩转数据分析——数据处理之数据清洗(处理重复数据)
数据分析总流程明确调查目的明确分析思路数据准备数据处理数据分析数据可视化生成报告数据处理流程数据清洗数据加工数据抽样数据清洗流程处理重复数据处理缺失值处理逻辑错误处理重复数据准备数据假设现在有一个货物表,为方便处理,只显示其编码,数据如下:编号A667708A310882A356317A520304A776477A466074...原创 2019-09-15 17:47:54 · 1861 阅读 · 0 评论 -
Python玩转数据分析——数据处理之数据清洗(处理缺失值)
数据分析总流程明确调查目的明确分析思路数据准备数据处理数据分析数据可视化生成报告数据处理流程数据清洗数据加工数据抽样数据清洗流程处理重复数据处理缺失值处理逻辑错误处理缺失值方法方法一:用一个样本统计量的值代替缺失值,通常用样本平均值和中位数。方法二:用一个统计模型计算的值代替缺失值,通常用回归模型、判别模型等。方法三:将有缺失值的记录删除。这里仅展示方法一的Python实...原创 2019-09-16 11:14:02 · 970 阅读 · 0 评论