Python数据分析与挖掘实战
10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。
K5niper
这个作者很懒,什么都没留下…
展开
-
读书笔记 - Python数据分析与挖掘实战 - 4 数据预处理
第4章 数据预处理 数据预处理主要包括数据洁洗、数据集成、数据变换和数据规约等操作,数据预处理通常占整个数据挖掘过程的60%。 %matplotlib inline import matplotlib.pyplot as plt import numpy as np import pandas as pd from sklearn.cluster import KMeans from sci...原创 2019-06-09 12:50:15 · 488 阅读 · 0 评论 -
读书笔记 - Python数据分析与挖掘实战 - 3 数据探索
第3章 数据探索 3.1 数据质量分析 数据质量分析是数据预处理的前提,也是数据挖掘分析结论有效性和准确性的基础。其主要任务是检查原始数据中是否存在脏数据: (1)缺失值 (2)异常值(outliers) (3)不一致的值 (4)重复数据及含有特殊符号的数据 3.1.1 缺失值分析 3.1.2 异常值分析 异常值是指样本中数值明显偏离其余观测值的个别值,也称为离群点。 (1)简单统计量分析 先对变...原创 2019-05-19 02:17:55 · 1048 阅读 · 0 评论