![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据清洗规整
何国庆
这个作者很懒,什么都没留下…
展开
-
解决数据共线性的问题
#python数据分析与数据化运营 宋天龙 著import numpy as npfrom sklearn.linear_model import Ridgefrom sklearn.decomposition import PCAfrom sklearn.linear_model import LinearRegression# 读取数据data = np.loadtxt('da...转载 2019-03-28 20:35:15 · 1081 阅读 · 0 评论 -
数据标准化处理
python数据分析与数据化运营 宋天龙 著 数据标准化是一个常用的数据预处理操作,目的是处理不同规模和量纲的数据,使其缩放到相同的数据区间和范围,以减少规模、特征、分布差异等对模型的影响。除了用作模型计算,标准化后的数据还具有了直接计算并生成复合指标的意义,是加权指标的必要步骤。 Z-Score标准化是基于原始数据的均值和标准差进行的标准化,假...转载 2019-03-28 21:11:36 · 5514 阅读 · 4 评论 -
利用one-class SVM进行异常值检测
python数据分析与数据化运营 宋天龙sklearn中提供了one-class SVM和EllipticEnvelope两种方法用于异常检测,前者基于libsvm实现的非监督式异常检测方法,可用于做高维度分布的评估;后者只能做基于高斯分布数据集的异常检测。本节示例模拟的是针对一批没有任何标签的原始数据做异常检测模型训练,然后通过新的测试集来发现新数据集中的异常数据。...转载 2019-04-09 20:28:49 · 6433 阅读 · 1 评论