![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析与挖掘
Asher117
大家好,我是Asher,热衷于研究数据分析、数据挖掘以及网络爬虫等。大家有问题的话,欢迎加我微信,一起学习-分享-成长,MyWechat:liu2536036458
展开
-
【Python】绘制PR曲线
数据挖掘模型训练好了之后,对于二分类问题,可以预测每个测试样本属于某个类别的概率,当我们设置不同阈值时,将得到不同的P值(Precision,查准率)和R值(Recall,查全率)基于此,可以绘制PR曲线,python绘制PR曲线比较方便。首先,可以使用precision_recall_curve函数得到#选择测试数据import pandas as pddf = pd.read_csv('file_name.csv')X = df[df.columns[:-1]]y = df[df.co原创 2021-01-12 15:50:12 · 7797 阅读 · 4 评论 -
【数据分析与挖掘实战】数据预处理篇
数据预处理1.数据清洗1.1缺失值处理1.2异常值处理2.数据集成2.1实体识别2.2冗余属性识别3.数据变换3.1简单函数变换3.2规范化3.3连续属性离散化3.4属性构造3.5小波变换4.数据规约4.1属性规约4.2数值规约1.数据清洗数据预处理一方面是要提高数据质量,另一方面可以让数据更好的适应特定的挖掘技术。统计发现,数据建模过程中,数据预处理工作占了整个工作的60%。数据预处理的过...原创 2019-10-26 15:01:55 · 908 阅读 · 0 评论 -
【数据分析与挖掘实战】数据探索篇
目录1.数据质量分析1.1缺失值分析1.2异常值分析1.3一致性分析2.数据特征分析2.1分布分析2.2对比分析2.3统计量分析2.4周期性分析2.5贡献度分析2.6相关性分析3.数据探索主要工具1.数据质量分析在做数据分析和挖掘时,在获取数据后,一般第一步就是对数据进行探索性的分析,通过计算一些统计量或者绘制图表等方法来看数据特征。数据探索有利于后期的数据建模,本文从数据质量和数据特征两部...原创 2019-10-25 17:34:02 · 1027 阅读 · 0 评论