笔记
是huahua呀
这个作者很懒,什么都没留下…
展开
-
matplotlib-第二回:艺术画笔见乾坤
原创 2020-12-18 22:26:31 · 118 阅读 · 0 评论 -
贷款违约预测---Task1
分类算法常见的评估指标一、混淆矩阵混淆矩阵多用于判断分类器(Classifier)的优劣,适用于分类型的数据模型,如分类树(Classification Tree)、逻辑回归(Logistic Regression)、线性判别分析(Linear Discriminant Analysis)等方法。(1)若一个实例是正类,并且被预测为正类,即为真正类TP(True Positive )(2)若一个实例是正类,但是被预测为负类,即为假负类FN(False Negative )(3)若原创 2020-09-15 23:00:48 · 212 阅读 · 0 评论 -
DataWhale-动手数据分析-Task05:模型建立与评估
模型评估方法一、交叉验证K-折交叉验证(K-fold Cross Validation,记为K-CV),将原始数据分成K组(一般是均分),将每个子集数据分别做一次验证集,其余的K-1组子集数据作为训练集,这样会得到K个模型,用这K个模型最终的验证集的分类准确率的平均数作为此K-CV下分类器的性能指标。K一般大于等于2,实际操作时一般从3开始取,只有在原始数据集合数据量小的时候才会尝试取2。应用最多,K-CV可以有效的避免过拟合与欠拟合的发生,最后得到的结果也比较具有说服性。from sklear原创 2020-08-27 21:40:00 · 206 阅读 · 0 评论 -
DataWhale-动手数据分析-Task04:数据可视化
**复习:**回顾学习完第一章,我们对泰坦尼克号数据有了基本的了解,也学到了一些基本的统计方法,第二章中我们学习了数据的清理和重构,使得数据更加的易于理解;今天我们要学习的是第二章第三节:数据可视化,主要给大家介绍一下Python数据可视化库Matplotlib,在本章学习中,你也许会觉得数据很有趣。在打比赛的过程中,数据可视化可以让我们更好的看到每一个关键步骤的结果如何,可以用来优化方案,是一个很有用的技巧。第二章:数据可视化%matplotlib inlineimport numpy as np原创 2020-08-25 21:45:34 · 271 阅读 · 0 评论 -
DataWhale-动手数据分析-Task02:数据清洗及特征处理
#加载所需的库import pandas as pdimport numpy as np#加载数据train.csvtrain = pd.read_csv('train.csv')2 第二章:数据清洗及特征处理我们拿到的数据通常是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等,需要经过一定的处理才能继续做后面的分析或建模,所以拿到数据的第一步是进行数据清洗,本章我们将学习缺失值、重复值、字符串和数据转换等操作,将数据清洗成可以分析或建模的亚子。2.1 缺失值观察与处理我们拿到原创 2020-08-23 22:39:33 · 259 阅读 · 0 评论 -
资金流入流出预测01.数据探索与分析
1 、每日总购买量与赎回量的时序图可以发现,2014年4月之后较其之前的时间时序图比较平稳,没有较大的波动。2、4月份以后的时间序列图每个月大约有4个波峰申购总量与赎回总量每个月都会有4个波峰,而且两者有一定的协同性月末赎回量大于购买量以下图表时间范围位于201404-2014083、周一至周末申购总量与赎回总量中位数4、赎回总量、购买总量与周一至周末的相关性相关系数较小,不存在线性相关关系验证独立性购买总量、赎回总量与周一至周末有1%的可能性不原创 2020-08-20 22:39:00 · 269 阅读 · 0 评论 -
task2-pandas__索引
【练习一】 现有一份关于UFO的数据集,请解决下列问题:pd.read_csv('data/UFO.csv').head()(a)在所有被观测时间超过60s的时间中,哪个形状最多?import pandas as pddf = pd.read_csv('data/UFO.csv')df.rename(columns={'duration (seconds)':'duration'},...2020-04-23 22:49:08 · 451 阅读 · 0 评论 -
Day1---pandas基础
问题与练习1. 问题【问题一】 Series和DataFrame有哪些常见属性和方法?对于一个Series,其中最常用的属性为:值(values),索引(index),名字(name),类型(dtype)【问题二】 value_counts会统计缺失值吗?不会统计缺失值【问题三】 与idxmax和nlargest功能相反的是哪两组函数?idxmin和nsmallest【问题四】 ...原创 2020-04-20 22:14:33 · 288 阅读 · 0 评论