![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Pandas
lpy2017
这个作者很懒,什么都没留下…
展开
-
Task03 统计相关-次序统计
统计相关次序统计计算最小值numpy.amin(a[, axis=None, out=None, keepdims=np._NoValue, initial=np._NoValue, where=np._NoValue])Return the minimum of an array or minimum along an axis.【例】计算最小值import numpy as npx = np.array([[11, 12, 13, 14, 15],[16, 17, 18, 19, 20],原创 2020-11-28 20:27:28 · 101 阅读 · 0 评论 -
Pandas第六章缺失值打卡
五、问题与练习¶问题【问题一】 如何删除缺失值占比超过25%的列?【问题二】 什么是Nullable类型?请谈谈为什么要引入这个设计?【问题三】 对于一份有缺失值的数据,可以采取哪些策略或方法深化对它的了解?练习【练习一】现有一份虚拟数据集,列类型分别为string/浮点/整型,请解决如下问题:(a)请以列类型读入数据,并选出C为缺失值的行。(b)现需要将A中的部分单元转为缺失值,单元格中的最小转换概率为25%,且概率大小与所在行B列单元的值成正比。In [105]:pd.read_c原创 2020-06-23 23:19:13 · 366 阅读 · 0 评论 -
概率论与数理统计第一次打卡
一、随机事件1.基本概念释义现实生活中,一个动作或一件事情,在一定条件下,所得的结果不能预先完全确定,而只能确定是多种可能结果中的一种,称这种现象为随机现象。 例如,抛掷一枚硬币,其结果有可能是出现正面,也有可能是出现反面;掷骰子游戏中,出现的数字可能是1,2,3,4,5,6其中的任意一个。以上这些现象都是随机现象。使随机现象得以实现和对它观察的全过程称为随机试验,记为**EEE**。随机实验满足以下三个条件:可以在相同条件下重复进行;结果有多种可能性,并且所有可能结果事先已知;作一次试验究原创 2020-06-22 21:07:52 · 286 阅读 · 0 评论 -
Pandas Task6——综合练习
第六次-大作业一、2002 年-2018 年上海机动车拍照拍卖df_car = pd.read_csv(‘数据集/2002年-2018年上海机动车拍照拍卖.csv’)##1df = df_car.copy()df[‘percent’] = df.apply(lambda x:x[‘Total number of license issued’]/x[‘Total number of ap...原创 2020-05-01 22:53:54 · 260 阅读 · 0 评论 -
2020.04.30 Pandas合并
1.5.2 2. 练习1.5.2.1 【练习一】有2张公司的员工信息表,每个公司共有16名员工,共有五个公司,请解决如下问题:pd.read_csv(‘data/Employee1.csv’).head()Company Name Age Height Weight Salary0 A a1 47 188 63.7 258191 A a3 39 172 55.9 219832 A ...原创 2020-04-30 22:36:43 · 289 阅读 · 0 评论 -
2020.04.28 Pandas变形
1.4 四、问题与练习1.4.1 1. 问题1.4.1.1 【问题一】 上面提到了许多变形函数,如melt/crosstab/pivot/pivot_table/stack/unstack函数,请总结它们各自的使用特点。1.4.1.2 【问题二】 变形函数和多级索引是什么关系?哪些变形函数会使得索引维数变化?具体如何变化?1.4.1.3 【问题三】 请举出一个除了上文提过的关于哑...原创 2020-04-28 23:47:51 · 217 阅读 · 0 评论 -
2020.04.26 第3章 分组
1.5.2 2. 练习1.5.2.1 【练习一】: 现有一份关于diamonds的数据集,列分别记录了克拉数、颜色、开采深度、价格,请解决下列问题:pd.read_csv(‘data/Diamonds.csv’).head()carat color depth price0 0.23 E 61.5 3261 0.21 E 59.8 3262 0.23 E 56.9 3273 0....原创 2020-04-26 23:01:28 · 202 阅读 · 0 评论 -
Pandas——1 第2章 索引
1.7.2 2. 练习1.7.2.1 【练习一】 现有一份关于UFO的数据集,请解决下列问题:pd.read_csv(‘data/UFO.csv’).head()datetime shape duration (seconds) latitude longitude0 10/10/1949 20:30 cylinder 2700.0 29.883056 -97.9411111 10/...原创 2020-04-23 23:15:43 · 322 阅读 · 1 评论 -
1 第1章 Pandas基础
1.5.2 2. 练习1.5.2.1 【练习一】 现有一份关于美剧《权力的游戏》剧本的数据集,请解决以下问题:1.5.2.2 (a)在所有的数据中,一共出现了多少人物?df = pd.read_csv(‘data/Game_of_Thrones_Script.csv’)df.head()df[‘Name’].nunique()1.5.2.3 (b)以单元格计数(即简单把一个单元...原创 2020-04-20 11:51:43 · 533 阅读 · 0 评论