![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python数据分析包
zhoukaixuan_zkx
这个作者很懒,什么都没留下…
展开
-
pandas数据聚合与分组运算
pandas提供了一个灵活高效的groupby功能,它能以一种自然的方式对数据集进行切片、切块、摘要等操作。 本章中将会看到Python和pandas强大的表达能力,可以执行复杂得多的分组运算(利用任何可以接受pandas对象或Numpy数组的函数),本章中将会学到: 根据一个或多个键(可以是函数、数组或DataFrame列名)拆分pandas对象 计算分组摘要统计,如计数、平均...原创 2019-07-14 18:41:52 · 1236 阅读 · 1 评论 -
Pandas 数据规整化——利用函数或映射进行数据转换
apply()是一种让函数作用于列或者行的操作 applymap()是一种让函数作用域DataFrame每一个元素的操作 map是一种让函数作用于Series每一个元素的操作 假设你想要添加一列表示该肉类食物来源的动物类型。我们先编写一个不同肉类到动物的映射: Series的map方法可以接受一个函数或含有映射关系的字典型对象,但是这里有一个小问题,即有些肉类的首字母大写了,而另一些...原创 2019-07-11 20:46:55 · 707 阅读 · 0 评论 -
pandas入门
pandas含有使数据清洗和分析工作变得更快更简单的数据结构和操作工具。 pandas数据类型结构 Series和DataFrame是pandas两个主要的数据结构。 Series Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。 仅由一组数据即可产生最简单的Series: import pandas as pd...原创 2019-06-26 22:02:08 · 284 阅读 · 0 评论 -
利用Python进行数据分析之Numpy
Numpy(Numercial(数字的)Python的简称)是高性能计算和数据分析的基础包。 ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组。 用于对整组数据进行快速运算的标准数学函数(无需编写循环)。 用于读写磁盘数据的工具以及用汉语操作内存映射文件的工具。 线性代数、随机数生成以及傅里叶变换功能。 用于集成由C、C++、Fortran等语言编...原创 2019-06-23 20:52:24 · 579 阅读 · 0 评论 -
pandas常用命令汇总
目录 01_Getting_&_Knowing_Your_Data 02_Filtering_&_Sorting 03_Groupby 04_Apply 01_Getting_&_Knowing_Your_Data 1、读取csv文件 pd.read_csv(file_path,step='\t') 2、数据集行列信息 df.shape # 行数、列数...原创 2019-07-16 21:28:35 · 2292 阅读 · 0 评论 -
pandas 图表绘制工具Matplotlib
想要图表在jupyter里面显示,需要设置 用到的包: import matplotlib.pyplot as plt # set this so the %matplotlib inline #魔术贴 图表基本元素 1、设置图表大小:figsize plt.figure(figsize=(10,10)) 2、图表标题:title plt.title('xxx') 3...原创 2019-08-11 16:22:20 · 422 阅读 · 0 评论