![](https://img-blog.csdnimg.cn/20190927151117521.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
Python数据科学手册
《Python数据科学手册》笔记
Mercy92
这个作者很懒,什么都没留下…
展开
-
【Matplotlib】全章节(更新中)
一、Matplotlib常用技巧1.导包import matplotlib as mplimport matplotlib.pyplot as plt2.设置绘图样式plt.style.use('classic')plt.style.use('seaborn-whitegrid')3.显示图形1).在脚本中脚本中添加plt.show()语句会打开一个窗口一次性显示图形2).在IPython shell中画图在IPython (命令行输入ipython)启动 Matplotlib 模原创 2020-09-21 17:16:27 · 320 阅读 · 0 评论 -
Pandas快速画图
一、基本介绍matplotlib是python绘图中应用最广泛的组件,还有seaborn有更好用的性能,本文主要介绍pandas的plot()方法快速画图,该方法相当于matplotlib的shortcut。更详细的用法或参数需要查看matplotlib文档pandas的plot()官方参考文档:pandas.Series.plot或者pandas.DataFrame.plotDataFrame.plot(x=None, y=None, kind='line', ax=None, subplots=F原创 2020-08-26 18:00:20 · 782 阅读 · 0 评论 -
【Python数据科学手册】Numpy(全章节)
文章目录一、理解Python中的数据类型1.Python整型2.Python列表3.Python中的固定类型数组4.从Python列表创建数组np.array(list)1).从列表创建数组2).数组必须包含同一类型的数据,否则类型向上转换3).用dtype关键字明确设置数据类型4).多维数组5.从头创建数组6.Numpy标准数组类型一、理解Python中的数据类型Python是动态语言,相...原创 2020-07-17 16:31:44 · 585 阅读 · 0 评论 -
【Pandas】实操手册
1.导包import pandas as pd2.从csv导入数据pd.read_csvdf=pd.read_csv('file.csv',encoding='utf')3.由现有的两列拼接成一个新的字段A.str.cat(B)brand_supplier=df['brand_name'].str.cat(df['supplier_name'])4.在指定位置插入列|行df.insert(loc, column, value, allow_duplicates=False)df.i原创 2020-07-10 16:51:59 · 2630 阅读 · 0 评论 -
【Python数据科学手册】Pandas——目录
目录一、安装并使用Pandas二、Pandas对象简介三、数据取值于选择四、Pandas数值运算方法五、处理缺失值六、层级索引七、合并数据集:Concat与Append操作八、合并数据集:合并与连接九、累计与分组十、数据透视表十一、向量化字符串操作十二、处理时间序列十三、高性能Pandas:eval()与query()十四、参考资料一、安装并使用Pandas安装时使...原创 2020-04-02 22:13:31 · 522 阅读 · 0 评论 -
【Python数据科学手册】Pandas——二、Pandas对象简介
一、安装并使用Pandas安装时使用了 Anaconda,那么 Pandas 就已经安装好了。查看版本号import pandaspandas.__version__使用别名 import pandas as pd内置文档提醒#通过按下 Tab 键显示 pandas 命名空间的所有内容pd.<TAB>#显示 Pandas 的内置文档pd?#详细文...原创 2020-04-02 22:11:44 · 643 阅读 · 0 评论 -
【Python数据科学手册】Pandas——三、数据取值与选择
文章目录三、数值取值与选择1.Series数据选择方法1). 将Series看作字典2). 将Series看作一维数组3). 索引器: loc、 iloc和ix2.DataFrame数据选择方法三、数值取值与选择1.Series数据选择方法Series 对象与一维 NumPy 数组和标准 Python 字典在许多方面都一样。1). 将Series看作字典和字典一样, Series 对象提...原创 2020-04-07 20:37:56 · 1641 阅读 · 0 评论 -
【Python数据科学手册】Pandas——四、Pandas数值运算方法
文章目录四、Pandas数值运算方法1.通用函数: 保留索引2.通用函数: 索引对齐1). Series索引对齐2). DataFrame索引对齐四、Pandas数值运算方法1.通用函数: 保留索引因为 Pandas 是建立在 NumPy 基础之上的,所以 NumPy 的通用函数同样适用于 Pandas 的Series 和 DataFrame 对象。使用 NumPy 通用函数,生成的结...原创 2020-04-09 23:12:42 · 1912 阅读 · 0 评论 -
【Python数据科学手册】Pandas——五、处理缺失值
五、处理缺失值涉及的缺失值主要有三种形式: null、 NaN 或 NA。1.选择处理缺失值的方法数据表或 DataFrame 中有很多识别缺失值的方法。一般情况下可以分为两种:一种方法是通过一个覆盖全局的掩码表示缺失值,另一种方法是用一个标签值(sentinel value)表示缺失值。2.Pandas的缺失值Pandas 最终选择用标签方法表示缺失值,包括两种 Python 原有的缺...原创 2020-04-13 22:38:40 · 512 阅读 · 0 评论 -
【Python数据科学手册】Pandas——六、层级索引
文章目录六、层级索引1.多级索引Series1)笨方法,将两个维度合并成一个元组索引2).好办法:Pandas多级索引MultiIndex3).维度与索引2.多级索引的创建方法1).隐式地创建多层索引2)隐式地创建索引3.多级索引的取值与切换1).Series多级索引2).DataFrame多级索引4.多级索引行列转换1).有序的索引和无序的索引2).索引stack与unstack3).索引的设置与重置 reset_index5.多级索引的数据累计方法六、层级索引对于高维的数据,可以通过将其纬度转换成不原创 2020-08-25 14:36:16 · 651 阅读 · 0 评论 -
【Python数据科学手册】Pandas——七、合并数据集:Concat和Append操作
七、合并数据集:Concat和Append操作写一个构造Dataframe的函数1.知识回顾: NumPy数组的合并np.concatenate 函数,axis 参数可以设置合并的坐标轴方向2.通过pd.concat实现简易合并Pandas 有一个 pd.concat() 函数与 np.concatenate 语法类似,但是配置参数更多,功能也更强大pd.concat(objs, ...原创 2020-04-16 22:52:43 · 892 阅读 · 0 评论 -
【Python数据科学手册】Pandas——八、合并数据集: 合并(merge)与连接(join)
八、合并数据集: 合并与连接1.关系代数关系代数是处理关系型数据的通用理论,绝大部分数据库的可用操作都以此为理论基础。关系代数方法论的强大之处在于,它提出的若干简单操作规则经过组合就可以为任意数据集构建十分复杂的操作。2.数据连接的类型pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_...原创 2020-04-22 21:53:15 · 1373 阅读 · 0 评论 -
【Python数据科学手册】Pandas——九、累计与分组groupby
九、累计与分组1.获取数据本节用一份Seaborn 程序库行星数据来进行演示2.Pandas的简单累计功能df.sum(axis=None, skipna=None, level=None, numeric_only=None, min_count=0, **kwargs)describe() 方法可以计算每一列的若干常用统计值Pandas的累计方法指标描述c...原创 2020-04-26 23:35:56 · 1188 阅读 · 0 评论 -
【Python数据科学手册】Pandas——十、数据透视表 df. pivot_table
文章目录十、数据透视表1.获取数据2.手工制作数据透视表3.数据透视表语法4.案例:美国人的生日十、数据透视表数据透视表将每一列数据作为输入,输出将数据不断细分成多个维度累计信息的二维数据表。1.获取数据本节用一份Seaborn 程序库采用泰坦尼克号的乘客信息数据库来演示(titanic)2.手工制作数据透视表使用groupby可以实现数据透视的效果,但是比较繁琐3.数据透视表语...原创 2020-05-11 22:22:50 · 3696 阅读 · 0 评论 -
【Python数据科学手册】Pandas——十一、向量化字符串操作str
十一、向量化字符串操作1.Pandas字符串操作简介Pandas 为包含字符串的 Series 和 Index 对象提供 str 属性,既可以高效满足向量化字符串操作的需求,又可以正确地处理缺失值。2.Pandas字符串方法列表1)与Pandas字符串方法相似几乎所有 Python 内置的字符串方法都被复制到 Pandas 的向量化字符串方法中。( Python 内置的字符串方法参考https://blog.csdn.net/weixin_40844116/article/details/83原创 2020-06-22 23:24:55 · 711 阅读 · 0 评论 -
【Python数据科学手册】Pandas——十二、处理时间序列
十二、处理时间序列1.Python的日期与时间工具1)Python原生的日期使劲按工具:datetime和dateutildatetime(year, month, day[, hour[, minute[, second[, microsecond[,tzinfo]]]]])2)时间类型数组:Numpy的datetime64类型性能相对原生工具好NumPy 会自动判断输入时间需要使用的时间单位,也可使设置格式。代码含义时间跨度 (相对)时间跨度 (绝对)Y年(原创 2020-06-22 23:25:54 · 710 阅读 · 1 评论 -
【Python数据科学手册】Pandas——十三、高性能的Pandas:eval()和query()
十三、高性能的Pandas:eval()和query()一、设计动机:复合代数式NumPy 与 Pandas 的快速向量化运算,比普通的Python循环或综合列表要快。np.fromiter:从可迭代对象创建一个一维数组但是这种运算在处理复合代数式时效率较低,每段中间过程需要显示地分配内存。Numexpr 程序库可以在不为中间过程分配全部内存的前提下,完成元素到元素的复合代数式运算。这样适合处理大型数组,Pandas 的 eval() 和 query()工具其实也是基于 Numexpr原创 2020-07-09 15:05:22 · 495 阅读 · 0 评论