Pandas
Pandas
TreasureAI
New World beyond the Wall
展开
-
[Python3] Pandas v1.0 —— (九) 高性能Pandas: eval()与query()
文章目录十二、高性能Pandas:eval()与query()(一)query()与eval()的设计动机:复合代数式(二)用pandas.eval()实现高性能运算pd.eval()支持的运算(1) 算术运算符(2) 比较运算符(3) 位运算符(4) 对象属性与索引(5) 其他运算(三)用DataFrame.eval()实现列间运算1. 用DataFrame.eval()新增列2. DataFrame.eval()使用局部变量(四)DataFrame.query()方法(五)性能决定使用时机[ Pan原创 2020-05-18 20:56:46 · 1086 阅读 · 1 评论 -
[Python3] Pandas v1.0 —— (八) 处理时间序列
文章目录十一、处理时间序列(一)Python的日期与时间工具(二)Pandas时间序列:用时间作索引(三)Pandas时间序列数据结构(四)时间频率与偏移量十一、处理时间序列本文涉及的日期与时间数据主要包含三类:时间戳:表示某个具体的时间点时间间隔与周期:表示开始时间点与结束时间点之间的时间长度,周期通常指一种特殊形式的时间间隔,每个间隔长度相同,彼此之间不会重叠时间增量(time delta)或持续时间(duration):表示精确的时间长度(一)Python的日期与时间工具在Pyth原创 2020-05-09 19:14:43 · 1071 阅读 · 0 评论 -
[Python3] Pandas v1.0 —— (七) 向量化字符串操作
文章目录十、向量化字符串操作Pandas字符串方法列表1. 与Python字符串方法相似的方法2. 使用正则表达式的方法3. 其他字符串方法十、向量化字符串操作Pandas提供一系列向量化字符串操作(vectorized string operation)是在处理(清洗)现实工作中的数据时不可或缺的功能。Pandas字符串方法列表1. 与Python字符串方法相似的方法返回字符串Series[Series or Index of object]:方法参数描述lower()原创 2020-05-08 19:42:13 · 1277 阅读 · 0 评论 -
[Python3] Pandas v1.0 —— (六) 数据透视表
文章目录九、数据透视表(一)GroupBy 实现数据透视表(二)数据透视表语法 pivot_table1. 多级数据透视表2. pivot_table 主要参数解读九、数据透视表数据透视表(pivot table)将每一列数据作为输入,输出将数据不断细分成多个维度累计信息的二维数据表(多维GroupBy累计操作,行列同时分组)(一)GroupBy 实现数据透视表import numpy ...原创 2020-04-25 17:55:37 · 783 阅读 · 0 评论 -
[Python3] Pandas v1.0 —— (五) 累计与分组
文章目录八、累计与分组(一)Pandas的简单累计功能Pandas的累计方法(二)GroupBy:分割、应用和组合1. 分割、应用和组合2. GroupBy 对象3. 累计、过滤、转换和应用4. 设置分割的键八、累计与分组在对较大的数据进行分析时,一项基本的工作就是有效的数据累计(summarization):计算累计(aggregation)指标,如sum(), mean(), media...原创 2020-04-25 16:27:54 · 1127 阅读 · 1 评论 -
[Python3] Pandas v1.0 —— (四) 合并数据集
文章目录六、合并数据集:Concat与Append操作(一)NumPy数组的合并 np.concatenate()(二)通过 pd.concat 实现简易合并1. 索引重复六、合并数据集:Concat与Append操作将不同的数据源进行合并,包括:将两个不同的数据集简单拼接用数据库的连接 (join) 与合并 (merge) 操作处理有重叠字段的数据集# 定义一个能够创建DataF...原创 2020-04-21 20:29:06 · 1695 阅读 · 6 评论 -
[Python3] Pandas v1.0 —— (三) 层级索引
文章目录五、层级索引(一)多级索引Series1. 低效方法:用Python元组表示索引2. 高效方法:Pandas多级索引3. 高维数据的多维索引(二)多级索引的创建方法1. 显式地创建多级索引2. 多级索引的等级名称3. 多级列索引(三)多级索引的取值和切片1. Series多级索引2. DataFrame多级索引(四)多级索引行列转换1. 有序的索引和无序的索引2. 索引stack与unst...原创 2020-04-17 19:32:58 · 956 阅读 · 0 评论 -
[Python3] Pandas v1.0 —— (二) 处理缺失值
文章目录四、处理缺失值(一)选择处理缺失值的方法(二)Pandas的缺失值1. None: Python对象类型的缺失值2. NaN: 数值类型的缺失值3. Pandas中 NaN 与 None 的差异(三)处理缺失值1. 发现缺失值2. 剔除缺失值3. 填充缺失值四、处理缺失值(一)选择处理缺失值的方法在数据表或 DataFrame 中有很多识别缺失值的方法。一般情况下可以分为两种:...原创 2020-04-15 18:23:23 · 1080 阅读 · 0 评论 -
[Python3] Pandas v1.0 —— (一) 对象、数据取值与运算
文章目录一、Pandas对象(一) Pandas的Series对象(二) Pandas的DataFrame对象(三) Pandas的Index对象二、数据取值与选择(一) Series数据选择方法(二) DataFrame数据选择方法三、Pandas数值运算方法(一) 通用函数:保留索引(二) 通用函数:索引对齐(三) 通用函数:DataFrame与Series的运算import pandas...原创 2020-04-13 20:12:11 · 1192 阅读 · 0 评论