pandas 数据分析
范菜
这个作者很懒,什么都没留下…
展开
-
pandas时间序列——时间基础、时间增量、时间周期、日期偏移处理
本文详解pd.Timestamp方法创建日期时间对象、pd.Timestamp、pd.DatetimeIndex方法创建时间序列及pd.date_range创建连续时间序列、 pd.to_datetime、str和parse方法用于字符串与时间格式的相互转换、truncate方法截取时间和时间索引方法、 Timedelta增量函数、 timedelta_range产生连续增量函数、pd.Period方法建立时间周期、pd.period_range函数产生时间周期序列、pd.DateOffset建立时间偏移量原创 2020-12-14 21:42:55 · 13760 阅读 · 12 评论 -
pandas数据分组聚合——groupby()、aggregate()、apply()、transform()和filter()方法详解
在关系型数据库库里,存在着Group by分组和聚合运算过程,Pandas提供的分组对象GroupBy,配合相关运算方法能够实现特定的分组运算目的。GroupBy对象提供分组运算步骤中的拆分功能,aggregate、transform、apply以及filter在分组运算上提供了不同的实现途径,本文详解四种方法的使用过程,对比函数特点,区分使用范围,以便更好理解数据分组运算。原创 2020-12-04 21:05:28 · 47761 阅读 · 10 评论 -
pandas数据选择——基于iloc、loc等方法达到数据选择的多样性
基于pandas的数据索引,采用iloc、loc方法等进行数据的普通索引、布尔索引、切片索引的联用,进而得到对不同列、行、多列、多行、指定列与行数据的选取原创 2020-12-01 14:42:25 · 814 阅读 · 2 评论 -
pandas数据预处理---缺失值处理、重复数据处理、更改索引、行列删除
常见的不规整数据主要有缺失数据、重复数据、异常数据几种,在开始正式的数据分析之前,我们需要先把这些不太规整的数据处理掉。本篇博文针对不同类型的数据,调用不同pandas内置函数进行处理,infor查看缺失值、isnull与notnull来判断缺失值、dropna删除缺失值、fillna填充缺失值、replace替换缺失值、interpolate插入、drop_duplicates方法去重、set_index、reindex、rename、reset_index重建索引,del 和 drop进行行列删除原创 2020-11-29 19:52:46 · 3276 阅读 · 5 评论