- 博客(6)
- 资源 (2)
- 收藏
- 关注
原创 Python-Pandas进行批量Excel文件、多Sheet表合并
本文汇总日常工作中对批量Excel数据的合并方法,主要使用Python-Pandas库相关方法。具体包括多个excel表格合并到一个excel、多个excel表格合并到一个excel中的不同sheet与一个excel表格中的多个sheet合并到至一个。
2021-11-21 20:58:50 4574 1
原创 pandas时间序列——时间基础、时间增量、时间周期、日期偏移处理
本文详解pd.Timestamp方法创建日期时间对象、pd.Timestamp、pd.DatetimeIndex方法创建时间序列及pd.date_range创建连续时间序列、 pd.to_datetime、str和parse方法用于字符串与时间格式的相互转换、truncate方法截取时间和时间索引方法、 Timedelta增量函数、 timedelta_range产生连续增量函数、pd.Period方法建立时间周期、pd.period_range函数产生时间周期序列、pd.DateOffset建立时间偏移量
2020-12-14 21:42:55 13922 12
原创 pandas数据分组聚合——groupby()、aggregate()、apply()、transform()和filter()方法详解
在关系型数据库库里,存在着Group by分组和聚合运算过程,Pandas提供的分组对象GroupBy,配合相关运算方法能够实现特定的分组运算目的。GroupBy对象提供分组运算步骤中的拆分功能,aggregate、transform、apply以及filter在分组运算上提供了不同的实现途径,本文详解四种方法的使用过程,对比函数特点,区分使用范围,以便更好理解数据分组运算。
2020-12-04 21:05:28 49269 10
原创 pandas数据选择——基于iloc、loc等方法达到数据选择的多样性
基于pandas的数据索引,采用iloc、loc方法等进行数据的普通索引、布尔索引、切片索引的联用,进而得到对不同列、行、多列、多行、指定列与行数据的选取
2020-12-01 14:42:25 828 2
原创 pandas数据预处理---缺失值处理、重复数据处理、更改索引、行列删除
常见的不规整数据主要有缺失数据、重复数据、异常数据几种,在开始正式的数据分析之前,我们需要先把这些不太规整的数据处理掉。本篇博文针对不同类型的数据,调用不同pandas内置函数进行处理,infor查看缺失值、isnull与notnull来判断缺失值、dropna删除缺失值、fillna填充缺失值、replace替换缺失值、interpolate插入、drop_duplicates方法去重、set_index、reindex、rename、reset_index重建索引,del 和 drop进行行列删除
2020-11-29 19:52:46 3331 5
原创 python爬取网易云歌手歌曲列表、歌曲链接、歌手及专辑名
**python爬取网易云歌手歌曲列表、歌曲链接、歌手及专辑名**代码如下:url = ‘https://music.163.com/artist?id=5781’headers= {“User-Agent”: “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.135 Safari/537.36 Edg/84.0.522.63”}res= req
2020-08-31 16:05:19 1111 1
Python利用邻接矩阵绘制复杂网络图并分析网络基本拓扑特征
2020-07-12
Python处理已知网络关系数据为邻接矩阵
2020-07-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人