自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (2)
  • 收藏
  • 关注

原创 Python-Pandas进行批量Excel文件、多Sheet表合并

本文汇总日常工作中对批量Excel数据的合并方法,主要使用Python-Pandas库相关方法。具体包括多个excel表格合并到一个excel、多个excel表格合并到一个excel中的不同sheet与一个excel表格中的多个sheet合并到至一个。

2021-11-21 20:58:50 4526 1

原创 pandas时间序列——时间基础、时间增量、时间周期、日期偏移处理

本文详解pd.Timestamp方法创建日期时间对象、pd.Timestamp、pd.DatetimeIndex方法创建时间序列及pd.date_range创建连续时间序列、 pd.to_datetime、str和parse方法用于字符串与时间格式的相互转换、truncate方法截取时间和时间索引方法、 Timedelta增量函数、 timedelta_range产生连续增量函数、pd.Period方法建立时间周期、pd.period_range函数产生时间周期序列、pd.DateOffset建立时间偏移量

2020-12-14 21:42:55 13760 12

原创 pandas数据分组聚合——groupby()、aggregate()、apply()、transform()和filter()方法详解

在关系型数据库库里,存在着Group by分组和聚合运算过程,Pandas提供的分组对象GroupBy,配合相关运算方法能够实现特定的分组运算目的。GroupBy对象提供分组运算步骤中的拆分功能,aggregate、transform、apply以及filter在分组运算上提供了不同的实现途径,本文详解四种方法的使用过程,对比函数特点,区分使用范围,以便更好理解数据分组运算。

2020-12-04 21:05:28 47754 10

原创 pandas数据选择——基于iloc、loc等方法达到数据选择的多样性

基于pandas的数据索引,采用iloc、loc方法等进行数据的普通索引、布尔索引、切片索引的联用,进而得到对不同列、行、多列、多行、指定列与行数据的选取

2020-12-01 14:42:25 814 2

原创 pandas数据预处理---缺失值处理、重复数据处理、更改索引、行列删除

常见的不规整数据主要有缺失数据、重复数据、异常数据几种,在开始正式的数据分析之前,我们需要先把这些不太规整的数据处理掉。本篇博文针对不同类型的数据,调用不同pandas内置函数进行处理,infor查看缺失值、isnull与notnull来判断缺失值、dropna删除缺失值、fillna填充缺失值、replace替换缺失值、interpolate插入、drop_duplicates方法去重、set_index、reindex、rename、reset_index重建索引,del 和 drop进行行列删除

2020-11-29 19:52:46 3276 5

原创 python爬取网易云歌手歌曲列表、歌曲链接、歌手及专辑名

**python爬取网易云歌手歌曲列表、歌曲链接、歌手及专辑名**代码如下:url = ‘https://music.163.com/artist?id=5781’headers= {“User-Agent”: “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.135 Safari/537.36 Edg/84.0.522.63”}res= req

2020-08-31 16:05:19 1089 1

Python利用邻接矩阵绘制复杂网络图并分析网络基本拓扑特征

利用python载入邻接矩阵绘制网络图,基于python语言的特点,对邻接矩阵加以处理后再进行应用,即将邻接矩阵去除第一列(节点序号列),复杂网络的基本拓扑结构可以用图论的方法表示成G =(V,E),V中元素称为节点或顶点,E中元素称为边。在图论框架下, 可用不同的全局参量来表示复杂网络的特征, 最基本特征包括度分布 P(k)和聚类系数C。

2020-07-12

Python处理已知网络关系数据为邻接矩阵

用Python将Excel网络关系(两列,id1,id2)转换为邻接矩阵。将数据更改为csv格式存储,通过遍历数据,输出邻接矩阵。经过实验,对网络节点关系数据进行重复处理,即1对应2节点,同样在数据中输入2对应1节点,以此可直接求出邻接矩阵,

2020-07-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除