![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
文章平均质量分 62
杨jun坚
数据分析、BI、SQL、Python
展开
-
【Pandas与SQL系列】Pandas实现分布函数percent_rank、cume_dist
Pandas实现分布函数percent_rank、cume_dist应用场景:快速查看某个记录所归属的组内的比例percent_rank()cume_dist()原创 2023-05-14 10:58:00 · 626 阅读 · 1 评论 -
【Pandas 小记】不同场景下的Excel、sheet合并
在日常数据处理分析过程中,大家都会遇到将一个Excel内的多个sheet合并,或者多个Excel的相同sheet合并的情况。手动复制粘贴或者使用VBA都可以实现,但是数据量多时就GG,即使是VBA也会卡住,至从学了Pandas后,都可以搞定。1,同一个Excel内不同sheet合并def oexcel_msheet(dirpath): file_list = os.listdir(dirpath) for file in file_list: dfs = []原创 2020-12-15 23:48:15 · 483 阅读 · 1 评论 -
【pandas 小记】Categoricals数据类型
pandas category数据类型https://www.cnblogs.com/onemorepoint/p/9407638.htmlhttps://www.cnblogs.com/zry-yt/p/11803892.htmlhttps://blog.csdn.net/mengenqing/article/details/80616094https://pandas.pydata.o...原创 2020-03-30 22:08:12 · 1394 阅读 · 0 评论 -
【pandas小记】pandas选择数据
1.索引分类1.1类型索引类型说明整数索引与数组的整数下标相同,从0开始到n-1,通过下标选择数据,可以使用切片的方式选择数据。标签索引参数index、columns中指定的名称,直接通过名称选择数据,也可以使用切片的方式选择数据。布尔索引这与numpy的索引方式相似,相当于选择满足条件的数据。1.2 注意1,若直接使用[ ]选择数据时,不能直接选...原创 2020-03-08 23:05:50 · 6431 阅读 · 0 评论 -
【pandas小记】pandas中的“标签”索引 与 “整数”索引
【Python】Pandas中的“标签”索引 与 “整数”索引一,索引pandas在构建Series和DataFrame时都会创建一个索引序列,类似于标签标示每个数据,不同的是,DataFrame会有行索引和列索引。注意,这里的索引类似于标记key,通过这个key可以定位到对应的value,也可以看做一个字典In [93]: obj = pd.Series(np.arange(1,5),in...原创 2020-01-01 14:34:12 · 3651 阅读 · 0 评论 -
【pandas 小记】Series 转换成 DataFrame
【Python】Pandas Series 转换成 DataFrame原创 2020-01-05 10:02:40 · 5108 阅读 · 0 评论 -
【pandas 小记】pandas 读写xml文件
import xml.etree.ElementTree as ETimport pandas as pddef iter_records(records): """ 遍历每个节点的生成器 :param records: :return: """ for record in records: temp_dict = {} #...原创 2020-02-17 22:49:44 · 9348 阅读 · 0 评论 -
【pandas小记】pandas日期类型数据处理
https://www.jianshu.com/p/0b8dcbc2df33https://www.jianshu.com/p/93734eeed9b3https://www.cnblogs.com/wuzaipei/p/10122138.html原创 2020-02-19 12:26:52 · 2031 阅读 · 0 评论 -
【pandas小记】pandas中 map、apply、applymap和transform详解
(一)pandas.Series.mapSeries.map(self, arg, na_action=None)"""根据输入对应关系映射序列值,用于用另一个值替换序列中的每个值。map()是Series对象的一个函数,DataFrame中没有map(),map()的功能是将一个自定义函数作用于Series对象的每个元素注意:Series对象、映射、替换、每个值"""#参数"...原创 2020-02-21 16:46:50 · 1737 阅读 · 3 评论 -
【pandas小记】pandas中易混淆的描述性统计
以下几种pandas描述性感觉容易混淆,记录下1,pandas.DataFrame.countDataFrame.count(self, axis=0, level=None, numeric_only=False)#统计为每列或每行非NA数# 参数"""axis : {0 or ‘index’, 1 or ‘columns’}, 默认为 0level : int 或 str, 对...原创 2020-03-01 23:04:39 · 312 阅读 · 0 评论 -
【pandas 小记】rename、reindex、set_index
rename、reindex、set_index区别rename、reindex、set_index都是pandas中对索引操作的主要方法,它们的区别如下方法适用场景调用方法备注rename传入字典或函数修改索引的名称,即轴标签名,只能对现有轴标签重命名,不能新增或删减索引,df.rename(dict1)当dict1中包含不存在的索引时,参数errors,可以设...原创 2020-03-06 23:08:01 · 1790 阅读 · 0 评论