- 博客(3)
- 收藏
- 关注
原创 【Python数据处理】Pandas透视表的列包含多维时,列名称扁平化处理
问题场景:pd.pivot_table是pandas的数据透视表功能,在对多维度数据进行统计计算时,非常好用。但在我个人使用过程中遇到过一个问题:当横向按照“1个及以上维度+多个量值”或“2个及以上维度”进行展开时,列名称存在多维。import numpy as npimport pandas as pddf=pd.DataFrame({'where':['上海','上海','上海','北京','北京','北京'], 'what':['西瓜','香蕉','苹果'
2020-08-14 09:24:44
2431
原创 【Python数据处理】Pandas中计算相差天数,返回整数天数
背景:Dataframe中,有两列是日期,需要计算两列日期相差的天数,如何直接得到天数而非时间戳?代码:test['delta']=test['t1']-test['t2']test['delta2']=test['delta'].apply(lambda x:x.days)效果图:
2020-08-14 09:17:06
1980
原创 【Python数据分析】整合方差齐性检验的t检验自定义函数,对比两组数据差异是否显著
应用场景:抽象:对比两组数据X,Y(假设都符合正态分布),均值差异是否显著。例:试验组结果对比对照组结果。方法:利用统计学假设检验,结合python脚本自动化出结果。流程:先利用levene检验,检验两总体的方差齐性,得到“是”或“否”的结论。进行t检验,根据方差齐性调整参数。参考代码:from scipy import statsimport pandas as pdimport numpy as npdef my_ttest(x,y,ci=0.05): if (len(
2020-08-14 09:14:16
1129
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人