自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 【Python数据处理】Pandas透视表的列包含多维时,列名称扁平化处理

问题场景:pd.pivot_table是pandas的数据透视表功能,在对多维度数据进行统计计算时,非常好用。但在我个人使用过程中遇到过一个问题:当横向按照“1个及以上维度+多个量值”或“2个及以上维度”进行展开时,列名称存在多维。import numpy as npimport pandas as pddf=pd.DataFrame({'where':['上海','上海','上海','北京','北京','北京'], 'what':['西瓜','香蕉','苹果'

2020-08-14 09:24:44 2431

原创 【Python数据处理】Pandas中计算相差天数,返回整数天数

背景:Dataframe中,有两列是日期,需要计算两列日期相差的天数,如何直接得到天数而非时间戳?代码:test['delta']=test['t1']-test['t2']test['delta2']=test['delta'].apply(lambda x:x.days)效果图:

2020-08-14 09:17:06 1980

原创 【Python数据分析】整合方差齐性检验的t检验自定义函数,对比两组数据差异是否显著

应用场景:抽象:对比两组数据X,Y(假设都符合正态分布),均值差异是否显著。例:试验组结果对比对照组结果。方法:利用统计学假设检验,结合python脚本自动化出结果。流程:先利用levene检验,检验两总体的方差齐性,得到“是”或“否”的结论。进行t检验,根据方差齐性调整参数。参考代码:from scipy import statsimport pandas as pdimport numpy as npdef my_ttest(x,y,ci=0.05): if (len(

2020-08-14 09:14:16 1129 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除