前言:用Python做大数据统计时遇到的小问题的解决方法的记录
###工作经验统计(data为清洗后的dataframe)
exp_count = data['count'].groupby(data['experience']).sum()
1. 原本的代码
#占比统计:百分比保留2位小数
exp_sum = exp_count.sum() #求和
exp_per = (exp_count/exp_sum).apply(lambda x:format(x,'0.2%'))
#检查求和是否为1
exp_per = exp_per.str.strip('%').astype(float)/100
per_sum = exp_per.sum()