pandas 三种柜机类型 投件率差别分析

  通过观察我们发现,一代柜、二代柜和易邮柜三种柜机直接的投件率存在较大的差别,故此分析一下差别的由来

 第一步:从数据库中提取数据并将其保存在 excel中

#one 提取数据
# con = create_engine('mysql+pymysql://xxx@xxx:3306/xxx')
# data_sql2 = pd.read_sql_query("SELECT `经分-设备大表`.`首次激活时间`,`经分-设备大表`.`设备ID`,`经分-设备大表`.`设备类型`,(SUM(`总投件量`)/SUM(`箱格数`)) as 投件率,SUM(`总投件量`) as 总投件量,SUM(`箱格数`) as 箱格数 FROM `经分-设备大表`  WHERE `时间` > 2018-08-27 GROUP BY `经分-设备大表`.`设备ID`;", con)
#
# data_sql2.to_excel(r'E:\pycharm建立的Python_Project\用python进行数据分析\test.xlsx')

第二步:从excel中读取数据并聚合,分离每种机型的分激活时间的投件率

#一代柜激活时间和投件率
one_type = data.loc[data['设备类型']=='一代柜',:]

a1 = pd.DataFrame(one_type.groupby('首次激活时间').apply(lambda x: sum(x['总投件量']) / sum(x['箱格数']))).reset_index().reset_index().rename(columns = {'index':'日期',0:'投件率'})
a1['投件率'] = a1.loc[a1['投件率'] < 1.2,'投件率']
a1['首次激活时间'] = a1['首次激活时间'].map(lambda x:time.strptime(str(x), '%Y-%m-%d').tm_yday if str(x).split('-')[0]=='2014' else (int(str(x).split('-')[0])-2014)*365+int(time.strptime(str(x), '%Y-%m-%d').tm_yday)) #将

#二代柜激活时间和投件率
one_type = data.loc[data['设备类型']=='二代柜',:]
a2 = pd.DataFrame(one_type.groupby('首次激活时间').apply(lambda x: sum(x['总投件量']) / sum(x['箱格数']))).reset_index().reset_index().rename(columns = {'index':'日期',0:'投件率'}).dropna()
a2['投件率'] = a2.loc[a2['投件率'] < 1.2,'投件率']
a2['首次激活时间'] = a2['首次激活时间'].map(lambda x:time.strptime(str(x), '%Y-%m-%d').tm_yday if str(x).split('-')[0]=='2014' else (int(str(x).split('-')[0])-2014)*365+int(time.strptime(str(x), '%Y-%m-%d').tm_yday)) #将

#易邮柜激活时间和投件率
one_type = data.loc[data['设备类型']=='易邮柜',:]
a3 = pd.DataFrame(one_type.groupby('首次激活时间').apply(lambda x: sum(x['总投件量']) / sum(x['箱格数']))).reset_index().reset_index().rename(columns = {'index':'日期',0:'投件率'})
a3['投件率'] = a3.loc[a3['投件率'] < 1.2,'投件率']
a3['首次激活时间'] = a3[~(a3['首次激活时间'].isin(['9999-12-31','1970-01-02']))]['首次激活时间'].map(lambda x:time.strptime(str(x), '%Y-%m-%d').tm_yday if str(x).split('-')[0]=='2014' else (int(str(x).split('-')[0])-2014)*365+int(time.strptime(str(x), '%Y-%m-%d').tm_yday)) #将

sns1 = sns.regplot(x="首次激活时间", y="投件率",scatter_kws={"s": 20}, data=a1)
sns1.set_ylim([0,1.2])
plt.legend('一代柜')

sns2 = sns.regplot(x="首次激活时间", y="投件率", scatter_kws={"s": 20},data=a2,marker="+")
sns2.set_ylim([0,1.2])
plt.legend('二代柜')

sns3 = sns.regplot(x="首次激活时间", y="投件率",scatter_kws={"s": 20}, data=a3,marker="*")
sns3.set_ylim([0,1.2])

plt.legend(['一代柜','二代柜','易邮柜'])
plt.show()

 结果:

通过图我们得出一下结论:

1、同期激活的一代柜比二代柜使用率高,一代柜不论使用时间长短 普遍 比 二代柜 投件率 高
2、无论哪种柜机 使用时间越久 投件率越高

 没有得出影响投件率的关键因素

接下来我们分析不同柜机数量的分布对投件率的影响:

#各县市所对应的省
aa = pd.read_excel(r'E:\工作中的文件\20181116双十一滞留件分析\各县市对应的省.xlsx')
data_ready = pd.merge(aa,data,on='设备ID')

#计算一代柜 各个省的 设备的数量 和  投件率的相关性
#一代柜 的 各个省的数量 和 投件率的相关性
et = data_ready[data_ready['设备类型'].isin(['一代柜'])].groupby('省').apply(lambda x:x['总投件量'].sum()/x['箱格数'].sum()).reset_index().rename(columns={0:'一代柜投件率'})
et1 = data_ready[data_ready['设备类型'].isin(['一代柜'])].groupby('省')['设备ID'].count().reset_index().rename(columns={'设备ID':'一代柜设备数'})
et2_1 = pd.merge(et,et1)

#计算二代柜 各个省的 设备的数量 和  投件率的相关性
#二代柜 的 各个省的数量 和 投件率的相关性
et = data_ready[data_ready['设备类型'].isin(['二代柜'])].groupby('省').apply(lambda x:x['总投件量'].sum()/x['箱格数'].sum()).reset_index().rename(columns={0:'二代柜投件率'})
et1 = data_ready[data_ready['设备类型'].isin(['二代柜'])].groupby('省')['设备ID'].count().reset_index().rename(columns={'设备ID':'二代柜设备数'})
et2_2 = pd.merge(et,et1)
#计算易邮柜 各个省的 设备的数量 和  投件率的相关性
#易邮柜 的 各个省的数量 和 投件率的相关性
et = data_ready[data_ready['设备类型'].isin(['易邮柜'])].groupby('省').apply(lambda x:x['总投件量'].sum()/x['箱格数'].sum()).reset_index().rename(columns={0:'易邮柜投件率'})
et1 = data_ready[data_ready['设备类型'].isin(['易邮柜'])].groupby('省')['设备ID'].count().reset_index().rename(columns={'设备ID':'易邮柜设备数'})
et2_3 = pd.merge(et,et1)

#三种类型柜机数量和投件量两两计算相关系数
et2_total = pd.merge(et2_1,et2_2).merge(et2_3)
ax = sns.heatmap(et2_total.iloc[:,1:].corr(),cmap="YlGnBu",annot=True)
plt.show()

结果:

 

一代柜和二代柜有较强的相关性 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
后台采用apache服务器下的cgi处理c语言做微信小程序后台逻辑的脚本映射。PC端的服务器和客户端都是基于c语言写的。采用mysql数据库进行用户数据和聊天记录的存储。.zip C语言是一种广泛使用的编程语言,它具有高效、灵活、可移植性强等特点,被广泛应用于操作系统、嵌入式系统、数据库、编译器等领域的开发。C语言的基本语法包括变量、数据类型、运算符、控制结构(如if语句、循环语句等)、函数、指针等。下面详细介绍C语言的基本概念和语法。 1. 变量和数据类型 在C语言中,变量用于存储数据,数据类型用于定义变量的类型和范围。C语言支持多种数据类型,包括基本数据类型(如int、float、char等)和复合数据类型(如结构体、联合等)。 2. 运算符 C语言中常用的运算符包括算术运算符(如+、、、/等)、关系运算符(如==、!=、、=、<、<=等)、逻辑运算符(如&&、||、!等)。此外,还有位运算符(如&、|、^等)和指针运算符(如、等)。 3. 控制结构 C语言中常用的控制结构包括if语句、循环语句(如for、while等)和switch语句。通过这些控制结构,可以实现程序的分支、循环和多路选择等功能。 4. 函数 函数是C语言中用于封装代码的单元,可以实现代码的复用和模块化。C语言中定义函数使用关键字“void”或返回值类型(如int、float等),并通过“{”和“}”括起来的代码块来实现函数的功能。 5. 指针 指针是C语言中用于存储变量地址的变量。通过指针,可以实现对内存的间接访问和修改。C语言中定义指针使用星号()符号,指向数组、字符串和结构体等数据结构时,还需要注意数组名和字符串常量的特殊性质。 6. 数组和字符串 数组是C语言中用于存储同类型数据的结构,可以通过索引访问和修改数组中的元素。字符串是C语言中用于存储文本数据的特殊类型,通常以字符串常量的形式出现,用双引号("...")括起来,末尾自动添加'\0'字符。 7. 结构体和联合 结构体和联合是C语言中用于存储不同类型数据的复合数据类型。结构体由多个成员组成,每个成员可以是不同的数据类型;联合由多个变量组成,它们共用同一块内存空间。通过结构体和联合,可以实现数据的封装和抽象。 8. 文件操作 C语言中通过文件操作函数(如fopen、fclose、fread、fwrite等)实现对文件的读写操作。文件操作函数通常返回文件指针,用于表示打开的文件。通过文件指针,可以进行文件的定位、读写等操作。 总之,C语言是一种功能强大、灵活高效的编程语言,广泛应用于各种领域。掌握C语言的基本语法和数据结构,可以为编程学习和实践打下坚实的基础。
该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 该资源内项目源码是个人的课程设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。
C语言是一种广泛使用的编程语言,它具有高效、灵活、可移植性强等特点,被广泛应用于操作系统、嵌入式系统、数据库、编译器等领域的开发。C语言的基本语法包括变量、数据类型、运算符、控制结构(如if语句、循环语句等)、函数、指针等。下面详细介绍C语言的基本概念和语法。 1. 变量和数据类型 在C语言中,变量用于存储数据,数据类型用于定义变量的类型和范围。C语言支持多种数据类型,包括基本数据类型(如int、float、char等)和复合数据类型(如结构体、联合等)。 2. 运算符 C语言中常用的运算符包括算术运算符(如+、、、/等)、关系运算符(如==、!=、、=、<、<=等)、逻辑运算符(如&&、||、!等)。此外,还有位运算符(如&、|、^等)和指针运算符(如、等)。 3. 控制结构 C语言中常用的控制结构包括if语句、循环语句(如for、while等)和switch语句。通过这些控制结构,可以实现程序的分支、循环和多路选择等功能。 4. 函数 函数是C语言中用于封装代码的单元,可以实现代码的复用和模块化。C语言中定义函数使用关键字“void”或返回值类型(如int、float等),并通过“{”和“}”括起来的代码块来实现函数的功能。 5. 指针 指针是C语言中用于存储变量地址的变量。通过指针,可以实现对内存的间接访问和修改。C语言中定义指针使用星号()符号,指向数组、字符串和结构体等数据结构时,还需要注意数组名和字符串常量的特殊性质。 6. 数组和字符串 数组是C语言中用于存储同类型数据的结构,可以通过索引访问和修改数组中的元素。字符串是C语言中用于存储文本数据的特殊类型,通常以字符串常量的形式出现,用双引号("...")括起来,末尾自动添加'\0'字符。 7. 结构体和联合 结构体和联合是C语言中用于存储不同类型数据的复合数据类型。结构体由多个成员组成,每个成员可以是不同的数据类型;联合由多个变量组成,它们共用同一块内存空间。通过结构体和联合,可以实现数据的封装和抽象。 8. 文件操作 C语言中通过文件操作函数(如fopen、fclose、fread、fwrite等)实现对文件的读写操作。文件操作函数通常返回文件指针,用于表示打开的文件。通过文件指针,可以进行文件的定位、读写等操作。 总之,C语言是一种功能强大、灵活高效的编程语言,广泛应用于各种领域。掌握C语言的基本语法和数据结构,可以为编程学习和实践打下坚实的基础。
该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 该资源内项目源码是个人的课程设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。
该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 该资源内项目源码是个人的课程设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值