数据挖掘技术与应用:描述统计DataFrame数值型特征数据

描述统计DataFrame数值型特征数据

  1. 准备数据

准备数据meal_order_detail1.csv,并将meal_order_detail1.csv放到Linux本地/course/DataAnalyze/data目录

  1. 数值型特征的描述性统计
  1. pandas库基于NumPy,可以用这些函数对数据框进行描述性统计,例如代码 421。

代码 421 NumPy计算平均价格

In[33]:

import numpy as np

print('订单详情表中amount(价格)的平均值为:', np.mean(detail['amounts']))

Out[33]:

订单详情表中amount(价格)的平均值为: 45.343084145901045

  1. 上述用numpy实现菜品销量价格的均值,也可以通过pandas实现,具体实现详如代码 422所示。

代码 422 pandas实现销量和价格的协方差矩阵计算

In[34]:

print('订单详情表中amount(价格)的平均值为:', detail['amounts'].mean())

Out[34]:

订单详情表中amount(价格)的平均值为: 45.343084145901045

  1. Pandas还提供了一个方法叫作describe,能够一次性得出数据框所有数值型特征的非空值数目、均值、四分位数、标准差。具体实现代码 和结果如代码 423所示。

代码 423 describe方法实现数值型数据描述性统计

In[35]:

print('订单详情表counts和amounts两列的描述性统计为:\n',

      detail[['counts','amounts']].describe())

Out[35]:

订单详情表counts和amounts两列的描述性统计为:

             counts      amounts

count  2769.000000  2769.000000

mean      1.111593    45.343084

std       0.626521    36.841316

min       1.000000     1.000000

25%       1.000000    25.000000

50%       1.000000    35.000000

75%       1.000000    56.000000

max      10.000000   178.000000

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

知识世界

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值