python计算消费额_11、Python 数据分析-用户消费行为分析

第一部分:数据类型处理

数据加载

字段含义:

user_id:用户ID

order_dt:购买日期

order_product:购买产品的数量

order_amount:购买金额

观察数据

查看数据的数据类型

数据中是否存储在缺失值

将order_dt转换成时间类型

查看数据的统计描述

计算所有用户购买商品的平均数量

计算所有用户购买商品的平均花费

在源数据中添加一列表示月份

import pandas as pd

from pandas import DataFrame,Series

import numpy as np

import matplotlib.pyplot as plt

%matplotlib inline

1.1、数据加载

字段含义:

user_id:用户ID

order_dt:购买日期

order_product:购买产品的数量

order_amount:购买金额

df = pd.read_csv('./data/CDNOW_master.txt',header=None,sep='\s+',names=['user_id','order_dt','order_product','order_amount'])

df.head()

1.2、查看数据类型

查看数据的数据类型,数据中是否存储在缺失值

df.info()

>>>

RangeIndex: 69659 entries, 0 to 69658

Data columns (total 4 columns):

# Column Non-Null Count Dtype

--- ------ -------------- -----

0 user_id 69659 non-null int64

1 order_dt 69659 non-null int64

2 order_product 69659 non-null int64

3 order_amount 69659 non-null float64

dtypes: float64(1), int64(3)

memory usage: 2.1 MB

将order_dt转换成时间类型

df['order_dt'] = pd.to_datetime(df['order_dt'],format='%Y%m%d')

df.head()

查看数据的统计描述

计算所有用户购买商品的平均数量

计算所有用户购买商品的平均花费

df.describe()

在源数据中添加一列表示月份

df['month'] = df['order_dt'].astype('datetime64[M]')

第二部分:按月数据分析

用户每月花费的总金额

绘制曲线图展示

所有用户每月的产品购买量

所有用户每月的消费总次数

统计每月的消费人数

用户每月花费的总金额

month_amt_s = df.groupby(by='month')['order_amount'].sum()

>>>

month

1997-01-01 299060.17

1997-02-01 379590.03

1997-03-01 393155.27

1997-04-01 142824.49

1997-05-01 107933.30

1997-06-01 108395.87

1997-07-01 122078.88

1997-08-01 88367.69

1997-09-01 81948.80

1997-10-01 89780.77

1997-11-01 115448.64

1997-12-01 95577.35

1998-01-01 76756.78

1998-02-01 77096.96

1998-03-01 108970.15

1998-04-01 66231.52

1998-05-01 70989.66

1998-06-01 76109.30

Name: order_amount, dtype: float64

​绘制曲线图展示

plt.figure(figsize=(8,5))

plt.plot(month_amt_s.index,month_amt_s.values)

#或df.groupby(by='month')['order_amount'].sum().plot()

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基于Python的学生消费行为分析是利用Python编程语言和相关的库来对学生的消费行为进行分析和研究。以下是对于这个问题的详细解答: 首先,Python作为一种功能强大的编程语言,具有丰富的数据处理和分析的库,如NumPy, pandas和Matplotlib等,可以有效地处理和分析消费数据。 在学生消费行为分析中,可以利用Python来处理和整理学生的消费数据,如购买时间、金额、购买地点等。通过数据清洗和预处理,可以为后续的分析提供可用的数据集。 其次,可以使用Python中的数据可视化库,如Matplotlib和Seaborn等,来可视化学生消费行为相关的数据,以便更直观地了解学生的消费习惯和模式。比如,可以绘制柱状图、折线图、散点图等来展现不同时间段和地点的消费情况。 另外,Python还提供了机器学习和深度学习的库,如Scikit-learn和TensorFlow等,可以进行消费行为的预测和分析。可以利用这些库来构建和训练机器学习模型,以预测学生的消费行为,例如预测学生在特定时间段是否会购买某种商品或服务。 最后,通过Python的统计分析库,如Scipy和Statsmodels等,可以进行学生消费行为的统计分析,例如计算平均消费额消费频率、消费倾向等。这些统计分析结果可以为学校或企业提供关于学生消费行为的有价值的信息和洞察。 总之,基于Python的学生消费行为分析可以通过数据处理、数据可视化、机器学习和统计分析等方法来研究和理解学生的消费行为,并为学校或企业提供相应的建议和决策支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值