Python 电商平台购物数据分析,源码+数据下载;整体销售情况分析(折线图、饼图分析)

开发环境:

开发环境:Python3
工具:pandas、matplotlib.pyplot


数据来源:

数据地址:数据集
数据描述:本数据集共收集了发生在一个月内的28010条数据,
包含以下:
[‘订单编号’, ‘总金额’, ‘买家实际支付金额’, ‘收货地址’, ‘订单创建时间’, '订单付款时间 ', ‘退款金额’] 7个字段。

7个字段说明:

订单编号:订单编号
总金额:订单总金额
买家实际支付金额:总金额 - 退款金额(在已付款的情况下)。金额为0(在未付款的情况下)
收货地址:各个省份
订单创建时间:下单时间
订单付款时间:付款时间
退款金额:付款后申请退款的金额。如无付过款,退款金额为0

数据截图

在这里插入图片描述


分析目标:

1、整体销售情况

  • 订单交易数量
  • 退货订单数量
  • 退货率
  • 交易总金额
  • 成交总金额
  • 退款总金额
  • 实际成交额

2、买家地区分布(饼图)
3、支付金额时间分布(折线图)
4、销售额走势图(折线图)


代码及结果:

1、整体销售情况
def taobao_analysis(csv_path):
    df = pd.DataFrame(pd.read_csv(csv_path))
    #  id   总金额 实际支付金额  地址   订单创建时间   付款时间   退款金额
    df.columns = ['id', 'amount', 'paid', 'address', 'ordertime', 'paytime', 'refund']
    df.paytime = pd.to_datetime(df.paytime)
    df.ordertime = pd.to_datetime(df.ordertime)

    # 订单交易数量
    order_num = df.id.count()
    # 退货订单数量
    refund_num = df[df['refund'] > 0].refund.count()
    # 退货率
    refund_rate = round(refund_num / order_num * 100, 3)
    # 交易总金额
    amount_sum = df.amount.sum()
    # 成交总金额
    paid_sum = df.paid.sum()
    # 退款总金额
    refund_sum = df.refund.sum()
    # 实际成交额
    paymey = paid_sum - refund_sum

    print('订单数量:', order_num)
    print('退货订单数量:', refund_num)
    print('退货率:{}%'.format(refund_rate))
    print('交易总金额:', amount_sum)
    print('成交总金额:', paid_sum)
    print('退款总金额:', refund_sum)
    print('实际成交额:', paymey)
结果截图:

在这里插入图片描述

2、买家地区分布(饼图)
def address_chart(df):
    add = df.groupby('address')['id'].count().sort_values(ascending=False)
    plt.rcParams['font.sans-serif'] = ['SimHei']
    add.plot.pie(figsize=(12,6),labels=add.index, autopct='%1.1f')
    plt.title('买家地区分布')
    plt.show()
结果截图

在这里插入图片描述

3、支付金额时间分布(折线图)
def time_chart(df):
    df1 = df.copy()
    df1['paytime'] = df1['paytime'].dt.time
    df1['paytime'] = pd.to_datetime(df.paytime)
    plt.figure(figsize=(20,8), dpi=80)
    s = df1['paytime'].dt.floor('30T')
    df1['paytime'] = s.dt.strftime('%H:%M') + '-' + (s+pd.Timedelta(29*60,unit='s')).dt.strftime("%H:%M")
    timedf1 = df1.groupby('paytime')['id'].count()
    timedf1.drop(index='NaT-NaT', inplace=True)
    timedf_x = timedf1.index
    timedf_y = timedf1.values
    plt.xticks(rotation=60)
    plt.plot(timedf_x, timedf_y)
    plt.show()
结果截图

在这里插入图片描述

4、销售额走势图(折线图)

def money_chart(df):
    df['day'] = df['ordertime'].dt.day
    xx = df.groupby('day')['amount'].sum().index
    yy_1 = df.groupby('day')['amount'].sum().values/10000
    yy_2 = df.groupby('day')['paid'].sum().values/10000
    yy_3 = df.groupby('day')['refund'].sum().values/10000
    plt.plot(xx,yy_1,label='Order Amount',color='red',marker='+')
    plt.plot(xx,yy_2,label='Payment Amount',color='green',marker='o')
    plt.plot(xx,yy_3,label='Refund Amount',color='blue',marker='.')
    plt.xlabel('day')
    plt.ylabel('money(10000yuan)')
    plt.show()

结果截图

在这里插入图片描述


源码及数据下载:

CSDN下载:下载地址
百度网盘下载:

链接:https://pan.baidu.com/s/1fBMX27gkvkQ4Lowu35ymQA
提取码:j43u

阿里云网盘下载:

「淘宝交易数据分析代码」,点击链接保存,或者复制本段内容,打开「阿里云盘」APP ,无需下载,极速在线查看享用。
链接:https://www.aliyundrive.com/s/rLmKsGffw8N

CSDN下载:下载地址

  • 8
    点赞
  • 109
    收藏
    觉得还不错? 一键收藏
  • 13
    评论
### 回答1: 基于Python爬取数据可视化分析系统是一个用于从网站中爬取数据,并通过可视化分析来帮助用户更好地理解和分析市场的工具。 首先,我们可以使用Python的库,如BeautifulSoup、Selenium等,来进行网页爬取。通过抓取网站上的品信息、用户评价和销售数据,可以获得关于产品和市场的大量数据。 然后,通过数据清洗和处理,对所获取的原始数据进行整理和筛选,将其转换为结构化的数据。这可以通过使用Pandas和NumPy等Python数据处理库来实现。清洗和处理数据的目的是为了提高数据的质量,减少噪声和错误,使得分析后的结果更具有可靠性和准确性。 接下来,我们可以使用Python数据可视化库,如Matplotlib和Seaborn,对清洗后的数据进行可视化分析。通过绘制柱状折线图、散点、热力等各种表,可以直观地展示品的销售量、价位分布、用户评价等信息,为用户提供全面的市场洞察。这些可视化表可以帮助用户发现销售趋势、热门产品、市场竞争等关键信息,以支持他们做出更明智的决策。 此外,系统还可以提供交互式的可视化界面,供用户根据自己的需求进行数据的筛选和查询。用户可以选择特定的平台、产品类别、时间范围等条件,来针对性地观察和分析市场数据。同时,系统还可以提供基于用户行为的推荐功能,帮助用户发现可能感兴趣的产品和市场机会。 总之,基于Python爬取数据可视化分析系统可以为用户提供全面的市场数据分析服务,帮助他们更好地理解市场状况,发现潜在机,做出科学的决策。通过Python强大的数据处理和可视化能力,这个系统可以有效地帮助用户节省时间和精力,提高决策的准确性和效率。 ### 回答2: 基于Python爬取数据可视化分析系统,是指利用Python编程语言实现爬取数据,并通过数据可视化技术展示和分析这些数据的系统。 首先,利用Python的爬虫技术,我们可以编写程序来自动抓取网站上的数据,包括品信息、销售数据、用户评价等。通过调用Python的网络请求库,我们可以模拟浏览器的操作,访问网页、获取页面码,并使用正则表达式或解析库来提取所需数据。 接下来,将获取到的数据进行清洗和处理,去除无用信息、格式化数据,并存储到数据库中以便后续使用。Python数据处理库,如Pandas和Numpy,可以帮助我们对大量数据进行快速高效的处理和整理。 然后,利用Python数据可视化库,如Matplotlib和Seaborn,我们可以对数据进行表展示和分析。可以绘制柱状折线图等,展示销售额、用户评价分布等数据特征。此外,还可以使用地理信息可视化库,如Folium,根据用户的地理位置展示销售热度地。 最后,为了使系统更加用户友好,可以使用Python的Web框架,如Flask和Django,搭建一个网页应用。用户可以通过界面输入要爬取的网站地址或选择已配置好的网站,系统将自动爬取数据并展示在网页上。用户可以通过交互式的界面来选择不同的数据展示方式和分析方法,实现个性化的数据可视化与分析需求。 综上所述,基于Python爬取数据可视化分析系统,通过爬取数据数据处理、数据可视化和Web应用搭建,能够帮助我们更好地理解和分析数据,为运营和决策提供支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值