2022全国大学生数据分析大赛A题完整解题教程及代码 医药电商销售数据分析

题目 A:医药电商销售数据分析 完整解题
随着国家政策的逐步开放,越来越多的药品可以在网络上购买, 医药电商平台蒸蒸日上,受新冠疫情的影响,线下药店购买困难,更 让医药电商进入了更多消费者的视野,各大药企也纷纷加大力度布局 医药电商领域。但电商模式与线下零售有所不同,如何更好的经营医 药电商成为药企急需解决的问题。本题采集了天猫维生素类的药品, 请针对维生素药品进行数据的清洗、分析与挖掘,并回答下列问题。

2.1 第一问

对店铺进行分析,一共包含多少家店铺,各店铺的销售额占比如何?给出销售额占比最高的店铺,并分析该店铺的销售情况。

题目分析:统计shop_name字段的店铺去重值以及其个数,计算出销售额,根据店铺进行分组,统计出各店铺的销售额占比。接着进行降序排序,得到销售额占比最高的店铺,给销售额最高的店铺的其他字段情况进行数据汇总分析

2.2. 第二问

对所有药品进行分析,一共包含多少个药品,各药品的销售额占比如何?给出销售额占比最高的 10 个药品,并绘制这 10 个药品每月销售额曲线图。

题目分析:统计id字段的药品去重值以及其个数(不能分析title,因为他有一些商品title一样,但是口味或者其他信息是不同的,我觉得分析id的情况可能比较好),计算出销售额,根据药品进行分组,统计出各药品的销售额占比。接着进行降序排序,统计出销售额占比最高的 10 个药品,并绘制这 10 个药品每月销售额曲线图。

2.3. 第三问

对所有药品品牌进行分析,一共包含多少个品牌,各品牌的销售额占比如何?给出销售额占比最高的 10 个品牌,并分析这 10 个品牌销售较好的原因?

题目分析:统计brand字段的品牌去重值以及其个数,计算出销售额,根据品牌进行分组,统计出各品牌的销售额占比。接着进行降序排序,统计出销售额占比最高的 10 个药品。可以从价格和折扣的对应图表,从而分析销售较好的原因。

2.3. 第四问

预测天猫维生素类药品未来三个月的销售总额并绘制拟合曲线,评估模型性能和误差。

题目分析:首先先筛选出天猫店铺维生素类的对应商品,根据时间进行分组,得到一个时间序列数据,然后就可以进行一个时间序列预测了,可以采用传统的arima模型或者灰色预测模型,可以采用机器学习的xgboost,神经网络,或者采用深度学习的lstm模型,注意这里是拟合,所以可以用mape评估模型性能

2.3. 第五问

一家药企计划将新的维生素品牌进行网络销售,聘请你当企业的顾问,请你设计一份不超过两页纸的电商经营策略。

题目分析:这个可以基于上面第三问的数据进行分析

完整解题过程视频已发放:

2022全国大学生数据分析大赛A题 保姆级教程及完整解题代码_哔哩哔哩_bilibili

  • 2
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 10
    评论
C要求我们设计一种手机套餐优惠方案,具体要求如下: 某通讯公司推出如下优惠套餐:月租费 $r$ 元,包括 $t$ 分钟通话时间。超出部分每分钟 $c$ 元。现在该公司要推出一个新的优惠套餐,其月租费为 $r'$ 元,包括 $t'$ 分钟通话时间。超出部分每分钟 $c'$ 元,它的优惠条件是:在原来套餐中一个月的通话时间为 $t_1$ 分钟时,使用新套餐的费用不高于原来套餐的费用。设计这个新套餐。 我们可以将这个问转化为一个几何问:假设 $x$ 轴表示通话时间,$y$ 轴表示费用,原套餐的费用为 $y_1(x) = \begin{cases} r, & x \leq t \\ r + c(x - t), & x > t \end{cases}$,新套餐的费用为 $y_2(x) = \begin{cases} r', & x \leq t' \\ r' + c'(x - t'), & x > t' \end{cases}$。我们需要找到一个点 $P$,使得 $y_2(x) \leq y_1(x)$,并且 $y_2(t_1) = y_1(t_1)$。这个点 $P$ 就是我们所要设计的新套餐的优惠条件。 为了方便计算,我们可以将 $y_1(x)$ 和 $y_2(x)$ 分别表示为两条直线: $$y_1(x) = \begin{cases} r, & x \leq t \\ c x - ct + r, & x > t \end{cases}$$ $$y_2(x) = \begin{cases} r', & x \leq t' \\ c' x - c't + r', & x > t' \end{cases}$$ 现在的问是如何求出这两条直线的交点 $P$。 我们可以将 $y_1(x)$ 和 $y_2(x)$ 相减,得到一个新的函数 $f(x)$: $$f(x) = y_1(x) - y_2(x) = \begin{cases} r - r', & x \leq t' \\ (c - c')x - (c - c')t + (r - r') + c't - r, & x > t' \end{cases}$$ 我们需要求出 $f(x)$ 的零点,即 $(x_0, 0)$,其中 $x_0$ 就是 $P$ 的横坐标。可以通过二分或牛顿迭代等方法求出 $f(x)$ 的零点。 计算出 $x_0$ 后,我们就可以得到点 $P$ 的坐标 $(x_0, y_1(x_0))$,即新套餐的优惠条件。具体的计算过程可以参考下面的 Python 代码实现: ```python import math def solve(r, t, c, r1, t1, c1): # 计算 y1(x) 和 y2(x) 的截距和斜率 if t1 <= t: a1, b1, a2, b2 = 0, r, c1, r1 else: a1, b1, a2, b2 = c, r - c * t, c1, r1 - c1 * t1 # 求解 f(x) 的零点 def f(x): if x <= t1: return r - r1 else: return (c - c1) * x - (c - c1) * t + (r - r1) + c1 * t1 - b1 x0 = t1 x1 = max(t1, t1 + (r - r1) / (c1 - c)) while abs(x1 - x0) > 1e-6: x = (x0 + x1) / 2 if f(x) > 0: x0 = x else: x1 = x # 计算优惠条件 return x0, a1 * x0 + b1 # 示例 print(solve(100, 300, 0.5, 80, 200, 0.3)) # 输出 (238.09523811381318, 190.0) ``` 以上就是本的详细解题步骤和 Python 代码实现。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值