2021华数杯C题总结

题目

C题 电动汽车目标客户销售策略研究

  汽车产业是国民经济的重要支柱产业,而新能源汽车产业是战略性新兴产业。大力发展以电动汽车为代表的新能源汽车是解决能源环境问题的有效途径,市场前景广阔。但是,电动汽车毕竟是一个新兴的事物,与传统汽车相比,消费者在一些领域,如电池问题,还是存在着一些疑虑,其市场销售需要科学决策。
  某汽车公司最新推出了三款品牌电动汽车,包括合资品牌(用1表示)、自主品牌(用2表示)和新势力品牌(用3表示)。为研究消费者对电动汽车的购买意愿,制定相应的销售策略,销售部门邀请了1964位目标客户对三款品牌电动汽车进行体验。具体体验数据有电池技术性能(电池耐用和充电方便)满意度得分(满分100分,下同)a1、舒适性(环保与空间座椅)整体表现满意度得分a2、经济性(耗能与保值率)整体满意度得分a3、安全性表现(刹车和行车视野)整体满意度得分a4、动力性表现(爬坡和加速)整体满意度得分a5、驾驶操控性表现(转弯和高速的稳定性)整体满意度得分a6、外观内饰整体表现满意度得分a7、配置与质量品质整体满意度得分a8等。另外还有目标客户体验者个人特征的信息,详情见附录1和2。
  请你研究数据,查阅相关文献,运用数学建模的知识回答下列问题:

  1. 请做数据清洗工作,指出异常值和缺失数据以及处理方法。对数据做描述性统计分析,包括目标客户对于不同品牌汽车满意度的比较分析。
  2. 决定目标客户是否购买电动车的影响因素有很多,有电动汽车本身的因素,也有目标客户个人特征的因素。在这次目标客户体验活动中,有部分目标客户购买了体验的电动汽车(购买了用1表示,没有购买用0表示)。结合这些信息,请研究哪些因素可能会对不同品牌电动汽车的销售有影响?
  3. 结合前面的研究成果,请你建立不同品牌电动汽车的客户挖掘模型,并评价模型的优良性。运用模型判断附件3中15名目标客户购买电动车的可能性。
  4. 销售部门认为,满意度是目标客户汽车体验的一种感觉,只要营销者加大服务力度,在短的时间内提高a1-a8五个百分点的满意度是有可能的,但服务难度与提高的满意度百分点是成正比的,即提高体验满意度5%的服务难度是提高体验满意度1%服务难度的5倍。基于这种思路和前面的研究成果,请你在附件3每个品牌中各挑选1名没有购买电动汽车的目标客户,实施销售策略。
  5. 根据前面的研究结论,请你给销售部门提出不超过500字的销售策略建议。

题目注释:C题附件1数据只看data

评分标准

问题一给分点

在这里插入图片描述

问题二给分点

在这里插入图片描述
在这里插入图片描述
影响因素对一个就行,不用都正确,但是得有一样的

问题三给分点

在这里插入图片描述

问题三参考答案

请添加图片描述

问题四给分点

在这里插入图片描述

老师提出的我们论文问题

摘要问题

问题: 摘要第一段过于冗长,针对每个问题没有给出关键性结果。摘要中第三问未正面回答问题。
未来可以改进的地方:

  1. 摘要也要根据问题的重要性安排长短,第一问这种数据清洗不必写太多,给出重点结果就行
  2. 像第三问中问模型的评估,在摘要中要直接写出评估结果(比如准确率是95%,直接给出数据结果)。预测结果也直接写在摘要中。

实验结果的展示

问题: 排版中一些结果数据不要直接截图展示不美观,表中客户编号错误,应该为11-15。
未来可以改进的地方:

  1. 实验结果重新绘制三线表展示结果数据
  2. 实验结果图片和表格中编号等要仔细检查

问题四

问题: 问题四没有建立销售策略模型(如优化模型),没有对客户进行a1-a8提高满意度的销售策略实证分析,只是通过参数调整进行分析。
未来可以改进的地方:
国赛的发展趋势就是在C题中加入优化,有优化的问题也通常是占分最高的一部分,到三四五问这里就可以开始考虑优化问题了。这里我们题目的理解出现了问题,没有理解题目中给的5%是什么意思。

题目中的重点

从题目中策略问题知第四问是本题中重点

问题一

请做数据清洗工作,指出异常值缺失数据以及处理方法。对数据做描述性统计分析,包括目标客户对于不同品牌汽车满意度的比较分析
要做的工作:

  1. 找到异常值和缺失数据
  2. 处理异常值和缺失数据:不能简单的删除,而是要通过一些方法进行缺失值的可能数据的预测
  3. 数据进行统计分析:平均值,最大值,最小值,数据区间,占比…
  4. 不同品牌汽车满意度的比较分析:题目中强调不同品牌,暗示要分品牌进行处理,3个满意度方面有无明显差异,哪个品牌满意度高?

注意:
题目给出大量数据时,就算题中没有要求进行数据清洗也要进行!!!主要处理异常值和缺失值,处理时候也不要单纯的进行删除,会让老师觉得你有点low)。
在有多个品牌的题目中,就算题目未要求比价分析也要进行比较。
第一题不是重点题目,论文中占比不要太大

问题二

  决定目标客户是否购买电动车的影响因素有很多,有电动汽车本身的因素,也有目标客户个人特征的因素。在这次目标客户体验活动中,有部分目标客户购买了体验的电动汽车(购买了用1表示,没有购买用0表示)。结合这些信息,请研究哪些因素可能会对不同品牌电动汽车的销售有影响?
要做的工作:
分三个品牌,分别分析每个数据是不是影响购买还是不购买:(是一个二分类问题购买时第一类,不购买是第二类)数据有两种,一种连续变量一种是分类变量,分25次各自研究与够不够买的关系即可
e.g.
连续变量:评分,年龄…
分类变量:性别(类似男用0女用1代替),工作(给几类工作用0-7分别表示之类的)

问题三

  结合前面的研究成果,请你建立不同品牌电动汽车的客户挖掘模型,并评价模型的优良性。运用模型判断附件3中15名目标客户购买电动车的可能性
要做的工作:

  1. 建立模型:最好不选用深度学习网络,因为不好解释
  2. 评估模型优良性:准确性,损失函数,稳定性等…
  3. 预测:实验结果要用表格给出

问题四

  销售部门认为,满意度是目标客户汽车体验的一种感觉,只要营销者加大服务力度,在短的时间内提高a1-a8五个百分点的满意度是有可能的,但服务难度与提高的满意度百分点是成正比的,即提高体验满意度5%的服务难度是提高体验满意度1%服务难度的5倍。基于这种思路和前面的研究成果,请你在附件3每个品牌中各挑选1名没有购买电动汽车的目标客户,实施销售策略。
要做的工作:
建立优化模型
目标:使目标客户购买且服务难度难度最小
约束:满意度有最高<=100

问题五

根据前面的研究结论,请你给销售部门提出不超过500字的销售策略建议。
注意:要使用一二三四问重结果进行分析

现在数学建模比赛题目基本都是循序渐进进行的,就是后一问会使用前一问的结果

可用方法总结

问题一

查找异常值不能直接说观察到,或者excel筛选出来的
缺失值 异常值处理:聚类,KNN,近邻算法…
异常值中比如小数点错位可以直接纠正,简单说明就行,不用特意再用算法进行预测

问题二

注:

  1. 不能使用 logistic 回归,因为数据中有连续变量和分类变量两种,logistic 回归处理的数据只能是其中一种
  2. 主成分分析法和因子分析法使用条件:首先数据之间线性相关,其次所有变量是连续性变量(数据尽量服从正态分布),所以在本题中使用是错误的。
    是一个相关性分析问题

二三问这种题,只对其中一个品牌进行详细分析即可,其他品牌直接给出结果。(可以理解为不同品牌营销方向不同,所以评分分布不同,需要分别统计)

分类变量和分类变量的相关性判断:独立性检验

问题三

很多人会选择机器学习的方法,使用时应注意:

  1. 交代清楚 input 和 output 都是什么
  2. 迭代次数,学习率等超参数写清楚,最好也写清楚是怎么调整的参数
  3. 神经网络有多少层 每层多少个结点 为什么选择这样设置
  4. 由于神经网络没有数学模型,所以评价标准很重要。准确率,损失函数,稳定性评价指标最好都有,选择什么样的计算公式要写清楚

更推荐使用有数学模型的方法:
logistic回归,probit,决策树,贝叶斯决策

只对其中一个品牌进行详细分析即可,其他品牌直接给出结果。

  • 13
    点赞
  • 45
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

浪里摸鱼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值