2021年MathorCup高校数学建模挑战赛——大数据竞赛A题

赛道 A:二手车估价问题

随着我国的机动车数量不断增长,人均保有量也随之增加,机动 车以“二手车”形式在流通环节,包括二手车收车、二手车拍卖、二手 车零售、二手车置换等环节的流通需求越来越大。二手车作为一种特 殊的“电商商品”,因为其“一车一况”的特性比一般电商商品的交易要 复杂得多,究其原因是二手车价格难于准确估计和设定,不但受到车 本身基础配置,如品牌、车系、动力等的影响,还受到车况如行驶里 程、车身受损和维修情况等的影响,甚至新车价格的变化也会对二手 车价格带来作用。目前国家并没有出台一个评判二手车资产价值的标 准。一些二手车交易平台和二手车第三方估价平台都从自身的角度建 立了一系列估价方法用于评估二手车资产的价值。

在一个典型的二手车零售场景,二手车一般通过互联网等线上渠 道获取用户线索,线下实体门店对外展销和售卖,俗称 O2O 门店模式。门店通过“买手”从个人或其他渠道收购二手车,然后由门店定价 师定价销售,二手车商品和其他商品一样,如果定价太高滞销也会打 折促销,甚至直接以较低的价格打包批发,直至商品最终卖出。

基于以上背景,请你们团队根据附件给出的数据,通过数据分析 与建模的方法帮助二手车交易平台解决下面的问题:

初赛问题

问题 1:基于给定的二手车交易样本数据(附件 1:估价训练数据),选用合适的估价方法,构建模型,预测二手车的零售交易价格, 数据中会对 id 类,主要特征类等信息进行脱敏。主要数据包括车辆基础信息、交易时间信息、价格信息等,包含 36 列变量信息,其中

15 列为匿名变量。字段如下:

序号

Features

Description

1

carid

车辆 id

2

tradeTime

展销时间

3

brand

品牌 id

4

serial

车系 id

5

model

车型 id

6

mileage

里程

7

color

车辆颜色

8

cityId

车辆所在城市 id

9

carCode

国标码

10

transferCount

过户次数

11

seatings

载客人数

12

registerDate

注册日期

13

licenseDate

上牌日期

14

country

国别

15

maketype

厂商类型

16

modelyear

年款

17

displacement

排量

18

gearbox

变速箱

19

oiltype

燃油类型

20

newprice

新车价

21

anonymousFeature

15 个匿名特征

22

price

二手车交易价格(预测目标)

请采用附件 1 中的估价训练数据带标签训练模型和测试模

型,自行设置测试集,使用训练完成后的模型对附件 2 中的估价验证数据(不带标签)进行预测,并将预测结果保存在附件 3“估价模型结果文件中,注意不要修改格式,单独上传到竞赛平台。其中附件 1“估价训练数据和附件 2“估价验证数据只相差最后1 列数据二手车交易价格(预测目标)),附件 3“估价模型结果文件字段如下:

 

问题 2:在门店模式中,车辆在被“买手”收车以后,会进入门店进行售卖,车辆能否成功交易,除了取决于销售的谈判技巧,更重要  的是车辆本身是否受消费者青睐,价格是否公道。假设你们是门店的  定价师,请你们结合附件 4“门店交易训练数据”对车辆的成交周期(从车辆上架到成交的时间长度,单位:天)进行分析,挖掘影响车辆成  交周期的关键因素。假如需要加快门店在库车辆的销售速度,你们可  以结合这些关键因素采取哪些行之有效的手段,并进一步说明这些手  段的适用条件和预期效果。

附件 4“门店交易训练数据包括 6 个字段,如下表所示,其中所carid 等相关信息包含在附件 1“估价训练数据中。各字段间采用“\t”分隔符分割,不包含表头。

问题 3:依据给出的样本数据集,你们觉得还有哪些问题值得研究,并给出你们的思路?

将问题 1、2、3 的解决过程写成一篇论文,明确你们的思路、模型、方法和结果。

2021五一数模A思路+参考资料+a代码疫苗生产优化问 1:本需要对于每箱疫苗在所有工位上的生产时间进行描述性统计分析,由于先前对于 不同类型的疫苗进行模拟实验,根据已经掌握的实验数据直接进行描述性分析即可。可以通过 EXCEL、SPSS、R 语言等数据处理软件直接进行分析,建议分析完成之后分别对于均值、方差、 最值、概率分布等不同的指标解释其数理意义以及描述不同工位生产疫苗的能力水平,方便为下一 步的研究打基础。难点在于数据的处理。 问 2:根据附件中所给出的数据,先对其所有的数据求出平均值。将平均值作为参考指标。 目中原先说明必须按照 CJ1-CJ2-CJ3-CJ4 的顺序完成 4 个工位都进行了加工才算加工完成。当一 种疫苗进入生产步骤之后,必须完成该步骤的生产才可以安排下一种疫苗进入。由于目标函数是实 现生产时间最短,本提供两种可选方案,原理相通。一、可以选择使用 LINGO 软件安排最优线 路,设定每一个步骤所需要实现的时间长短以及该疫苗所需要完成加工的总时间,尽可能实现每一 个加工步骤都有不同类型的疫苗在进行加工,如果每一个加工步骤都能保证中间加工的空挡不断层, 即可实现加工效率的最优化。二、最优化算法中可以使用 TSP 算法安排最优的线路,通过该算法 也可以获得最优的加工顺序。要点在于本选用生产的平均值作为参考指标,大大降低了计算步骤 的难度。难点在于计算好每一类型的疫苗加工生产过程中所需要的总时间和不同加工步骤之间相距 的时间差的,其中的变量在于不同的疫苗进入加工步骤的顺序。加工步骤不可以变动顺序。 问 3:本与问 2 最明显的区别就是每个工位生产疫苗的时间不再使用平均值来进行代替 了。问 1 种研究了不同的指标来反映不同工位生产疫苗的能力水平,可以在其中进行选取即可完 成时间变量的选择。目要求交货总时间比问 2 的总时间缩短 5%,即在原先问的基础之上进 行优化目标。根据优化算法来进行生产顺序调度安排,本建议使用禁忌搜索算法来寻求最优解, 该算法可以避免陷入局部最优。求解过程与问 2 相近,不再赘述。确定完成生产顺序之后,由于 生产的每一个过程中的时间并不是一个确定值,而是分布于一个相近的区间内,所以可以通过区间 估计来确定概率数值。本也可以使用遗传算法进行求解,确定完成遗传算法的变异率,通过代码 的计算可以完成。 问 4:本再次引入新的限制条件,限制生产条件和生产时间。每一天时间长度为 16 小时, 且要求必须完成某一种疫苗的全部生产过程才可以开始生产别的种类的疫苗。生产时间长度可以使 用问一中给出的相关指标变量从而确定单一产品的时间。当确定完成时间之后,分别对于所有的 产品生产的时间进行计算即可得出所需要的生产时间。时间指标可以是一个变动的过程,由于生产 的时间必须为天数的整数单位(达不到一天按一天计算,若一天内能完成两项任务,可以一天安排 两种疫苗的生产),生产任务不可以拆分,所以需要读者有耐心选择正确的计算方法计算出不同疫 苗产品的生产时间以及规划不同疫苗的生产周期。由于已经限定了可靠性为 90%,生产时间最短 即可。使用不同疫苗产品的生产总时间作为目标变量,通过调动不同的疫苗产品作为自变量的生产 过程,确定约束条件即可计算出预期时间。 问 5:安排生产计划是一项运筹规划类型目。根据附件给出的不同疫苗产品的报价、生产 疫苗所需要的时间、不同产品疫苗的最大任务数量进行线性规划,难点在于线性规划的约束条件是 函数关系,根据生产单一疫苗所需要的时间进行确定相关参数。销售额=疫苗的出厂价格×出厂数 量,则控制不同的疫苗的产量可以通过神经网络模型等深度学习算法进行自动求解。规划模型的条 件和生产的顺序可以通过模型计算过程自动求得最优解。由于神经网络模型自身容易陷入局部收敛 的死循环中,可以加入优化算法对该模型进行优化。切记全文所使用的优化算法一定不能重复。可 以参考:遗传算法、蚁群算法、粒子群算法等。 备注:由于生产过程的不确定性,所以生产单一疫苗的时间确定需要根据实际模拟的数据进行 确定。目中问 2 要求使用平均值进行确定,别的目仍然可以使用,但是有能力的话建议使用 别的指标进行确定。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值