2020年第十届MathorCup高校数学建模挑战赛题目
A题 无车承运人平台线路定价问题
题目详情附件及源码下载请关注公众号“不太灵光的程序员”回复关键字“MC2020A”
对代码存在疑问,请在公众号留言,我会及时和您取得联系。
问题 1:通过定量分析的方法,研究影响无车承运人平台进行货运线路定价的主要因素有哪些,并说明理由。问题 2:根据附件 1 数据,通过建立数学模型,对已经成交货运线路历史交易数据中的定价进行评价。问题 3: 建立关于线路定价的数学模型,给出附件 2 的线路任务的三次报价以及总成本定价,并填充在附件3 的表格中;给出你们的调价策略;评价你们对附件 2 的线路任务所给出的定价。
其中附件 3 的表格以 Excel文件形式,连同论文答卷一起上传至参赛系统,请勿改变附件 3 中各任务ID 的原有顺序。
附件 3 将用于测试报价的准确性,对于某个确定的任务,三次报价中有一次成交,则后续价格将不再考虑。附件 1:货运线路历史交易数据附件 2:待定价的货运线路任务单附件 3:计算结果 三个问题分别是对特征间的相关性、 给出定价的评价指标、预测总成本以及三次定价三个方向进行考查的,下面我们先对问题1进行解释。 分析过程 1、数据预处理(数据清理) 数据预处理可以分为以下5个步骤,结合代码我们来说明如何进行相关性分析的:1.1 读取给定的数据
1.2 处理特征数据与问题无关的特征
1.3 数据整合
1.4 数据分类编码
- 1.5 清洗后的数据存储
从不同存储文件中读取数据集,预览数据集,观察特征数据。
题目提供了附件1:货运线路历史交易数据.xlsx的数据集文件,在我们自己进行分析时,大多情况还需要自己去爬取数据,建议将数据保存成csv文件在进行分析。
做数据分析时基础数据会有多种存储形式。可能是txt、csv 、excel文件。
txt 和 csv 可以使用 pandas.read_csv 进行加载;
excel 可以使用 pandas.read_excel 进行加载,当然也可以借助模块 xlrd 和 xlwt 数据读写。
操作 excel 要比操作 csv 更耗时,推荐使用csv处理中间数据。
源代码:
def data_load(file_name):"""
加载数据
:param file_name:
:return:
"""
types = file_name.split('.')if types[-1] == 'csv':
df = pd.read_csv(file_name)elif types[-1] == 'txt':
df = pd.read_csv(file_name)elif 'xl' in types[-1]:
df = pd.read_excel(file_name)# 打开文件 需要注意 时间读取的问题# data = xlrd.open_workbook(file_name)# table = data.sheet_by_index(0)# data_lists