groupby时间的年_【MathorCup】2020年 A题 无车承运人平台线路定价问题,特征间的相关性分析...

该博客主要探讨了MathorCup2020年A题——无车承运人平台线路定价问题。文章涉及数据读取、特征处理、数据清洗、存储以及相关性分析,特别是强调了不同数据格式读取时的注意事项,如Excel中时间类型的处理。此外,博主分享了如何构建定价模型,并提出了调价策略和定价评价方法。
摘要由CSDN通过智能技术生成
点击蓝色“不太灵光的程序员”关注我哟 加个“星标”,每天上午 08:00,干货推送! e033da63fc673d1ec4c9df9acb53ddda.png

2020年第十届MathorCup高校数学建模挑战赛题目

A题 无车承运人平台线路定价问题 

题目详情附件及源码下载请关注公众号“不太灵光的程序员”回复关键字“MC2020A”

对代码存在疑问,请在公众号留言,我会及时和您取得联系。

问题 1:通过定量分析的方法,研究影响无车承运人平台进行货运线路定价的主要因素有哪些,并说明理由。问题 2:根据附件 1 数据,通过建立数学模型,对已经成交货运线路历史交易数据中的定价进行评价。问题 3: 建立关于线路定价的数学模型,给出附件 2 的线路任务的三次报价以及总成本定价,并填充在附件3 的表格中;给出你们的调价策略;评价你们对附件 2 的线路任务所给出的定价。

其中附件 3 的表格以 Excel文件形式,连同论文答卷一起上传至参赛系统,请勿改变附件 3 中各任务ID 的原有顺序。

附件 3 将用于测试报价的准确性,对于某个确定的任务,三次报价中有一次成交,则后续价格将不再考虑。附件 1:货运线路历史交易数据附件 2:待定价的货运线路任务单附件 3:计算结果 三个问题分别是对特征间的相关性、 给出定价的评价指标、预测总成本以及三次定价三个方向进行考查的,下面我们先对问题1进行解释。 分析过程 1、数据预处理(数据清理) 数据预处理可以分为以下5个步骤,结合代码我们来说明如何进行相关性分析的:
  • 1.1 读取给定的数据

  • 1.2 处理特征数据与问题无关的特征

  • 1.3 数据整合

  • 1.4 数据分类编码

  • 1.5 清洗后的数据存储
1.1. 读取给定的数据

从不同存储文件中读取数据集,预览数据集,观察特征数据。

题目提供了附件1:货运线路历史交易数据.xlsx的数据集文件,在我们自己进行分析时,大多情况还需要自己去爬取数据,建议将数据保存成csv文件在进行分析。

做数据分析时基础数据会有多种存储形式。可能是txt、csv 、excel文件。

txt 和 csv 可以使用 pandas.read_csv 进行加载;

excel 可以使用 pandas.read_excel 进行加载,当然也可以借助模块 xlrd 和 xlwt 数据读写。

操作 excel 要比操作 csv 更耗时,推荐使用csv处理中间数据。

源代码:

def data_load(file_name):"""
加载数据
:param file_name:
:return:
"""
types = file_name.split('.')if types[-1] == 'csv':
df = pd.read_csv(file_name)elif types[-1] == 'txt':
df = pd.read_csv(file_name)elif 'xl' in types[-1]:
df = pd.read_excel(file_name)# 打开文件 需要注意 时间读取的问题# data = xlrd.open_workbook(file_name)# table = data.sheet_by_index(0)# data_lists

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值