2020年美赛C题思路详解

代码已经放在github上,本人水平有限

这是上一篇翻译的文章

题目分析以及思路

a题

Identify data measures based on ratings and reviews that are most informative for Sunshine Company to track, once their three products are placed on sale in the online marketplace.

题目中明确说明了1.基于ratings和reviews。2.在上线售卖后的影响

  1. 那么应该怎么做呢。首先是确定相关性。分析数据我们可以知道,给的数据中review_body无疑是最重要的review。它和star_rating的关系是挖掘中的基础。你如果模型建立出来这两个没有极强的正相关肯定说明你模型搭错了。
  2. customer_id和total_votes是这个题可以扩展的点

工具推荐

有很多小伙伴私信我说没有做这方面的经验而且小组里面的代码手不熟悉nlp
我给大家提供一些集成的nlp分析工具使用

企业级别的(中文英文都有):

  1. bonos
  2. 腾讯
2019美赛B是关于城市交通拥堵问的,具体要求是: 给出一个城市的路网信息,包括道路长度、车道数量、车道速度、车道容量等参数,以及起点和终点,要求设计一种路径规划算法,使得从起点到终点的时间最短,并且在过程中尽量避免交通拥堵。 以下是我对这道目的思路: 1. 建立路网模型 首先需要建立一个路网模型,这可以用图论中的图来表示,其中路口为节点,路段为边。每条边需要记录长度、车道数量、车道速度、车道容量等信息。 2. 统计交通流信息 在模型上模拟车辆的行驶过程,统计每个路段上的交通流信息,即实际通过该路段的车辆数量和速度。这个过程需要考虑车辆的转弯、加速、减速等操作,以及交通灯等交通控制设施的影响。 3. 建立动态规划模型 根据统计得到的交通流信息,建立一个动态规划模型。其中状态表示为从起点到当前节点的最短路径和当前节点的交通流信息,决策为选择下一条边。根据路段的交通流信息,可以计算出每个路段的通行时间,从而得到路径的总时间。 4. 优化模型 为了避免交通拥堵,可以在模型中加入一些约束条件。例如,限制某些路段的车辆流量,或者调整交通灯的时序。 5. 实现算法并进行实验 将上述模型实现为算法,并在给定的数据集上进行实验。可以通过比较算法计算出的路径时间和实际行驶时间的差距来评估算法的效果,并进一步优化算法。 总之,这道目需要综合考虑很多因素,包括路网结构、交通流量、交通控制设施等等,需要借助图论、动态规划、优化等多个领域的知识来解决。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值