【2020数模F奖】 美赛C题参赛感受及做题思路记录【编程手的角度,含大量代码及参考链接】

 

目录

 

写在前面的话

题目分析

【数据清洗】

【NLTK】

【第一题】

【第2题e问】

【词云】---wordcloud包

【TF-IDF算法】

【第2题a、b、c问】需要先对评论数值化

【Textblob分析文本】

【熵权法确定权重】

【第2题 b、d问】

【datetime库】

【Matlab的ga函数求对数似然估计值】


2021年2月2日更新

想来是最近美赛快到了,各位学弟学妹们开始学习之前的题目,所以这篇文章开始有了评论私信要代码和论文的,我都没有回,在此表示抱歉,

论文不是我写的,我觉得我没有权利给你们,非常抱歉!(卑微鞠躬)

关键代码我自认为在博客里面写清楚了,要了我的代码也是差不多的,每个代码块所用到的知识我都给出相应链接了,自己再去搜一搜学学知道有什么功能、怎么用就可以了,大部分的代码实现我也都是比赛那几天才去学的。(^-^)V

最后,祝各位旗开得胜,幸福快乐每一天~

------------------------------------------------分隔线------------------------------------------------------------------------

写在前面的话

本篇博文为博主参加完美赛两天后所写,是否获奖并不知道,模型不算太优秀,本篇只在编程手实现模型的角度来写,记录参赛过程中遇到的问题及解决方法、感受等,并给出相关的参考博客。完赛两天过去了,博主记忆力有点差,很多细节记不清了,就写个大概,方便日后自己看。。。

--------------更新:已获F奖。第一次参加美赛,不出意外的话应该也会是最后一次参加的数模比赛,还是挺满意的---------------------

【题目及所给数据】

链接:https://pan.baidu.com/s/1nYMiLxLOVarIegT-Qs6ehg 
提取码:j6vo

或者你可以看这位朋友的博客:

2020 MCM Weekend 2 Problem C,2020美赛C题——完整版题目:完整版题目
2020 MCM Problem C Translation,2020美赛C题——详细版翻译:详细版翻译

【参赛感受】(一堆废话)

大三下啦,按队友的话说是数模比赛参加完一场就少一场了。之前参加国赛的时候,信誓旦旦地说“干完这一票老子再也不要搞数模了!”,哈哈哈哈哈哈哈哈哈哈,真香。最后还是好了伤疤忘了痛,跟着队友参加了。

而且,这次比赛竟然莫名其妙地香!或许是因为在家闲太久,突然有这种充实的感受很是满意,或许是之前接触过一点简单的文本分析的内容,代码写起来比较顺利,又或许是因为大部分代码用的是python写的,debug的过程比matlab快上好几倍,少了很多自我怀疑的过程!(平时除了数模实在不会用到matlab,每次用都是时隔好久又生疏了)(python真是个好的语言!O(∩_∩)O !)

完赛之后还是有些遗憾的。

因为模型建的比较慢,中文版论文写完还得翻译成英文版的,再调格式什么的,最后论文很赶。图做好了,论文手来不及换上去,唉,好可惜。所以奉劝各位以后要参加美赛的朋友,论文一定要早点写啊,论文格式提前搞好呀!如果有时间,用Latex写据说会好点。

为什么我们进度那么慢呢?我觉得一方面可能因为在家建模,大家前期有点松散了,另一方便可能是建模手受到我们指导老师的影响,反而乱了步调。怎么说呢,我们指导老师蛮负责的,只不过参加过数模的朋友应该清楚,模型一旦建出来实现出来,又要修改的话有时候挺花时间的。如果你的指导老师是在建模之前给你透解题思路,你可以好好考虑一下他的思路,如果是在你模型已经花时间想得差不过,并且已经在一定程度上实现出来的时候,就要好好斟酌一下了。老师给的意见能改则改,不能改,或者改需要花很多时间的花,就果断放弃吧。因为题目可能不止需要你建这一个模型!而且,如果你在其中一题上花太多心思,而导致论文没写完,可是连安慰奖都没有的!在博主水了几个数模比赛并得了几个水奖的经验来看,不管你的模型有多垃圾,多简单,多胡扯,只要你把所有题都完整地扯出来,并且有几个看起来还不错的结果,看起来还可以的图,并且论文没有太大的错误,得奖的可能性还是蛮大的!所以如果模型不好,就多在论文上花时间,把图搞得漂亮一点,无论如何,完赛就有希望!

 

 

题目分析

【再次提醒,我是以编程手的角度去理解的,解题思路并没有按题所给的顺序,着重在实现,不在原理】

这个题目大概说的是有一个公司,打算卖吹风机、微波炉和奶嘴。然后丢给你一些亚马逊上的其他竞争对手们的评论(评论带星级等信息),让你去分析。帮他的公司制定销售计划和分析受欢迎的产品特性等。

乍一看,我们以为会是经济类的题,因为我的两个队友都是经管学院的,所以觉得可能会比较擅长,就选了这题。

但其实这题更多的还是得从自然语言处理的角度来分析。

所给的评论信息如下ÿ

  • 28
    点赞
  • 191
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值