先说结果
笔者今年大二,参加了上届的泰迪杯数据挖掘技能赛,也是大学第一次参加比赛,最后结果是A题未获奖,B题一等奖。下面来简单介绍一下我们的参加经历,讲讲比赛总结。
队员配置
两人大二、一人大一,专业是自动化/机械。
不过这并不意味着什么专业都可以参赛,我们三人都有python的基础。显然参赛前需要预先学习和准备相关编程知识,也要有对数据挖掘和数据处理有一定的概念。
学习&准备过程
第一次尝试做泰迪杯真题是10月初,当时在做18年的B题,笔者一口气做了七天,一个人每天两三小时做完了。我觉得第一次的实战经验是很重要的,比赛的准备可以从实战先开始。当然,当时对数据分析、数据挖掘一窍不通,可以说是走了很多弯路,很多部分都是面向CSDN编程。其中有个雷坑就建议大家不要走了,当时代码大量学习了 @蘑菇果实使用者=w= 的博客,结果可以说是走了很多弯路。。。
十月末和十一月初就和队友们经常来实验室一起敲代码、做真题、总结套路。最后一周做了19年的两道题,其中大量学习和运用了numpy、pandas、matplotlib的用法和套路,可以说是非常重要。
比如以下部分:
#2018Btask1_2
SaleList = [line.rstrip('\n').split(',') for line in open('result\\'+file,'r')]
TimeList = [line[5