首届全国开源标注大赛算是结束了,这里记录下也吐槽下,希望能帮到以后的学弟学妹。
小组&比赛情况
虽然报名的要求可以十个人一组,但是我们小组只有四个。语言方向的话有C++、Java、Python,我们选的是Java,需标注的项目有三个,Weka机器学习的Clusterer聚类模块、Andriod的原生音乐模块、华为ServiceComb里Swagger子项目的generator模块。队伍的话有差不多200支队伍参赛。
比赛结果
有些遗憾,离特等奖就差零点零几分,有些生气,虽然是一等奖里的第一名,但是就因为那零点零几分就少拿了六千块钱。特等金奖是武大的,有点秀,特等银奖湘大黑马,特等铜奖不知道是什么情况,国科大与其他学校的混合组?。。。
个人吐槽
不足的话,就是感觉这个比赛太肝了,真想叫他肝帝大赛,一个月的比赛时间不停息,由于我们小组人太少,所以自己不得不每天肝到凌晨两三点(白天要上课),最迟的一次直接肝到凌晨4:30。一个月完后还没结束,还有10天要互评+写报告,一共40天,所以如果要参加请务必保证小组人数&质量或者一个较好的肝。 由于小组人少,实力有些不齐,所以队长就要多肝点,同时要保证质量,就个人而言的话,一个月输出了差不多三千个注释,可能接近八九万字
优点的话,锻炼自学能力?其实也还好,不知道算不算是锻炼,Weka差不多自学了两天多,安卓的自学了一天,Swagger差不多自学了三天,然后和小组分享成果,开始标注。这个比赛有一个好处,就是让一个小白的自己突然体验一入源码深似海的滋味,然后以一个较快的速度磨灭你对源码的 "头疼",然后你比完赛后再去看spring的源码,你会发现,啊,其实spring也还好,不是特别多。。。当然前提是得投进心去标源码的注释,而且最好源码的每个地方你都有标注过。还有一个好处是这开源标注有可能会帮到自己学校课题或者是其他项目,比如这次标注的Weka,发现在一些项目的推荐算法上还是挺有用的。
一些建议
- 不要想着靠标注数量取胜,但也不要轻视标注数量,要保证好数量和质量的平衡
- 务必要把报告写好,报告也占了45%的分数,我们小组的遗憾就是因为后期人少,报告写的慢,只写了一万七千多字,所以后期在报告上很吃亏,比如我们这次的血亏
- 写报告的时候务必要统一好组员的报告格式,合并报告的时候因为格式上和报告质量上的问题这里帮忙改,那里帮忙改,最后改的直接干脆全部把组员写的删了,自己又重新开始写
- 可以把项目导入到IDE里查看,这样阅读源码效率会比直接去那平台高很多