第八届“泰迪杯”数据挖掘挑战赛的一点心得

本文作者分享了参加第八届“泰迪杯”数据挖掘挑战赛的心得,团队凭借在“智慧政务”中的文本挖掘应用获得一等奖。文章介绍了团队分工、赛题解析与建模过程,包括多标签文本分类问题的TextCNN与BERT模型应用,以及可解释性指标的构建。此外,还提到了在建模过程中遇到的困难和解决办法。
摘要由CSDN通过智能技术生成

第八届“泰迪杯”数据挖掘挑战赛的一点心得

前言

  大三下学期,我和我的两位队友一起参加了第八届“泰迪杯”数据挖掘挑战赛,我们选择了C题——“智慧政务”中的文本挖掘应用”,最后获得了一等奖,也算一个比较满意的成绩吧。今天获奖证书到了手上,也该对其做一个总结,然后继续前进。

小目录

本文接下来将由以下几个模块进行展开

  1. 团队分工
  2. 赛题解析与建模
  3. 困难
  4. github地址

part1 团队分工

  我们团队一共有三名队员(我,队员A,队员B),均来自山东大学17级计算机科学与技术学院。我和队员A负责赛题分析,建模,与编程实现,队员B负责论文的论文查找、写作数据、结果的可视化,论文的润色由我们三人共同负责。
  我和队员A都在山大的信息检索实验室,主要研究NLP方向。在实验室的两年,一定量的ML、DL的文献阅读,多个项目的复现,让我们对各个模型的功能,优缺点有一定的了解,并让我们能够独立使用tensorflow、pytorch等工具完成模型的搭建。所以在本次比赛中,C题也正是NLP方向的问题,可以说是运气不错正中下怀,所以我们快速确定题目(对于A、B还是需要各自独立阅读一遍),避免花费大量的时间在选题上。
  由于我和A同学都能够独立的建模与编程,如果同时做相同小题目比较浪费时间与精力,并且最重要的,当两个人的观点出现不同的时候会影响进度。所以我主要负责第一小题与第三小题的可

  • 4
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值