达观杯文本智能处理挑战赛冠军解决方案

之前整理了一份自己的Rank 4的解决方案,并开源了部分代码,这次分享一下朋友整理的"达观杯"文本智能处理挑战赛冠军的解决方案,希望对新手小白有所帮助~~

作者:NLP幼儿园

知乎:https://www.zhihu.com/people/he-jia-wei-58-19/activities

鄙人乃NLP学习者一枚,刚接触比赛圈不久,实乃小萌新一枚,遂起名NLP幼儿园。读研期间忙着学习和发文章,灌了几篇水文,也有了一些经验,然而没有拿得出手的文章,今年运气爆棚,和一个大神(yuquanle)投了一篇IJCAI,没想到中了,exciting!兴奋之余,正好处于时间空档期,就看见这个比赛,于是抱着学习的心态来参加。没想到运气再次爆炸,拿了个冠军,学习到了很多,但是最重要是,认识了一群很厉害的朋友,感谢我的队友(鹏哥,晓菲,小粤,涛哥)以及认识的小伙伴(ps:他们队伍拿了季军)。看到小伙伴整理了他们的解决方案:“达观杯”挑战赛,第四名解决方案。于是乎, 我们队也整理了一份冠军的解决方案,方便大家学习,也算是对这个比赛的总结。

竞赛背景:

  • 2018年人工智能的发展在运算智能和感知智能已经取得了很大的突破和优于人类的表现。而在以理解人类语言为入口的认知智能上,目前达观数据自然语言处理技术已经可以实现文档自动解析、关键信息提取、文本分类审核、文本智能纠错等一定基础性的文字处理工作,并在各行各业得到充分应用。
      

  • 自然语言处理一直是人工智能领域的重要话题,而人类语言的复杂性也给 NLP 布下了重重困难等待解决。长文本的智能解析就是颇具挑战性的任务,如何从纷繁多变、信息量庞杂的冗长文本中获取关键信息,一直是文本领域难题。随着深度学习的热潮来临,有许多新方法来到了 NLP 领域,给相关任务带来了更多优秀成果,也给大家带来了更多应用和想象的空间。  

  • 此次比赛,达观数据提供了一批长文本数据和分类信息,希望选手动用自己的智慧,结合当下最先进的NLP和人工智能技术,深入分析文本内在结构和语义信息,构建文本分类模型,实现精准分类。未来文本自动化处理的技术突破和应用落地需要人工智能从业者和爱好者的共同努力,相信文本智能处理技术因为你的算法,变得更加智能!

比赛网址:
http://www.dcjingsai.com/common/cmpt/%E2%80%9C%E8%BE%BE%E8%A7%82%E6%9D%AF%E2%80%9D%E6%96%87%E6%9C%AC%E6%99%BA%E8%83%BD%E5%A4%84%E7%90%86%E6%8C%91%E6%88%98%E8%B5%9B_%E7%AB%9E%E8%B5%9B%E4%BF%A1%E6%81%AF.html

解决方案:

最后附上小伙伴的gayhub: https://github.com/ShawnyXiao/2018-DC-DataGrand-TextIntelProcess

需要PPT的可以在以上链接找到,

也可以关注订阅号[AI算法之心],在后台回复关键词"DG1stPPT"自取~~

推荐阅读

Recommended reading

书籍推荐:Machine Learning Yearning

|“达观杯”挑战赛,第四名解决方案

| 文本自然语言处理简介


关于我们

AI算法之心是一个介绍python、pyspark、机器学习、自然语言处理、深度学习、算法竞赛的平台。不管你是刚入门的小白,还是资深的算法大佬,欢迎扫一扫下方的二维码与我们在AI的领域中一起学习成长!

喜欢我就给我好看吧

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值