从情感分析到用户画像，CCF大数据与计算智能大赛作品源码资料整理

最新推荐文章于 2022-07-18 21:14:31 发布

大数据挖掘DT数据分析

最新推荐文章于 2022-07-18 21:14:31 发布

阅读量3.6k

点赞数 3

向AI转型的程序员都关注了这个号???

大概的调研情况如下：

比赛官网 http://www.datafountain.cn/#/home

比赛主要涉及大数据与人工智能领域，这是比较新的领域，这个比赛的先进性以及后期的发展潜力是毋庸置疑的。其次，比赛的出题企业也是非常优质的。去年的主办方邀请了国家电网、蚂蚁金服、搜狗这种重量级的企业，可以体会到比赛坚强的后盾和企业对于这个比赛的巨大期望。最后，在比赛的规模与影响力方面，这个比赛用了仅仅三四年时间已经可以号召近3万的用户，并且基本全部为计算机行业的数据人才，可以看出这个比赛的磅礴的生命力。所以这个比赛还是很值得参加的。（单单从奖金来看，也很具有诱惑力）

0）基于主题的文本情感分析赛题

以网上电商购物评论为例，原始的主题模型主要针对篇幅较大的文档或者评论句子的集合，学习到的主题主要针对整个产品品牌；而现实情形是，用户评论大多针围绕产品的某些特征或内容主题展开（如口味、服务、环境、性价比、交通、快递、内存、电池续航能力、原料、保质期等等，这说明相比于对产品的整体评分，用户往往更关心产品特征），而且评论文本往往较短。

本次大赛提供脱敏后的电商评论数据。参赛队伍需要通过数据挖掘的技术和机器学习的算法，根据语句中的主题特征和情感信息来分析用户对这些主题的偏好，并以<主题，情感词>序对作为输出。

GitHub https://github.com/digfound/CCFCompetition

1）O2O 赛题
wepon、天音和charles提供的CCF O2O比赛第一名的全套代码和资料：
https://github.com/wepe/O2O-Coupon-Usage-Forecast

2）农产品价格预测赛题
CCF农产品价格预测线上rank2代码
https://github.com/xing89qs/CCF_Product

线上第5，决赛答辩逆袭为第1名的团队
https://github.com/ziminghuang/futuredata-ccf2016

复赛第35名的团队：
https://github.com/wqlin/ccf-price-prediction

3) 客户用电异常行为分析
线上第4名的代码。这个队伍非常强悍，只提交很少的几次，而且最后3天都没提交，还一直前5名。同时，他们还是搜狗比赛的二等奖。
https://github.com/AbnerYang/2016CCF-StateGrid

本文来自微信公众号 datadw 【大数据挖掘DT数据分析】

4）搜狗的用户画像比赛
线上第3名的TNT_000，同时也是上面客户用电异常行为分析比赛的二等奖。
https://github.com/AbnerYang/2016CCF-SouGou

线上第5名的The Right队伍的代码和决赛答辩PPT，而且他们还给出了数据下载地址，大赞。同一个团队的几个人分别开源了，链接如下：
https://github.com/dhdsjy/2016_CCFsougou2
https://github.com/dhdsjy/2016_CCFsougou
https://github.com/prozhuchen/2016CCF-sougou
https://github.com/coderSkyChen/2016CCF_BDCI_Sougou

复赛第14名的团队：
https://github.com/admu/CCF_sougou

5）联通的用户轨迹赛题
利用运营商用户数据，提供互联网金融领域内的创意数据产品方案https://github.com/xuguanggen/2016CCF-unicom

6）Human or Robot

决赛第6名
https://github.com/pickou/ccf_human_or_robot

人工智能大数据与深度学习

搜索添加微信公众号：weic2c

长按图片，识别二维码，点关注

大数据挖掘DT数据分析

搜索添加微信公众号：datadw

教你机器学习，教你数据挖掘

长按图片，识别二维码，点关注

大数据挖掘DT数据分析

关注

3
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
从情感分析到用户画像，CCF大数据与计算智能大赛作品源码资料整理

向AI转型的程序员都关注了这个号???大概的调研情况如下：比赛官网 http://www.datafountain.cn/#/home比赛主要涉及大数据与人工智能领域，这是比较新的领域，这个比赛的先进性以及后期的发展潜力是毋庸置疑的。其次，比赛的出题企业也是非常优质的。去年的主办方邀请了国家电网、蚂蚁金服、搜狗这种重量级的企业，可以体会到比赛坚强的后盾和企业对于这个比赛的巨大期望。最后，在比赛的规
复制链接

扫一扫