构思一下2013中国大数据周中的几个赛题

看到CSDN中针对第一届大数据周的几个赛题,越来越能感知数据背后的力量;

先摘录一下大数据的发展过程:

2012年大数据的热点问题:

  1. 数据科学与大数据的学科边界
  2. 数据计算的基本模式与范式
  3. 大数据特性与数据态
  4. 大数据的数据变换与价值提炼
  5. 大数据的安全和隐私问题
  6. 大数据对IT技术架构的挑战
  7. 大数据的应用及产业链
  8. 大数据的生态环境问题

2013年度大数据发展趋势预测:

  1. 数据资源化
  2. 大数据隐私问题
  3. 大数据与云计算等深度融合
  4. 基于海量数据(知识)的智能
  5. 大数据分析的革命性方法
  6. 大数据安全
  7. 数据科学兴起
  8. 数据共享联盟
  9. 大数据新职业
  10. 更大的数据
而接下来所设计的赛题呢:

具体赛题如下:

  • 关键词行业分类:本赛题意在让成千上万的行业通过机器学习相关算法能够快速准确的分类,一扫人工标注高成本低效率的阴霾,使广告投放更加精准。百度提供了本赛题的题目和数据,并需在百度开放研究云平台上完成。
  • 电信网络寻呼黑洞分析:移动运营商需要通过对移动网络信令日志的分析定位电信网络寻呼黑洞(无法正常提供服务的区域)并进行后续的网络优化,提高服务质量。移动研究院提供了本赛媞的题目和数据,以及大云大数据相关工具支持。
  • 电信用户交往圈构建和特定类型用户识别:移动运营商希望根据目标用户群某个周期内的通话、短信、接入服务位置等信息,建立目标用户群的交往圈,并在交往圈内识别出符合特定业务设计特征的营销对象。本次赛题拟针对校园基站覆盖区域内的用户通话和短信交往行为,进行校园区域内学生客户群体的识别。本赛题由移动研究院提供题目和数据。
  • 用户购买行为的归因分析:归因分析是市场营销等行业中广泛使用的一类分析方法,参赛选手需要根据已知转化行为的用户数据,建立归因模型,计算出不同广告渠道、不同广告类型对于用户转化的贡献度。秒针提供了本赛题的题目和数据,并需在秒针的平台上完成。
  • 基于出租车GPS轨迹的位置服务:针对打车难的问题,本赛题以打车推荐为题,参赛选手根据北京市出租车GPS历史数据生成推荐模型,该模型可以根据用户的位置和当前时间,计算能打到车的概率及平均等待时间。数据堂提供了本赛题的题目与数据。
上述几个赛题各有特征,构思自己来如何完成这几个赛题的模型设计和对应的技术选型。

后续将逐步完善思路......



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值