[天池竞赛系列]阿里音乐流行趋势预测大赛初赛三等奖思路

第一赛季8名,第二赛季11名

主要使用模型和规则

预处理:过滤异常用户的操作记录,比如一整天都听同一首歌,疯狂下载歌的等等
构建样本:对每个歌手建模,每一天的播放数据为一个样本,有的歌手会出现很多突然的波动,使用7点平滑
特征:因为是对每个歌手建模,所以不用考虑歌手特征,全部使用时间特征
工作日,节假日,是否加班,放假第几天,工作第几天,星期几,节前,节后等等
趋势特征:不同大小的窗口做差分特征,从训练集开始按时间编号,训练集使用3个月的数据,按天编号1~90,预测集91~150,按周编号,按月编号等等

模型:LR+SVR+RF+XGBOOST  bagging融合

训练集训练模型,反过来预测训练集,将偏差过大的歌手从训练集删除,拿出来单独分析
发现这些歌手变动情况比较大,模型难以预测
考虑使用规则,考虑评分公式,排除一些变量,简化公式求导可得一个预测均值,e(1/tk)/e(1/tk^2)作为预测结果

过滤出一些模型预测为负的歌手,观察发现这些歌手趋势下降太快,导致模型预测为负,将预测为负的部分用规则处理
有明显提高,因为有时候偏差过大的话会导致这个歌手的得分为负。

最后融合一下模型和规则就是最后线上成绩
最近在实习,投入这个比赛的精力较少,初赛复赛基本都是最后一周开始搞,所以方案略简单,也没有考虑歌手的一些细节特征

观察过发布新歌和趋势好像没有明显关系?莫非是观察的姿势不对。。

  • 3
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
MOOC辍学预测数据集是一组用于预测MOOC学习者辍学可能性的数据集。这些数据集包括学习者在参与MOOC课程期间的个人信息、学习行为、评估成绩等多维度数据。通过对这些数据的分析和建模,可以帮助教育机构、教师和学习者本身了解辍学的原因和趋势,从而采取相应的措施来提高学习者的参与度和留存率。 MOOC辍学预测数据集通常包含以下几个方面的信息: 1. 个人信息:包括学习者的性别、年龄、国籍、学历等,通过分析这些信息,可以了解不同背景和特征的学习者在MOOC学习中的表现差异,并进一步推测其辍学可能性。 2. 学习行为:包括学习者的登录频率、学习时长、学习资源的浏览与下载情况等,通过分析学习者的学习行为,可以了解其对学习内容的投入程度,进而预测其是否可能出现学习疲劳或学习动力的下降。 3. 评估成绩:包括学习者的作业得分、考试成绩等,通过分析学习者的评估成绩,可以判断其学习进展和掌握程度,从而预测学习者是否可能因成绩不佳而选择辍学。 4. 交互行为:包括学习者与教师或其他学习者的互动情况,例如论坛帖子数量、问题提问次数等,通过分析学习者的交互行为,可以推测其参与度和学习动力,进而预测其辍学可能性。 通过利用MOOC辍学预测数据集,可以建立相应的机器学习模型或算法,通过模型的训练和预测,可以预测学习者的辍学可能性,并为教育机构和学习者提供有针对性的干预措施,从而减少学习者的辍学率,提高MOOC的教学质量和学习体验。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值