第一篇博客

第一篇博客

今天得到数据集之后
主要的任务是明确目的,并查阅资料和研读相关论文,寻找合适的算法模型

目的:

锻炼在真实数据集上完成数据挖掘任务的能力

任务

:给定学生校园刷卡行为数据集,利用deep forest 算法,对学生成绩进行预测。

步骤:

(1)下载deep forest 论文及代码,熟悉并运行deepforest。
http://www.lamda.nju.edu.cn/code_gcForest.ashx

(2)熟悉学生校园刷卡行为数据集,并根据deep forest程序的输入要求进行预处理
(3)输出预测结果并分析。

阅读的文献和模型思考

1,使用deepforest的思想对行为进行预测

2,使用libfm对特征进行成绩的回归性预测。

其中将使用ubuntu虚拟环境进行libfm模型的训练。相关工作在之前有些研究,曾使用libfm利用历史成绩来预测学生成绩。
https://blog.csdn.net/qq_41785852/article/details/106399202
https://blog.csdn.net/qq_41785852/article/details/105447806

将使用隐语义分析来进行预测,想着通过对行为提取行为特征,使用mcmc算法,马尔可夫链蒙特卡罗算法(MCMC),MCMC方法是用来在概率空间,通过随机采样估算兴趣参数的后验分布。采用马尔可夫链进行采样。具体算法简介参考https://link.zhihu.com/?target=http%3A//www.cnblogs.com/pinard/p/6625739.html

3,使用时序学习模型来进行历史成绩的分析与预测。

下面是阅读到的南京大学关于时序学习相关方面的研究。
file:///E:/2019MLAworks/Research%20Title%203%20-%20面向时序数据的多示例多标记学习MIML%20learning%20for%20Sequential%20data/材料1-Zhi-Hua%20Zhou_Multi-Instance%20Multi-Label%20Learning.pdf

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值