1.
时间:Sun, 26 May 2013 08:33:17
方法:基本的biasSVD(项亮老师推荐系统实践P198)
RMSE:1.31941
排名:60
思路:冷启动
2.
时间:Tue, 28 May 2013 08:07:20
方法:BiasSVD,冷启动问题采用基本的平均值,对于只有user_id的用该user的平均评分,只有business_id的用该business的平均评分,对于二者都没有的用全局平均分
RMSE:1.24920
排名:21
思路:目前只用到了business、user、review三元组,其他信息没有利用。找到其他信息的用法。
3.
时间:Tue, 28 May 2013 12:46:03
方法:利用了评分总数、评分均值
RMSE:1.24322
排名:9
思路:此乃下策,应当不用。
4.
思路:
1)如果一个商店的评分平均分为5,所有评分均为5
2)连锁店的话是不是评分会类似?需做试验验证
时间:2013.5.30
记录:今日比较悲剧,一共两次提交机会,第一次提交了一个错的版本,第二次也没提高成绩。应该是因为SVD的时候随机初始化P和Q导致的,结果会不稳定,小范围波动。
下午处理性别和喜好类别,看看性别是否和评分有关。Excel、matlab、notepad++齐上手啊。。。