书籍资料整理: https://github.com/ty4z2008/Qix/blob/master/dl.md
入门资料: http://www.cnblogs.com/subconscious/p/4107357.html
入门书籍:李航《统计学习方法》、周志华《机器学习》、吴恩达公开课、Kaggle竞赛
进阶提高:《模式分类》 、 《PRML》、ICML、 NIPS等国际会议
Kaggle竞赛: https://www.kaggle.com/
(理论+实践)吴恩达写给工业界的新书: Machine learning yearning
1、机器学习(预测)
让计算机从数据中自动学习,运用学到的知识来服务以后的任务。
2、迁移学习
站在巨人的肩膀上看问题,利用已有的知识去开拓新的领域,减少重复学习的成本和时间。
3、深度学习
卷积神经网络(CNN)、深度+增强学习(DLRL)、深度信念网络(DBN)、循环神经网络(RNN)、深度神经网络(DNN)
问题:新的推荐系统没有大量的数据怎么才能精准推荐?
利用迁移学习解决:
1、大数据与少标注:迁移数据标注(寻找与目标数据接近的有标注的数据,利用这些数据来构建模型)
2、大数据与弱运算:模型迁移(将训练好的模型迁移到任务中进行微调)
3、普适化模型与个性化需求:自适应学习(对普适化模型进行灵活的调整)
4、特定应用的需求:相似领域知识迁移(数据和模型方法上进行迁移)
迁移学习分类:
1、目标域标签:监督、半监督、无监督
2、学习方法:样本(直接对不同的样本赋予不同权重 、权重重用 )、特征(源域和目标域特征弄到一个空间相似)、模型(参数共享)、关系(挖掘和利用关系进行类比迁移)
3、特征:同构(特征语义和维度相同)、异构
4、离线与在线分:离线(源域和目标域数据都是给出来的、直接迁移即可)、在线(只有源域数据,目标域数据要一点一点才能过来)
迁移学习方法:
1、数据分布自适应
1.1、边缘分布(数据整体不相似)
1.2、条件分布(数据整体相似)
1.3、联合分布
2、特征选择
3、子空间学习