链接: 系列视频
迁移学习导论
background:大数据
问题:
- 现实生活中的大部分数据是没有标注的,标注数据/从零开始训练模型是expensive and time-consuming。
- 直接使用训练好的模型不可行——数据不是独立同分布的。
为什么使用迁移学习?
- 普适化模型VS个性化模型 冷启动问题:在缺乏有价值数据的时候,如何有效地满足业务需求的问题,就是“冷启动问题”。
- 冷启动在推荐系统中表示该系统积累数据量过少,无法给新用户做个性化推荐的问题,这是产品推荐的一大难题。
前两类研究的早,但是第一类基本不太用了,学习表征。
所研究的问题是paramater-based TL
研究方向: - training data 比较少的情况下:低资源学习(不需要)
- 领域自适应:进展良好
- 领域泛化
- 安全迁移:是否泄露隐私,或者有什么攻击?