增量学习解决概念漂移思路与集成增量学习简述
第一章 概念漂移论述
第二章 增量学习论述
第三章 集成学习论述
第四章 如何解决时序概念漂移问题
第五章 增量集成学习算法逻辑设计
一、概念漂移论述
概念漂移是目标变量随时间变化发生改变的现象,产生稳定性-可塑性危机,就是一方面必须提取新数据知识,另一方面又不能让新知识输入造成对原有知识的冲击,而如果使用直接训练数据的方法极其困难,这个时候采用增量学习仅需要学习新的数据,如果直接训练就得每次训练新加入的数据,这种方法在如今流数据大数据的时代明显代价极高,而采用增量学习只需要每次训练新数据的模型即可,这也是为什么采用增量学习作为解决概念漂移问题的一种手段。
二、增量学习论述
增量学习主张解决稳定性-可塑性难题,也就是在资源有限条件下寻找效用最大的平衡点。稳定性在于防止新知识输入对已有知识的显著干扰;可塑性在于从新数据中整合新知识和提炼已有知识
三、集成学习论述
集成学习主要解决两大问题:**第一是如何获取个体学习器;第二是如何将个体学习器进行策略结合组成强学习器。**针对第一个问题:个体学习器应该好而不同。据此现在的集成学习个体学习器生成分为Boosting代表的学习器之间有强依赖关系;Bagging代表的学习器之间不存在强依赖关系
三、如何解决时序概念漂移问题
1.采用增量学习框架解决稳定性-可塑性问题
可以采用增量学习框架,保留历史数据和最近数据信息
但是单分类器的增量学习模型不稳定,容易受到噪声影响,且随学习次数增