持续在线学习是AI模型的必需能力

AI模型需要能快速地持续从新鲜数据中学习,才能通过计算自动化实现决策自动化,走向类人的智能化。

持续学习是智能化的基本特征,也就是说,真正的智能是要能持续在线学习的,而不是学习一个固定的模型拿来用,因为固定模型的智能都会随着外部环境的变化而退化。目前在很多适合的场景,特别是小模型,都可以从应用层面设计AI模型具备快速的持续在线学习能力,例如每隔一段时间,自动将新数据与旧数据一起重新训练模型。虽然也有一些为解决遗忘问题以集成树模型和神经网络为基础设计的增量训练,不过其新旧融合效果仍然不如全量训练,而大模型的全量训练或微调,都由于成本过高和时间过长,目前还无法从训练层面具备快速的持续学习能力。

理论上,目前也缺乏一个能支撑持续在线学习的计算结构。这种计算结构需要能够独立学习旧数据和新数据,并且能够同时自动融合学习新旧数据形成新的知识体系,还要能避免由于新数据的持续学习导致的结构膨胀灾难。

从应用层面设计来说,AI模型的持续学习需要两个条件: 一是持续的新鲜数据来源,二是持续的人工辅助审核。下面以一个真实应用案例为基础说明一种基于全量训练的小模型持续在线学习的方案和步骤。
AI模型全量持续学习框架

1、假设这里有一个应用场景或决策环节,需要数十个专业人员同时处理,假设这些专业人员处理任务的输入输出数据都得到留存。

2、将输入输出数据预处理并训练一个AI模型初步具备这些专业人员的处理能力。私有部署AI模型,当AI模型处理新的任务时,不但要输出处理结果,还要同时输出结果的相对置信度。

3、保持少数几个专业人员对AI模型的推理结果持续进行审核修正。例如可以设计便利的UI,将推理结果中置信度较低的5%过滤出来给专业人员逐条审核修正,其余的95%只需要专业人员经常抽样审核修正。

4、在线将专业人员审核修正过的新数据与旧数据一起重新训练更新AI模型。为了保证模型在线服务的连续性,AI模型迭代的过程需要自动化,包括训练数据集的自动预处理、模型超参数自动优化、模型效果的自动评估、模型更新缓冲等等。

通过上述方案,得到的好处有两个: 一是,少数几个专业人员与AI模型一起具备了原有数十个专业人员的处理能力;二是,在少数专业人员辅助下AI模型具备了持续学习的进化能力。进一步地,以此为基础,可以持续地得到对应决策任务环节的自动化处理能力。

DataToAI.cn

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值