数据集不同划分方法的错误分析+其它学习方法

一、错误分析

1.误差分析方法

手动分析工作

首先找一组错误的例子,看看假阳性和假阴性,通过建立表格的方式,统计属于不同错误类型的错误数量,这个过程中可能归纳出新的错误类型,需添加并统计其数量。通过统计不同错误标记类型占总数的百分比,找到哪些问题需要优先解决,找到值得优化的方向。

2.清除标记错误的数据

1.训练集标记出错

随机性错误:错误的出现很具有随机性,出现频率低。

系统性错误:错误出现很有规律,频率较高。

深度学习算法对随机误差很健壮,可以忽略,但对系统性错误没那么健壮,需要修正。

2.开发集和测试集标记出错

1)方法

手动重新检查标签,并尝试修正一些标签,添加一个额外的列Incorrectly labeled表示标签Y错误的例子数。

2)原则和方针

1.无论什么修正手段,都要同时作用到开发集和测试集,因为开发集和测试集必须来自相同分布。

2.同时检验算法判断正确和判断错误的例子(实现较困难)。

3.修正训练集中的标签其实相对没那么重要,修正开发集和测试集中的标签更重要,它们通常比训练集小得多,性价比更高。

二、在不同的数据集划分上进行训练并测试

    假设要训练猫咪识别器,有网页上爬取20万张高清照片和实际App所拍摄的1万照片:

划分数据集两种方法

(1)方法一(不适合)

      将Web高清图片和App模糊图片两种数据充分混合,保证所有数据符合同一分布,再划分训练集、开发集和测试集。

                            train:205000dev:2500test:2500

缺点:在dev和test集中,大约有 \frac{20}{21} 的比例为网页爬取的高清图片,实际应用App所拍摄照片为 \frac{1}{21},网页爬取的高清图片占很大比例,开发集大部分精力用来优化识别网页中的猫咪,而真正App拍摄的照片识别效果并不好。

(2)方法二(适合)

train: 205000 (20000web+5000app)dev:2500(app)test:2500(app)

        开发集目的是告诉模型目标长什么样以及瞄准目标的方式,而测试集的目的是测试实际情况使用模型的效果,保证dev和test集都采用App所拍摄的照片,能够训练出更加符合现实需求的算法,应注意保持dev和test的数据符合同一分布。

优点:App的图片是符合实际情况,dev和test集的数据量小,因此都用App的数据,在训练集若只用符合实际情况的App照片,会由于数据集的量少而导致训练出的模型效果不好,因此将web也放在训练集中,增大数据量,反而训练效果会更好。

三、不匹配数据的划分

     假设有一个猫咪分类器的例子,人类水平表现误差约等于0%,分析其偏差和方差:

1. 训练集、开发集和测试集的数据来自同一分布。

    可以发现可避免误差为1%,方差为9%,显然这里存在着很大的方差问题,因为训练集的效果很好,处理开发集就效果变差了。

2. 训练集  和  开发集和测试集 的数据分布不一致,开发集和测试集数据分布一致。

 1.影响误差的条件

    无法轻易下结论,因为同时改变了两个条件,很难确定是那个原因主要引起了9%的误差:

(1)训练模型没有见过开发集中的数据

(2)训练集和测试集数据来自不同分布

2.解决办法

       添加Training-dev集,是训练集的子集,训练网络时不会用到该部分数据。

                       train      train-devdevtest

       训练集和训练-开发集来自同一分布,利用训练集训练模型,再用训练-开发集验证,观察二者误差率的差距,从而判断条件(1)对模型产生的影响程度。

3.优化方向的确定

  • 可避免偏差:train误差率 - 人类表现水平(贝叶斯最优错误率)
  • 方差问题:train-dev误差率 - train误差率
  • 数据不匹配问题:dev误差率 - train-dev误差率

      根据train、train-dev、dev和test的误差率,分别计算三种问题的误差大小,从而选择一个更加具有性价比的优化方向,并采取相应措施。

四、解决数据不匹配问题

1.产生原因

    数据不匹配问题是由于 训练集  和  开发集 的数据分布不一致导致的。

2.解决办法

      收集更多的像开发集的数据作训练,比如人工数据合成(语音识别系统效果比较好)。

注意:人工合成的数据有可能不具有代表性,从所有可能性的空间只选了很小一部分去模拟数据。

五、迁移学习

1.定义

      迁移学习:神经网络可以从一个任务中习得知识,并将这些知识应用到另一个独立的任务。

      利用新任务的数据集重新训练神经网络有两种方法:

(1)如果数据集小,可以只训练输出层前的最后一层或两层,仅仅改变W[l],b[l],并保持其他参数不变。

(2)如果有足够多数据,重新训练神经网络中的所有层,即重新训练网络中的所有参数。

2.应用场景

1.迁移学习作用场合

      迁移来源问题有很多数据,但迁移目标问题你没有那么多数据

      例如,假设图像识别任务中你有100万个样本,所以有相当多数据可以学习低层次特征,可以在神经网络的前几层学到如何识别有很多有用的特征,对于放射科X光片只有100个样本。因此可以从图像识别训练中学到很多知识可以迁移,从而加强放射科识别任务的性能。

2.当需要把任务A迁移到任务B时,迁移学习有意义的场景 

(1)任务A和任务B都有同样的输入X时,迁移学习有意义。

(2)当任务A的数据比任务B的数据多得多时,迁移学习有意义。

(3)任务A的低层次特征可以帮助任务B学习,迁移学习有意义。

六、多任务学习

1.定义

       尝试从多个任务中并行学习,而不是串行学习,在训练一个任务后试图迁移到另一个任务。

       常用场景:无人驾驶技术(需要同时识别交通灯、汽车和行人等多个任务)

2.多任务学习有意义的场景

(1)如果训练一组任务,可以共用低层次特征。

(2)每个任务的数据量很接近,原因在于如果要专注于某项特定任务,要求其他任务的数据量都比该任务大,才能使其他任务数据量之后远大于特定任务的数据量。

(3)当训练一个足够大的神经网络,需要同时做好所有工作。

3.多任务学习的替代方法

        为每个任务训练一个单独的神经网络。

4.多任务学习性能降低的情况

        训练的神经网络不够大,会比每个任务单独训练神经网络情况更差。

七、端到端学习

1.定义

  端到端学习:省去了复杂的神经网络结构,只需从一段输入就能在另一端输出结果。

2.缺点

(1)目前应用广泛小,由于缺乏数量足够大、种类足够多数据集。

(3)需要强大的算力。

(2)某些场景利用传统分布构建神经网络效果更好,如利用手部X光片判断年龄。

  • 9
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. 智慧社区背景与挑战 随着城市的快速发展,社区面临健康、安全、邻里关系和服务质量等多方面的挑战。华为技术有限公司提出智慧社区解决方案,旨在通过先进的数字技术应对这些问题,提升城市社区的生活质量。 2. 技术推动智慧社区发展 技术进步,特别是数字、无线、移动和物联,为城市社区的智慧提供了可能。这些技术的应用不仅提高了社区的运行效率,也增强了居民的便利性和安全性。 3. 智慧社区的核心价值 智慧社区承载了智慧城市的核心价值,通过全面信息处理,实现对城市各个方面的数字网络管理、服务与决策功能,从而提升社会服务效率,整合社会服务资源。 4. 多层次、全方位的智慧社区服务 智慧社区通过构建和谐、温情、平安和健康四大社区模块,满足社区居民的多层次需求。这些服务模块包括社区医疗、安全监控、情感沟通和健康监测等。 5. 智慧社区技术框架 智慧社区技术框架强调统一平台的建设,设立数据中心,构建基础网络,并通过分层建设,实现平台能力及应用的可持续成长和扩展。 6. 感知统一平台与服务方案 感知统一平台是智慧社区的关键组成部分,通过统一的RFID身份识别和信息管理,实现社区服务的智能和便捷。同时,提供社区内外监控、紧急救助服务和便民服务等。 7. 健康社区的构建 健康社区模块专注于为居民提供健康管理服务,通过整合医疗资源和居民接入,实现远程医疗、慢性病管理和紧急救助等功能,推动医疗模式从治疗向预防转变。 8. 平安社区的安全保障 平安社区通过闭路电视监控、防盗报警和紧急求助等技术,保障社区居民的人身和财产安全,实现社区环境的实时监控和智能分析。 9. 温情社区的情感沟通 温情社区着重于建立社区居民间的情感联系,通过组织社区活动、一键呼叫服务和互帮互助平台,增强邻里间的交流和互助。 10. 和谐社区的资源整合 和谐社区作为社会资源的整合协调者,通过统一接入和身份识别,实现社区信息和服务的便捷获取,提升居民生活质量,促进社区和谐。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值