深度学习(一)基本名词定义和概述

一、特点

1.模型结构是一种含多隐层的神经网络

2.通过组合低层组合成高层特征

二、数据集

2.1 数据集的定义及组成

数据集是深度学习的信息来源,因此数据集至关重要。数据集可分为训练集和测试集,其中训练集是用来训练模型,被用来学习得到系统的参数取值。而测试集是指最终报告模型的评价结果,在训练阶段测试集不可见即测试集与训练集分开放置。

2.2 数据集的拆分

2.2.1 留出法

将数据集随机分成两组,一组为训练集,一组为测试集;利用训练集训练分类器,利用测试集评估模型,记录最后训练好的分类器的性能指标,这种方法成为留出法。此方法的特点是处理简单,不足之处是测试集的评估性能与拆分有很大的关系。

2.2.2 K折交叉验证

将数据集分为K份(通常为5或者10),每次取1份作为测试集,另外的K-1份为训练集,循环K次,最后将这K个模型的性能均值作为评估结果,这种方法称为K折交叉验证。该方法的特点是评估结果较为稳定,但计算次数较多。在此方法中,将数据集分为K份时需要保证每个特征样本在每一份中的占比相同。

2.3 超参数

是指学习之前就设置好的一些变量值,为恒定值,不是通过模型训练出来的。通过调整超参数来调整模型的性能。如下图所示,通过调整不同的超参数和K折交叉验证来得到超参数的最优解。

三、模型评价方法

准确率  Accuracy = (TP + TN) / (TP + TN + FP + FN)

精确率 Precision = TP / (TP + FP)

召回率 Recall = TP / (TP + FN)

由上面的混淆矩阵可得到PR曲线,如下图所示,精确率和召回率是相矛盾的参数,需要平衡这两者之间的取值,左下角区域越大则模型性能越好。通常可以用F值来表征精确率和召回率的调和指标,,F1值越大可认为模型性能越好。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值