![](https://img-blog.csdnimg.cn/d4882968d18e403d8a3578cd1916010a.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
DL
文章平均质量分 88
DL
怪兽iii
心之所向寻赴既往
展开
-
深度学习之聚类
聚类(Clustering)是按照某个特定标准(如距离)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。也即聚类后同一类的数据尽可能聚集到一起,不同类数据尽量分离。原创 2023-04-03 21:33:51 · 3395 阅读 · 0 评论 -
深度学习的性能指标
正样本:属于某一类(一般是所求的那一类)的样本。在本例中是及格的学生。负样本:不属于这一类的样本。在本例中是不及格的学生。困难样本: 预测时与真值标签误差较大的样本。简单样本: 预测时与真值标签误差较小的样本。eg. 图片分类:需要识别马、羊、牛三个类别。给一张马的图片。对于预测马来说这个样本为正样本,对于预测羊和牛来说该样本为负样本。eg. 语音识别:需要识别“我 爱 中 国”四个字。语音片段对应“我”。则对于预测“我”来说这个样本为正样本,对于预测其他字来说该样本为负样本。原创 2023-03-27 21:32:17 · 1511 阅读 · 0 评论 -
不平衡数据/少数样本下学习困难的原因
样本不平衡分布,内部不平衡(患病患者)+外部不平衡(因隐私收集数据困难)。从极端的类不平衡数据中学习(地震、海啸)。不平衡分布(不平衡率,imbalance ratio,IR)不是分类困难的原因,如果正负类存在良好的代表性,即很好的表示并且来自非重叠分布,也可以获得很好的结果。不平衡的敏感性与问题复杂性有关。非复杂的、线性可分离的问题不受所有级别的类不平衡的影响。可用的少数样本总数 比 不平衡率 更重要。原创 2023-03-23 10:49:15 · 175 阅读 · 0 评论 -
机器学习-表征学习-深度学习
机器学习本质就是利用机器自动(有部分人为参与的)学习数据特征,从而对于类似输入(相同特征)进行特定任务的预测。如果有人为参与地进行特征处理,我们称之为特征工程;我们可以利用表示学习和深度学习方法使机器学习模型达到模型自己学习特征规律,从而自主提升模型性能的效果。原创 2023-03-22 18:02:18 · 506 阅读 · 0 评论 -
编码器-解码器架构
编码器-解码器架构学习,并举例。原创 2023-03-22 17:59:04 · 5517 阅读 · 0 评论