模式识别与机器学习
Better-1
这个作者很懒,什么都没留下…
展开
-
欧式距离、余弦相似度和余弦距离
欧式距离 也称欧几里得距离,是最常见的距离度量,衡量的是多维空间中两个点之间的绝对距离。 多维空间每个坐标的差的平方和再求平方根 余弦相似度 范围[-1, 1],相同则相似度为1。 A和B的点乘除以他们长度的乘积。 余弦距离 范围(0,2), ...原创 2020-11-14 10:44:05 · 2018 阅读 · 0 评论 -
正则化面经题目
正则化稀疏解决方案中,确保向量党的每个分量都非常有效,每个组件都必须捕获一些有用的功能或数据模式。(只要精英,其余的die)像dropout,去除一些权重可以使得剩下的权重学习到更多的只是。 L1正则&L2正则的区别是什么? L1正则化是指在损失函数中加入权值向量w的一范数,即各个元素的绝对值之和;L2正则化指在损失函数中加入权值向量w的平方和。 L1的功能是使权重稀疏,而L2的功能是使权重平滑。 L1正则为什么可以得到稀疏解? 以下图看的直径,x/y坐标分别是参数w1/w2。(L1在高维空间中诗转载 2020-06-29 15:39:01 · 208 阅读 · 0 评论 -
非监督学习-聚类cluster
原始数据容易获得,但标注数据昂贵;降低存储/计算; 对高维数据降噪;对数据进行探索性分析(可视化); 非监督学习通常可作为监督学习的预处理步骤。 发现数据中分组聚集的结构:根据数据中样本与样本之间的距离 或相似度,将样本划分为若干组/类/簇(cluster)。 划分的原则:簇内样本相似、簇间样本不相似 聚类的结果是产生一个簇的集合 模糊(Fuzzy)vs.非模糊的(non-fuzzy) l 在模糊聚类中,一个样本点以一定权重属于各个聚类簇 l 权重和为1 l 概率聚类有相似的特性 部分(Partial)vs原创 2020-06-26 20:25:16 · 650 阅读 · 0 评论 -
分类的判别:召回率;F1score;混淆矩阵指标
准确率 与下面的精确率相区别,准确率是所有预测对的总数除以总的数目,相当于求预测正确的比重。 精确率 针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。那么预测为正就有两种可能了,一种就是把正类预测为正类(TP),另一种就是把负类预测为正类(FP),也就是 召回率 也就是求正类中分类正确的比重。 针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。那也有两种可能,一种是把原来的正类预测成正类(TP),另一种就是把原来的正类预测为负类(FN)。 F1 SCORE F1原创 2020-06-25 09:57:31 · 560 阅读 · 0 评论 -
模式识别与机器学习总览
模式识别目的:利用计算机对物理对象进行分类, 在错误概率最小的条件下,使识别的结 果尽量与客观物体相符合 机器学习:研究如何构造理论、算法 和计算机系统,让机器通过从数据中 学习后可以进行如下工作:分类和识 别事物、推理决策、预测未来等。 模式识别的目标是在特征空间和解释空间中找到一种映射关系,称其为假说。 特征空间:从模式得到的对分类有用的度量、属性 或基元构成的空间。 机器学习的目标:针对某类任务T,用P衡量性 能,根据经验来学习和自我完善,提高性能。 ...原创 2020-06-23 08:13:13 · 548 阅读 · 0 评论