模式识别学习笔记（1）——基本概念

最新推荐文章于 2022-08-01 12:42:13 发布

Carol__Deng

最新推荐文章于 2022-08-01 12:42:13 发布

阅读量558

点赞数

分类专栏：学习笔记文章标签：模式识别机器学习

本文链接：https://blog.csdn.net/Carol__Deng/article/details/79049350

版权

本文介绍了模式识别中的数据集划分方法，包括留出法、交叉验证法和自助法，强调了各类方法的适用场景和注意事项。此外，还提及了生成模型与判别模型的区别，为机器学习的基础理论提供了理解。

摘要由CSDN通过智能技术生成

模式识别学习笔记——绪论

一、从数据集D中产生训练集S和测试集T，主要有以下方法：

——hold-out（留出法）

——cross-validation（交叉验证法）

——bootstrapping（自助法）

hold-out（留出法）

将数据集分为两个互斥的集合，D=S∪T，且S∩T=∅。

attention：

1、训练集和测试集中的类别比例相似，可以利用分层抽样得到。比如说1000个样本中有男女各500个，若训练集和测试集数据个数分别为800和200个，则训练集应该包含400个男，400个女；测试集应该包含100个男，100个女。

2、即使是分层抽样，仍有很多种划分方式对数据集进行分割，因此一般采用若干次随机划分、重复进行实验评估后取平均值作为留出法的评估结果

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Carol__Deng

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

模式识别基本概念+聚类知识 模式识别笔记（一）

ylin01234的博客

07-18

8879

模式识别：机器自动识别（使机器具有抽象能力）目的：用计算机对物理对象进行分类，在错误概率最小的情况下，使识别结果尽量与客观情况相符合参照基准：人识别方法：1.数据聚类（K-means） 2. 统计分类（SVM等） 3. 结构模式识别（结构匹配，考虑识别对象各部分间关系，制定关系规则，句法识别） ...

模式识别（张学工版）学习笔记（第一章概论）

yt77_2000的专栏

08-16

4397

第一章概论 1.识别的本质就是分类，所以模式识别也称为模式分类。 2.模式识别中，样本：是研究对象的一个个体，相当于统计学中的实例。样本集：若干样本的集合。类别：所有样本上定义的子集，通常用w1,w2.....表示。特征：也成为属性，对样本的量化结果，只存在一个特征则用一个数字表示，如果存在多个特征则用一个向量表示，向量的维数为特征的个数。所有样本的特征构成了样本的特征...

参与评论您还未登录，请先登录后发表或查看评论

模式识别学习笔记

weixin_42204960的博客

03-06

168

模式识别学习笔记一些基本概念数学概念一些基本概念 数学概念类条件概率密度：已知目标的类别（事件发生）为ωk\omega_kωk的情况下，目标的某一特征（促成事件的条件，另一个事件）xxx的概率密度P(x∣ωk)P(x|\omega_k)P(x∣ωk)。先验概率：所有条件未知的情况下，事件发生的概率。最小风险贝叶斯决策例：假设观测到现象（事件）xxx后查出某细胞是肿瘤细胞（事件ω...

《模式识别》学习笔记（一）

HitStuHan的博客

06-21

2110

前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。二、使用步骤 1.引入库代码如下（示例）： import numpy as np import pandas as pd import matpl...

模式识别和机器学习笔记

06-23

Pattern Recognition and Machine Learning Probability Distribution Linear Models Regression ...

模式识别学习笔记——第2章统计学习方法-2.2最小错误率贝叶斯决策

HS_Jack_ZZZ的博客

07-29

2863

可以看到，左边的黄线代表的是在晴天条件下降雨概率的分布；这两条线分表代表的含义仅仅是，在不同天气条件下降雨量的关系。表示观察到的状态为阴天。我们通过过往的天气预报可以统计在一年内，晴天的降雨量和阴天的降雨量，再经过计算得到它们的概率。特征下是晴天的概率，反之则是阴天的概率。最小风险决策的分界线是途中的蓝色虚线。为了更加直观的理解这一过程，用实例和图像来解释这一过程。从最小错误率出发，利用概率论中的贝叶斯公式，得出使错误率最小的分类决策。中但属于晴天的概率就是错误的概率。的维度为1，即将特征写成标量的形式。.

模式识别学习笔记——第2章—2.4 两类错误率、Neyman-Pearson决策与ROC曲线

HS_Jack_ZZZ的博客

08-01

2286

举个医院的例子癌症早期不易被检查出来，但却是治疗癌症的最佳时期，因此应要求尽量把所有的阳性检测出来，所以应确保真阳性率尽可能高，即灵敏度达到99.9%（第二类错误率、假阴性率为0.1%），在次前提下再追求误将把无病诊断为有病的概率，即第一类错误率低、真阴性率（特异度）高。这里，真阳性（TruePositive，简记TP，后同）和真阴性是正确的分类，错误分类则是假阳性和假阴性两种情况。相应的就只有两种错误率分别是假阳性率（假阳性样本占总阳性样本的比例）、假阴性样本（假阴性样本占总阴性样本的比例）.......

AI学习笔记——卷积神经网络（CNN）

01-27

卷积神经网络（CNN）是人工智能领域中一种重要的深度学习模型，特别适用于图像识别和处理任务。相较于传统的全连接神经网络，CNN具有更好地捕获图像特征的能力，这得益...理解并掌握这些基本概念是深入学习CNN的关键。

模式识别学习笔记（13）——svm

Carol__Deng的博客

06-14

515

SVM 它有什么优点？有什么缺点？为什么要有SVM？在什么情况下我需要用svm？考虑一个最简单的线性分类器，在很多情况下，用线性是分不开的，如果我们有很多的feature，将其映射到高维空间，可以使其线性可分（实际上是核方法的思想）。在feature很多的情况下，如果我们还用传统的方法，比如感知器，去训练的话，因为k维空间的VC维是k+1，当映射到高维空间，k增加的时候，这个VC

模式识别（Pattern Recognition）学习笔记（十八）--感知器与神经网络

凌桑的自我修养--You are the Eternity

06-03

3424

1.什么是人工神经网络（ANN）？ 1.1ANN的由来在人工智能中，有两个研究方向：1）先试图对人类或其他高等动物的自然智能建立一定的数学模型，然后借助这种方式来帮助理解智能活动的奥秘；2）通过数学手段，利用计算机建立具备一定智能的机器。回顾下前面学习的贝叶斯决策和线性的非线性的判别方法，可以发现，它们显然对应于第二种研究方向，都是直接从数学的角度来分析数据的分布，建立线性的或

模式识别（Pattern Recognition）学习笔记（二十四）--总结：SVM学习资源

凌桑的自我修养--You are the Eternity

06-14

2519

本篇文章对不同阶段的SVM进行严格梳理和总结，不管是初级版的SVM，还是升级版的SVM，你都会发现其实在SVM中一直是有两个核心在贯穿其中的，相信看完本篇的学习，你就会对SVM这个重要级的分类器有个全面的了解，或者有自己的体会，好吧，开始吧，Good luck。。 1.核心思想对于任何非线性方法，如果对特征进行适当的变换，那么久总可以得到相应的线性方法，但是这种变换有时会带来两

模式识别学习笔记之三：模式识别已经简单了解，接下来必须要做的事！

xiaojiang0805的专栏

04-11

4647

模式识别已经简单了解，也许你以前也已经知道或听老师讲过，接下来必须要做的事就是要记下一些重要的概念和复习以前学过但已经忘掉的知识。这里把一些重要的、也许老师不讲的、也许让人听起来不知所曰的概念介绍一下，有些看着简单，但不要放过啊！好姑娘是不那么容易追到的，更何况还有那么多人惦记！这里的内容比较多，会有不断地更新！ 1 样本：对任一个具体的事物，都可称为一个样本，它是一类事物的一个具体体现

模式识别基本概念小结（学习笔记）

m0_54065225的博客

01-31

3303

解决模式识别问题的方法：基于知识和基于数据。基于知识归在人工智能范畴中。分类器的定义：基于数据的方法是模式识别最主要的方法，在无特别说明的情况下，人们说模式识别通常就是指这一类方法，其任务可以描述为：在类别标号y与特征向量x存在一定的未知依赖关系、但已知的信息只有一组训练数据对{（x，y）}的情况下，求解定义在x上的某一函数y’=f（x），对未知样本的类别进行预测。这一函数叫做分类器。这种根据样本建立分类器的过程也称作一作学习过程。监督模式识别与非监督模式识别 监督模式识别：在要解决的模式识别问题中，我

模式识别学习笔记一、相关概念

Leo_whj的博客

10-15

1463

Y=F（X）X-特征集图像处理云计算信号处理 ….. 不同的领域，不同的提取方法 F-映射（假说）1、获得方法监督学习（已知所属类的样本集->训练->F->判别未知数据）非监督学习（基于“物以类聚”划分相似性，无训练过程，数据驱动） Y-模式类别模式分类方法数据聚类（非监督）统计分类（监督）机构模式识别 神经网络（监督/非监督） 模式识别过程

普通交叉验证（OCV）和广义交叉验证（GCV）

weixin_30566149的博客

06-29

7082

普通交叉验证OCV OCV是由Allen(1974)在回归背景下提出的，之后Wahba和Wold(1975)在讨论了确定多项式回归中多项式次数的背景，在光滑样条背景下提出OCV。 Craven和Wahba（1979），Silverman（1985），Bates和其他人（1987），Wahba（1990）等人提出了所谓的GCV标准。广义交叉验证的加权验证技术被...

交叉验证——ESL chapter7.10

River_J777的博客

10-15

775

交叉验证交叉验证是估计预测误差最简单且广泛使用的方法。通常情况下，我们的数据量都是不足够多的，如果在本来就不多的数据集中再划分出一部分作为验证集，那可供学习的数据就更少了。为了解决这一问题，K-折交叉验证将数据集分成容量大致相等的K个部分，如下图：对于第kkk(k=1,2,⋯ ,Kk=1,2,\cdots,Kk=1,2,⋯,K)部分，我们首先用其他K-1个部分的数据对学习器进行训练，再预测第kkk部分数据时计算预测误差。依次通过k=1,2,⋯ ,Kk=1,2,\cdots,Kk=1,2,⋯,K循

广义交叉验证（GCV）