模式识别是什么
模式识别的流程
聚类的指标
聚类的内部指标
直接考察聚类结果而不用任何参考模型
簇的划分C={C1, C2, … , Ck}
-
DB指数 DB指数越小,聚类效果越好
-
Dunn指数 邓恩指数越大,聚类效果越好
-
簇C内样本间的平均距离
-
簇C内样本间的最远距离
-
簇Ci与Cj最近样本间的距离
-
簇Ci与Cj中心点的距离
聚类的外部指标
将聚类结果与某个“参考模型”进行比较(越大越好)
距离度量公式
聚类算法—Kmeans
二分K-means聚类 Bi-Kmeans
聚类算法—DBSCAN
基于密度的聚类
二分类如何扩展到多分类问题
- 对问题进行拆分,为拆出的每个二分类任务训练一个分类器
- 对每个分类器的预测结果集成获得最终的多分类结果
- 拆分策略:
- 一对一
- N个类别两两配对得到N(N-1)/2个分类器
- 新样本提交给所有分类器,被预测最多的类别为最终类别
- 训练存储开销大,但每个训练器只用两个类的样例,训练时间短
- 一对其余
- 某一类为正例,其他反例得到N个分类器
- 新样本提交给所有分类器,置信度最大的类别为最终类别
- 存储开销小,训练用到全部训练样例,训练时间长
- 多对多 输出纠错码ECOC码
- 对N个类别做M次划分,每次划分将一部分类别划为正类,剩余部分类别划为负类,得到N×M的编码矩阵。
- 新样本提交给M个分类器,得到分类结果为(y1, y2, … , ym), 求各类别与分类结果向量的欧氏距离/海明距离得到最终分类结果
- 一对一
- 拆分策略:
贝叶斯
暂无
神经网络为什么需要激活函数
激活函数将输入值映射为输出值 神经元兴奋1/抑制0
激活函数给神经元引入了非线性因素,使得神经网络可以任意逼近任何非线性函数,这样神经网络就可以应用到众多的非线性模型中
激活函数的作用就是让线性函数变为非线性函数,增加网络的非线性、复杂度
分类
- 阶跃函数
- Sigmoid函数
- tanh函数
- ReLU函数:
- 随着神经网络的隐层不断增加,偏向于使用ReLU函数作为激活函数,因为ReLU在X正半轴的导数为1,不易产生梯度消失问题
- 以分段线性函数逼近目标,具有非线性逼近能力
- ReLU更快。因为它们涉及到更简单的数学运算。它们不需要任何规范化和指数计算
卷积的计算
正向传播的计算
03-30 感知机
04-06
图像处理是什么![用计算机对图像进行分析,以达到所需结果的技术](https://img-blog.csdnimg.cn/c34ddc3930824e8ca312250d1cd72ecd.png)
图像处理流程
04-13
- 获取图像
- 图像预处理:图像去噪、滤波、增强
- 图像分割
- 特征提取
- 图像理解
图像处理基础概念
图像灰度把白色与黑色之间按对数关系分为若干等级,灰度分为256阶。用灰度表示的图像称作灰度图
RGB即是代表红、绿、蓝三个通道的颜色,RGB标准是通过对红®、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色
图像的分类
- 二值 黑白 1位像素
- 灰度图 8位像素
- RGB图像 24位像素
- 增加透明度的RGB图像 32位像素
频域 对信号进行分析时,分析其和频率有关部分,和时域一词相对
高通/低通滤波
-
高频信号 图像强度(亮度/灰度)变化剧烈的地方(边缘/轮廓)
-
低频信号 图像强度变换平缓的地方(大片色块的地方)
-
高通滤波 过滤掉低频信号,图像锐化
只允许来自图像频域表示中高频分量通过,阻止低于截止值的全部低频 -
低通滤波 图像模糊