模式识别

最新推荐文章于 2024-02-26 20:54:23 发布

bili_9794454062

最新推荐文章于 2024-02-26 20:54:23 发布

阅读量587

点赞数

分类专栏：人工智能机器学习文章标签：模式识别机器学习

本文链接：https://blog.csdn.net/qq_41740705/article/details/79340410

版权

人工智能同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

机器学习

5 篇文章 0 订阅

订阅专栏

分类算法

一神经网络BP, RBF,RNN,PNN hopfield,ELM等SVM，基本想法是把低维线性不可分问题映射到高维变成线性可分问题，有最大间隔的优点，还可以对添加惩罚因子避免overifitting,映射的空间维数与kernel有关，高斯是映射为无穷维，可以用泰勒展开解释。朴素贝叶斯分类器，基于贝叶斯公式。是一种计算概率的方法。训练集如果是偏斜集，正反例个数差别太大，用accuracy和recall的调和平均作为指标。解释性不强。就像一个黑箱。

二决策树解释性强，基于信息熵和信息增益率建造树，可能出现过拟合问题，这是就需要剪枝。一个更好的方法是用随机森林，过拟合问题可以减弱。但树的个数需要设置，基于有放回的抽样来选训练集，其他得作为验证集和测试集。

三模糊模式识别计算贴近度取最小

回归和预测算法可以用标准方程解法，参考计算方法。可以用逻辑回归，神经网络, SVR等方法灰色预测GM(1,1) 等时间序列预测，有AR,移动平均其中还可以加入差分来预测长期趋势，消除季节变动等因素。matlab里还有NAR,NARX等神经网络。过拟合问题一般会在目标函数加入惩罚因子和正则化项，叫做正则化(regularization)。

神经网络一般会对输入数据做归一化消除量纲，还能加快收敛速度。更好的方法是用集成学习里的bagging,可以提高泛化性或者说验证集的error即方差。集成学习包括bagging,boostingbagging是并行结构，随机森林就是一种并行结构，最后结果根据多个神经网络或者决策树的结果来定。规则有少数服从多数和加权投票两种，每个子分类器的权重也是通过机器学习来的。boosting侧重于减少测试集误差，每个子分类器要求不高，只需要比随机好一点。常用adboost, 举例如先让第一个分类器去分，第二个分类器输入第一个分类器分错的set,第三个分类器输入第一个和第二个有分歧的set。adboost权重是可以证明的，可以从理论上推导误差是趋于0的。每个样本是有权重的，分错的样本权重大，重点学习。regionboost是将每个权重与输入关联起来，称之为动态权重，第二个分类器是将第一个分错和分对的分开。权重根据KNN来计算，在高维空间距离可以用曼哈顿距离好于欧式距离。regionboost误差会大于adaboost 但泛化性强。

bili_9794454062

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
模式识别

分类算法一神经网络BP, RBF,RNN,PNN hopfield,ELM等SVM，基本想法是把低维线性不可分问题映射到高维变成线性可分问题，有最大间隔的优点，还可以对添加惩罚因子避免overifitting,映射的空间维数与kernel有关，高斯是映射为无穷维，可以用泰勒展开解释。朴素贝叶斯分类器，基于贝叶斯公式。是一种计算概率的方法。训练集如果是偏斜集，正反例个数差别太大，用accuracy...
复制链接

扫一扫