2017年10月_xholes

EM算法是一种迭代的算法，也可以说是一类算法的范式。概率模型中，有时候不仅存在观测变量，还可能存在隐含变量或者潜在变量。如果模型中的变量都是观测变量，那么直接使用极大似然估计或者贝叶斯估计来估计参数；当变量中含有隐变量时，就可以采用EM算法来进行能够参数的估计。EM算法主要分为两步：E步，求期望；M步，求极大。

2017-10-25 17:23:41 1828

原创条件随机场：Conditionl Random Field

CRF条件随机场是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型，其特点是假设输出随机变量构成马尔可夫随机场。条件随机场可以用于不同的预测问题。概率无向图模型定义概率无向图模型又称为马尔可夫随机场(Markov Random Field)，是一个可以由无向图表示的联合概率分布。图一般记作G=(V,E)G=(V,E)，其中VV表示节点，EE表示边。概

2017-10-22 00:13:07 702

原创最大熵模型

最大熵模型最大熵模型由最大熵原理推导而来。最大熵原理是概率模型的学习的一个准则，最大熵原理认为，学习概率模型时，在所有概率模型中，熵最大的模型时最好的模型，通常利用约束条件来确定概率模型的集合。所以，最大熵原理也可表述为在满足约束条件的模型集合中选取熵最大的模型。

2017-10-21 16:47:36 579

原创 k近邻法: k-nearest neighbor

KNN:k近邻算法既可以作为分类方法也可以作为回归方法。考虑作为分类的时候，算法的输入为特征空间，输出为实例的类别。基本思想：给定一个训练集，然后寻找其中与新输入的实例最近的k个实例，将新实例标记为k个实例中所属类别最多的一类。

2017-10-19 13:07:16 803

原创感知机:Perceptron Learning Algorithm

PLA:感知机学习算法

2017-10-18 23:32:53 2661

原创机器学习、深度学习、数据挖掘——问题集锦

机器学习、深度学习、数据挖掘——问题集锦1、对偏差、方差的理解

2017-10-11 16:52:19 855

原创欢迎使用CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来，用它写博客，将会带来全新的体验哦：Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2017-10-11 15:35:20 151

原创支持向量机（Support Vector Machine）

支持向量机问题提出支持向量机的分类基本思想在给定的样本空间中寻找一个超平面将训练样本进行分割，而且能够对新样本也进行正确的分类。

2017-10-05 17:46:58 459

原创线性回归(Linear Regression)

线性回归

2017-10-05 07:13:53 1352

原创数据清洗

数据清洗数据清洗的目的是消除数据中的错误、冗余和数据噪音，是数据预处理中的一部分。

2017-10-04 23:00:41 3955

原创过拟合与数据不平衡

过拟合与数据不平衡什么是过拟合？过拟合就是学习器对训练样本数据的学习的过于彻底，将一些训练样本的噪声或者不属于全体样本的一般特征也学习了，造成在训练样本上效果表现很好而在测试样本上表现效果非常差的一种现象。为什么会过拟合？对于数据样本，可能存在隐单元的表示不唯一，即产生分类的决策面不唯一，随着学习的进行，BP算法使权值可能收敛过于复杂的决策面。权值学习迭代次数足...

2017-10-04 17:55:24 2827