- 博客(30)
- 收藏
- 关注
原创 期望极大算法:Expectation Maximization Algorithm
EM算法是一种迭代的算法,也可以说是一类算法的范式。概率模型中,有时候不仅存在观测变量,还可能存在隐含变量或者潜在变量。如果模型中的变量都是观测变量,那么直接使用极大似然估计或者贝叶斯估计来估计参数;当变量中含有隐变量时,就可以采用EM算法来进行能够参数的估计。EM算法主要分为两步:E步,求期望;M步,求极大。
2017-10-25 17:23:41 1828
原创 条件随机场:Conditionl Random Field
CRF条件随机场是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔可夫随机场。条件随机场可以用于不同的预测问题。概率无向图模型定义概率无向图模型又称为马尔可夫随机场(Markov Random Field),是一个可以由无向图表示的联合概率分布。图一般记作G=(V,E)G=(V,E),其中VV表示节点,EE表示边。概
2017-10-22 00:13:07 702
原创 最大熵模型
最大熵模型最大熵模型由最大熵原理推导而来。最大熵原理是概率模型的学习的一个准则,最大熵原理认为,学习概率模型时,在所有概率模型中,熵最大的模型时最好的模型,通常利用约束条件来确定概率模型的集合。所以,最大熵原理也可表述为在满足约束条件的模型集合中选取熵最大的模型。
2017-10-21 16:47:36 579
原创 k近邻法: k-nearest neighbor
KNN:k近邻算法既可以作为分类方法也可以作为回归方法。考虑作为分类的时候,算法的输入为特征空间,输出为实例的类别。 基本思想:给定一个训练集,然后寻找其中与新输入的实例最近的k个实例,将新实例标记为k个实例中所属类别最多的一类。
2017-10-19 13:07:16 803
原创 欢迎使用CSDN-markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
2017-10-11 15:35:20 151
原创 支持向量机(Support Vector Machine)
支持向量机问题提出支持向量机的分类基本思想在给定的样本空间中寻找一个超平面将训练样本进行分割,而且能够对新样本也进行正确的分类。
2017-10-05 17:46:58 459
原创 过拟合与数据不平衡
过拟合与数据不平衡什么是过拟合?过拟合就是学习器对训练样本数据的学习的过于彻底,将一些训练样本的噪声或者不属于全体样本的一般特征也学习了,造成在训练样本上效果表现很好而在测试样本上表现效果非常差的一种现象。为什么会过拟合?对于数据样本,可能存在隐单元的表示不唯一,即产生分类的决策面不唯一,随着学习的进行,BP算法使权值可能收敛过于复杂的决策面。权值学习迭代次数足...
2017-10-04 17:55:24 2827
原创 损失函数
损失函数损失函数(loss function)又称为代价函数(cost function),是一种用来评价模型预测值和样本真实值之间的相似程度,一般为一个非负函数。损失函数的值越小,表示预测值和真实值之间相差越小,模型的性能越好。
2017-10-03 22:57:10 758
原创 模型评估与选择
本部分解决的是机器学习模型的选择问题: 1.用什么方法来评价模型?构建验证集,考察验证集的结果。 2.用什么来度量模型的性能?多种性能度量,来衡量验证集的结果。 3.怎么来比较模型而做出现则?
2017-10-03 15:47:32 828
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人