- 博客(9)
- 资源 (6)
- 收藏
- 关注
转载 隐马尔科夫模型(HMM)
马尔科夫链马尔科夫链,因安德烈.马尔科夫(A.A.Markov,1856-1922)得名,是指数学中具有马尔科夫性质的离散事件随机过程。每个状态的转移只依赖于之前的n个状态,这个过程被称为1个n阶的模型,其中n是影响转移状态的数目。 最简单的马尔科夫过程就是一阶过程,每一个状态的转移只依赖于其之前的那一个状态。用数学表达式表示就是: 假设天气服从马尔科夫链 转移矩阵如果已知今天是晴天,那么明天
2017-11-24 16:42:35 19491 1
转载 主题模型-LDA
参考:http://blog.csdn.net/v_july_v/article/details/41209515关于LDA有两种含义,一种是线性判别分析(Linear Discriminant Analysis),一种是概率主题模型:隐含狄利克雷分布(Latent Dirichlet Allocation,简称LDA),本文讲后者。是一种无监督的贝叶斯模型是一种主题模型,它可以将文档集中每篇文档的
2017-11-18 16:32:55 10252
转载 从NB到N-gram语言模型
1、引言:朴素贝叶斯的局现象朴素贝叶斯的局限性来源于其条件独立假设,将文本看成词袋模型,不考虑词语之间的先后顺序,比如“武松打死了老虎”与“老虎打死了武松”会被认为以一个意思。N-gram语言模型能提高对词语顺序的识别能力。2、N-gram语言模型2.1 从假设性独立到联合概率链规则照抄我们垃圾邮件识别中的条件独立假设: P((“我”,“司”,“可”,“办理”,“正规发票”,“保真”,“增值税”
2017-11-12 21:01:17 833
转载 朴素贝叶斯应用之语种检测
用朴素贝叶斯完成一个语种检测的分类器预料库为twitter数据,包含English, French, German, Spanish, Italian 和 Dutch 6种语言。 1 december wereld aids dag voorlichting in zuidafrika over bieten taboes en optimisme,nl 1 millón de afect
2017-11-12 14:45:23 670
转载 朴素贝叶斯应用之文本分类
贝叶斯理论我们有一堆带标记的样本(包含 特征 和 类别),可以从中统计得到 p(特征|类别)p(特征|类别)根据 全概率公式: P(Y,X)=P(Y|X)P(X)=P(X|Y)P(Y)P(Y,X) = P(Y|X)P(X)=P(X|Y)P(Y)得到 贝叶斯公式: P(Y|X)=P(X|Y)P(Y)P(X)P(Y|X)=\frac{P(X|Y)P(Y)}{P(X)}从机器学习的视角,XX 认为
2017-11-11 20:20:58 1329
转载 朴素贝叶斯
by 寒小阳1. 引言¶贝叶斯方法是一个历史悠久,有着坚实的理论基础的方法,同时处理很多问题时直接而又高效,很多高级自然语言处理模型也可以从它演化而来。因此,学习贝叶斯方法,是研究自然语言处理问题的一个非常好的切入口。2. 贝叶斯公式¶贝叶斯公式就一行: P(Y|X)=P(X|Y)P(Y)P(X)P(Y|X)=\frac{P(X|Y)P(Y)}{P(X)} 而它其实是由以下的联合概率公式推导
2017-11-08 21:55:49 12325 1
原创 Andrew NG 机器学习 笔记-week11-应用实例:图片文字识别(Application Example:Photo OCR)
1、问题描述和流程图(Problem Description and Pipeline)photo OCR:photo Optical Character Recognition图像文字识别,要求从一张给定的图片中识别文字。为了完成这样的工作,需要采取如下步骤:文字侦测(Test detection):将图片上的文字与其他环境对象分离开来字符切分(Character segmentation):
2017-11-06 10:10:47 2931 1
原创 Andrew NG 机器学习 笔记-week10-大规模机器学习(Large Scale Machine Learning)
一、Gradient Descent with Large Datasets1、大型数据集的学习(Learning with Large Datasets)得到一个高效的机器学习系统的最好方式之一是,用一个低偏差的学习算法,然后用大量的数据训练它。如 补全句子单词的例子。有大量的数据,很多算法都能够取得不错的效果。有种说法:通常不是最好的算法取胜,而是谁有最多的数据。但大数据集训练也有它自身的问题,
2017-11-05 19:10:20 1098
原创 Andrew NG 机器学习 练习8-Anomaly Detection and Recommender Systems
1 Anomaly detection实现一个异常检测算法检测服务器的异常行为 特征是 每个服务器的 吞吐量(throughput)(mb/s) 和 相应延迟(ms) 采集 m=307 台运行中的服务器的特征,{x(1),...,x(m)x^{(1)},...,x^{(m)}} 其中大部分是 normal 的服务器特征你将使用 高斯模型 检测数据集中的异常样例 从 2D 数据集开始,以便可视
2017-11-03 11:20:54 810
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人