- 博客(5)
- 资源 (11)
- 收藏
- 关注
原创 中文分词笔记之三:示例代码及测试结果
示例代码: /** *g为邻接表 *i为当前节点 */ Iterator it1 = g.getPrev(i);//得到一级前驱词集合 double maxProb = Double.NEGATIVE_INFINITY; int maxPrev1 = -1; int maxPrev2 = -1; while(it1.hasNext()) { CnToken t1
2015-01-31 13:46:16 991
原创 中文分词笔记之二:隐马尔科夫模型
总结,隐马尔科夫模型一共有两组状态,三个矩阵 隐藏状态:一个系统的(真实)状态,可以由一个马尔科夫过程进行描述(例如,天气)。 观察状态:在这个过程中‘可视’的状态(例如,海藻的湿度)。 向量:包含了(隐)模型在时间 t=1 时一个特殊的隐藏状态的概率(初始概率)。 状态转移矩阵:包含了一个隐藏状态到另一个隐藏状态的概率 混淆矩阵:包含了给定隐马尔科夫模型的某一个特殊的隐
2015-01-29 22:11:04 1526
原创 中文分词笔记之一:概率基础
分词,对于一个字符串C=可以输出多个词串S=,而S中最大的那个,就是我们要的结果。根据贝叶斯公式,其中P(C),可以从语料库统计得出,在这里只是一个固定值;且P(C|S)=1。因此,比较P(S|C)的大小变成比较P(S)的大小: 根据马尔科夫模型可得:P(S) = P(w1,w2,...,wn)= P(w1)P(w2|w1) P(w3|w1,w2
2015-01-28 23:07:37 7511
原创 神经网络BP的简单实现
/* * 将三位二进制数转为一位十进制数 * * 作者:zhangdapeng * */#include #include #include #includeusing namespace std;const int layer=2;//BP层的数量const int in_unit=3; //输入单元数const int hide_unit=100;//隐藏
2015-01-06 21:47:22 1916
原创 文件类型判断笔记。
/** * */package boa.word.poi;import java.io.File;import java.io.FileInputStream;/** * @author zhangdapeng 2015年1月3日下午4:55:25 */public class FileTypeJudge { public enum FileType { JPG("
2015-01-05 21:13:47 1118
HTK语音识别
2017-03-22
数理统计与数据分析 第3版
2015-11-24
基于jersey v2.10的webservice核心框架
2014-07-24
Eclipse Rich Client Platform 2nd Edition with Source Code.zip
2014-05-12
模式分析的核方法,english 2th edition
2010-12-10
kpca 核主成分分析
2010-12-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人