NLP
elisa_gao
这个作者很懒,什么都没留下…
展开
-
N-gram模型
N-Gram是大词汇连续语音识别中常用的一种语言模型,对中文而言,我们称之为汉语语言模型(CLM, Chinese Language Model)。汉语语言模型利用上下文中相邻词间的搭配信息,在需要把连续无空格的拼音、笔划,或代表字母或笔划的数字,转换成汉字串(即句子)时,可以计算出具有最大概率的句子,从而实现到汉字的自动转换,无需用户手动选择,避开了许多汉字对应一个相同的拼音(或笔划串,或数字串转载 2013-11-09 10:13:20 · 679 阅读 · 0 评论 -
NLP重要概念集锦
SRL:SRL(Semantic Role Labeling, 语义角色标注)是一种浅层的语义分析技术,它标注句子中某些短语为给定谓词的论元(语义角色)。SRL可以分为两个子任务,一是识别,即判断一个短语是否 语义角色;其次是分类,即判断该短语属于哪一种语义角色原创 2014-03-31 19:14:27 · 525 阅读 · 0 评论 -
语言模型n-gram
deleted interpolation trigramhttp://www.cslu.ogi.edu/HLTsurvey/ch1node41.html原创 2014-04-17 18:15:11 · 859 阅读 · 0 评论 -
kneser ney平滑
http://books.google.com.hk/books?id=GyjBtfWFcO8C&pg=PA56&lpg=PA56&dq=kneser+ney%E5%B9%B3%E6%BB%91&source=bl&ots=QDtLsA1x3J&sig=Ymucml9rVWw3g0wnIbX90Z6fKFc&hl=zh-CN&sa=X&ei=RqRPU-KgPKXsiAfhvoHIDA&ved=0原创 2014-04-17 17:58:40 · 5122 阅读 · 0 评论 -
CRF-条件随机场
参见:http://blog.csdn.net/chlele0105/article/details/14897761在组块方面效果还不错原创 2014-04-19 19:58:54 · 705 阅读 · 0 评论 -
HMM 学习+Viterbi Algorithm
参见:http://www.52nlp.cn/hmm-learn-best-practices-six-viterbi-algorithm-1原创 2014-04-19 11:36:57 · 484 阅读 · 0 评论 -
CYK算法
这个部分最好的材料还是看原创 2014-06-09 20:23:56 · 7953 阅读 · 1 评论 -
少数民族语言
最好的语料获取地方就是去维基上查找语言,ranho原创 2014-07-27 17:32:20 · 1554 阅读 · 0 评论