NLP
文章平均质量分 76
Des_Tiny
这个作者很懒,什么都没留下…
展开
-
Beam Search Algorithm (Draft by Andrew Jungwirth)
ObjectivesTo show how the Beam Search Algorithm uses a heuristic function and a given beam width in an attempt to simulate the Breadth-First Search in a memory-efficient way.To emphasize the i转载 2014-02-24 16:20:41 · 1053 阅读 · 0 评论 -
估计概率构造短语翻译表
经过第三步抽取短语后,获得基于短语系统使用的翻译短语对,而接下来的第四步就是短语翻译表概率估计,它的作用是对翻译短语对的正确性进行合理的评估。 在上一节,我们得到了短语对集合,如下图所示: 在这里,我们估计概率主要进行四个分数的计算,即双向短语翻译概率(正向:“源语言->目标语言”方向;反向:“目标语言->源语言”方向 )、双向词汇化权重。首转载 2014-02-26 21:27:47 · 851 阅读 · 0 评论 -
判别式模型与生成式模型
判别式模型该模型主要对p(y|x)建模,通过x来预测y。在建模的过程中不需要关注联合概率分布。只关心如何优化p(y|x)使得数据可分。通常,判别式模型在分类任务中的表现要好于生成式模型。但判别模型建模过程中通常为有监督的,而且难以被扩展成无监督的。 常见的判别式模型有: Logistic regression Linear discriminant a转载 2014-02-27 11:39:13 · 709 阅读 · 0 评论 -
机器翻译中的参数调整---MERT方法
机器翻译的大牛Och在2003提出的方法,用于统计机器翻译中对数线性模型参数的调整,这几天读了这篇论文,也算是有了点了解。写篇文章,要不然就忘了,哈哈。Och在文章中提出在之前的参数调整方法中,参数的确定和最终的翻译质量并没有什么紧密的联系,比如在统计机器翻译的对数线性模型中feature的权重需要调整,使用的准则就是如下的公式:转载 2014-02-27 13:19:53 · 2113 阅读 · 0 评论 -
NLP 学习笔记(Log-linear Models)
============================================================== == all is based on the open course nlp on coursera.org week 7,week 8 lecture == =========================转载 2014-02-27 13:31:16 · 1759 阅读 · 0 评论 -
自然语言处理(NLP)网上资源整理
http://blog.csdn.net/xuh5156/article/details/7437475最近把一些在网上见到的自然语言处理的资源整理了一下,包括论文列表、软件资源和一些实验室主页、个人主页等,希望能对NLP研究者有所帮助,由于个人视野有限,目前只整理了这些,以后会持续更新。在此也感谢这些资源的提供者和维护者。转载请标明出处(http://blog.csdn.转载 2014-02-17 12:50:42 · 1440 阅读 · 0 评论 -
句子对齐工具
1,CTK: Champollion Tool Kit基于词汇的,结合句长的。有英语-阿拉伯语、英语-汉语的语言对。2,Para用prolog这种语言写的,具体不清楚。3,Bilingual Sentence Aligner用perl写的,nlp中各种脚本语言啊。支持单文件对齐,也支持目录下的对齐。4,vanilla alignerc写的,据转载 2013-12-03 15:20:33 · 3597 阅读 · 1 评论