自然语言处理
貌似楚君
哈工大英才学院2012级计算机系科学学生
展开
-
吃货的自然语言消岐
吃货的自然语言消岐2013年11月29日20:22贝叶斯分类 贝叶斯分类是在消除歧义时使用一个长度有限的窗口,根据上下文的性质求出最大的可能性的语义是哪一个。 但是这种方法在某些较为复杂的语句分析中可能存在问题。 比如说:有一个烧烤店的广告:“烤各种烤串,涮串”这句话是什么意思呢??这句话本身是一个错误的句子。句首的动词烤按时了后面的宾语是烧烤用的原原创 2013-12-09 18:35:20 · 448 阅读 · 0 评论 -
基于语料库的工作
基于语料库的工作2013年11月20日21:28 词干化:诸如sit,sits,sat这样的词是否应该被视作相同的词??一般认为,这个想法在语义学上是有意义的。一般把这个过程成为词干化 PS:是否应该注意到seated和sit之间的不强的关联性呢??station和stationary之间的关联性???非派生词之间也可能有语义上的关联。如英语原创 2013-12-09 18:33:30 · 420 阅读 · 0 评论 -
基于统计的语义消岐基础
基于统计的语义消岐基础 语义消岐一般包含两类问题:一是对有多次性的词的词性标注。例如:station二是在一个词性下不同语义的处理。 前一种情况通常利用邻近的结构信息。而后一种情况更多地考虑相隔距离很远的实词对语义的影响。 Supervised learning and unsupervisedlearning 伪词的制造。 算法上界和算法下界算原创 2013-12-09 18:28:59 · 401 阅读 · 0 评论 -
数学与信息论 基础
信息熵信息论的知识有香农开创。熵的值越大,事件的不确定性越大,能正确估计该事件的难度越高,需要的编码量越大,即信息含有的较多。 熵是信息量的量度。 在取以2为底的对数时,熵的单位是比特。H(P)=ΣP(x)log21/P(x)一个事件某种情况的概率越小,意味着情况的分类越细微,信息量越大。概率空间中的解的概率越大,意味着这种情况更能反映该事件的性质。熵是原创 2013-11-20 21:28:47 · 641 阅读 · 0 评论 -
人工智能(AI)概述
人工智能(AI)概述 人工智能有哲学,数学,控制科学等等方面的贡献。AI是为了让计算机实现人的某种功能,完成某种工作。 哲学在认知论上帮助人工智能。要深思的不是结局而是手段。 形式化规则=命题逻辑和一阶谓词逻辑。使用形式化逻辑不可能达成完整的人工智能。 可计算性不完备性定理的一种表示:整数的某些函数是无法用算法表示,不可计算的。 不可操原创 2013-11-15 17:12:38 · 1446 阅读 · 0 评论