自然语言处理
文章平均质量分 77
historyasamirror
爱机器,爱学习。
三年的NLP经验,期间涉及Machine Learning,Data Mining,骨子里由衷的喜欢;
正在做分布式,感觉自己很幸运,这个领域一定大有可为;
关注User Study,学会从用户的角度看技术;
展开
-
Zipf's law
Zipfs law(中文似乎叫齐普夫定律)这是自然语言处理领域的一个有趣的定律,其实称为规律更合适,因为这是一个经验性的结果,是通过统计数据得出来的近似的规律。它的定义有些绕口,就是说,在一个自然语言的语料库中,一个词的出现频数和这个词在这个语料中的排名(这个排名是基于出现次数的)成反比。"Zipfs law states that given some corpus of natural l原创 2008-10-22 16:27:00 · 5835 阅读 · 2 评论 -
基于互联网语料的“机器翻译助手”
如果将机器翻译看做是一条线的话,那么线的一头就是类似于金山词霸的词典式方法。这种方法只提供词这一层面的翻译。对于一个不认识的英文单词,通过查找词典可以找到它对应的中文。同样,查找一个中文词可以找到很多个可能对应的英文单词。这种翻译方式很大的一个缺点是缺少翻译中的上下文信息,它只能孤立的进行词与词之间的翻译,而没有考虑到在不同的上下文环境中词的含义是不一样的。例如“吃了午饭”中的“吃”对应的词应该是原创 2009-01-09 10:15:00 · 2578 阅读 · 0 评论