自然语言处理
nuoline
关注NLP,ML,云计算,大数据,hadoop
微博:http://weibo.com/nuoline
个人博客网站:http://www.zhaizhouwei.cn/
展开
-
NLP资源
我爱自然语言处理http://www.52nlp.cn/镜像http://blog.52nlp.org/tag/pythonhttp://blog.52nlp.org/getting-started-in-natural-language-processing机器翻译http://www.nlplab.com/NiuPlan/NiuTrans.html语义相似度测试集http:/原创 2013-02-25 18:39:30 · 654 阅读 · 0 评论 -
自然语言处理资源与工具
Bibliographies Bibliography of constructive induction - featureengineeringBibliographyon Automated Text CategorizationBibliography - Text CategorizationAutomatic Text Processing related shor原创 2013-02-25 18:37:19 · 2009 阅读 · 0 评论 -
语料库资源-持续更新
http://kdd.ics.uci.edu/databases/原创 2013-02-25 18:42:08 · 1002 阅读 · 0 评论 -
自然语言处理技术的三个里程碑
自然语言处理技术的三个里程碑微软亚洲研究院黄昌宁张小凤摘要要:本文就半个世纪以来自然语言处理(NLP)研究领域中笔者所观察到的要点进行阐述,其中包括两个事实和三大重要成果。近年自然语言处理研究所揭示的两个事实为:(1)对于句法分析来说,基于单一标记的短语结构规则是不充分的;(2)短语结构规则在真实文本中的分布呈现严重扭曲。换言之,有限数目的短语结构规则不能覆盖大规模语料中的语法现原创 2013-02-25 18:38:05 · 7109 阅读 · 0 评论 -
国内语料库建设
英语学习者语料库(书面语及口语)中国学习者语料库 CLEC(100万)广外、上海交大大学英语学习者口语语料库 COLSEC (5万) 上海交大香港科技大学学习者语料库 HKUST Learner Corpus 香港科技大学中国英语专业语料库 CEME (148万) 南京大学中国英语学习者口语语料库 SECCL (100万) 南京大学国际外语学习者英语口语语料库中国部分 LINSEI-Ch原创 2013-02-25 18:38:07 · 1251 阅读 · 0 评论 -
From Google Research Blog: Googl…
发表于 2011年05月19号 由 52nlp 自然语言处理与计算语言学的盛会ACL 2011即将在美国俄勒冈州波特兰市举行,而Google ResearchBlog在昨天发表了一篇“Googleat ACL 2011”,给大家及时通报了今年Google在ACL2011上的参与情况。粗略的看了一下,Google今年在ACL上发表的Paper涉及Part-of-Speech Taggi原创 2013-02-25 18:38:12 · 634 阅读 · 0 评论 -
Ltp: Language Technology Platfor…
Introduction语言技术平台(Language TechnologyPlatform,LTP)是哈工大社会计算与信息检索研究中心历时十年开发的一整套中文语言处理系统。LTP制定了基于XML的语言处理结果表示,并在此基础上提供了一整套自底向上的丰富而且高效的中文语言处理模块(包括词法、句法、语义等6项中文处理核心技术),以及基于动态链接库(DynamicLink Library, DL原创 2013-02-25 18:38:14 · 1330 阅读 · 0 评论 -
ACL-NLP顶级会议
ACL会议(Annual Meeting of the Association for ComputationalLinguistics)是自然语言处理与计算语言学领域最高级别的学术会议,由计算语言学协会主办,每年一届。涉及对话(Dialogue)篇章(Discourse)评测( Eval)信息抽取( IE)信息检索( IR)语言生成(LanguageGen)语言资源(Langu原创 2013-02-25 18:41:56 · 29683 阅读 · 0 评论 -
开源的机器翻译系统
本文介绍了统计机器翻译领域中一些重要的开源软件,包括词语对齐工具、语言模型工具、自动评测工具以及四个完整的统计机器翻译系统。1. Egypt Egypt是在1999年约翰霍普金斯大学统计机器翻译夏季讨论班上,由一些研究人员共同合作开发的统计机器翻译工具包。它包括4个模块: Whittle:语料库预处理模块; GIZA:用于从句子对齐的双语语料原创 2013-02-25 18:43:19 · 6583 阅读 · 0 评论