NLP语料库索引

转载 2012年03月29日 15:45:40

中央研究院现代汉语标记语料库(现代汉语平衡语料库):http://www.sinica.edu.tw/SinicaCorpus/ 这是首页。

进入中文版,就是这个:http://www.sinica.edu.tw/ftms-bin/kiwi1/mkiwi.sh

 

中央研究院近代汉语标记语料库:

http://www.sinica.edu.tw/Early_Mandarin/

 或http://db1x.sinica.edu.tw/cgi-bin/kiwi/pkiwi/pkiwi.sh

 

中央研究院汉籍电子文献(瀚典全文检索系统)http://www.sinica.edu.tw/ftms-bin/ftmsw3

 

国家现代汉语语料库:http://124.207.106.21:8080/(不知道是不是网络的原因 我没打开)


国家语委现代汉语语料库:http://www.clr.org.cn/retrieval/index.html(同上,也没打开~~~~(>_<)~~~~ 不知道这俩一样不)

树图数据库:http://treebank.sinica.edu.tw/

语料库语言学在线:corpus4u.org(搜LOCNESS就能出来LOCNESS) 

北京大学中国语言学研究中心,简称CCL语料库检索系统(包括:现代汉语语料库、古代汉语语料库、汉英双语语料库)http://ccl.pku.edu.cn/Yuliao_Contents.Asp

北京大学《人民日报》标注语料库:http://www.icl.pku.edu.cn

北京语言大学的语料库:http://www.blcu.edu.cn/kych/H.htm

清华大学的汉语均衡语料库TH-ACorpushttp://www.lits.tsinghua.edu.cn/ainlp/source.htm

山西大学语料库http://www.sxu.edu.cn/homepage/cslab/sxuc1.htm                     

台湾南岛语典藏:http://www.ling.sinica.edu.tw/Formosan/

闽南语典藏:http://southernmin.sinica.edu.tw/

香港城市大学的LIVAC共时语料库:http://www.rcl.cityu.edu.hk/livac/

                                         或 http://www.LIVAC.org

浙江师范大学的历史文献语料库: http://lib.zjnu.net.cn/xueke/hyywzx/xkjj.htm

中国科学院计算所的双语语料库:http://mtgroup.ict.ac.cn/corpus/query_process.php

中文语言资源联盟:http://www.chineseldc.org/xyzy.htm 

红楼梦汉英平行语料库:http://score.crpp.nie.edu.sg/hlm/index.htm

 
SKETCHENGINE多语言语料库:www.sketchengine.co.uk 
每个邮箱可以注册一次,免费期是一个月,免费期过了就再注册一个邮箱,再注册一次。其中汉语语料库是没有加工的生语料库,使用价值不大。关键是其中的英语语料库实际上是原来要付费才能使用的BNC,可以好好利用。

 

The Lancaster Corpus of Mandarin Chinesehttp://ota.oucs.ox.ac.uk/scripts/download.php?otaid=2474

British National Corpus http://www.natcorp.ox.ac.uk/ 

American National Corpus http://americannationalcorpus.org/ 

LIVAC共时语料库 http://www.livac.org/ 

DICKENS Corpus  http://www.ims.uni-stuttgart.de/ ... /frames-simple.html

 

【在线字典、工具类】

OED在线词典:从www.oed.com登入。用户名:coastline。密码:oed789

汉典 http://www.zdic.net/

在线新华字典http://xh.5156edu.com/

汉语在线词典 http://fawen.cn/hanyu-zidian.html

爱词霸汉语词典http://hanyu.iciba.com/(有汉字笔顺Flash的演示,不错。PS:爱词霸的其它链接也不错)

商务印书馆工具书在线http://www.refbook.com.cn/category/home.do;jsessionid=851D3F0AFC8AC8C0910A953BD7332E21

里氏词典在线 http://fawen.cn/hanyu-zidian.html

朗文英英在线字典:http://www.ldoceonline.com/

The Commens Dictionary of Peirce's Termshttp://www.helsinki.fi/science/commens/dictionary.html 

Lexicon of Linguistics http://www2.let.uu.nl/UiL-OTS/Lexicon/ 

Cambridge Dictionaries Online http://dictionary.cambridge.org/ 

1000 Dictionaries http://www.1000dictionaries.com 

Encyclopedia http://www.encyclopedia.com/ 

法语拉鲁斯 http://www.larousse.fr/

韩国21世纪世宗计划语料库(21세기 세종계획)http://www.sejong.or.kr/

【计算语言学里面使用最广的汉语树库】
Penn Chinese TreeBank (By UPenn)http://www.cis.upenn.edu/~chinese/ctb.html 
Chinese PropBank (By U of Colorado) http://verbs.colorado.edu/chinese/cpb/

 【语料库语言学在线】http://www.corpus4u.org/

更多请看http://elearning.ling.sinica.edu.tw/resources.html

相关文章推荐

NLP语料库

英语学习者语料库(书面语及口语)中国学习者语料库 CLEC(100万)广外、上海交大 大学英语学习者口语语料库 COLSEC (5万) 上海交大 香港科技大学学习者语料库 HKUST Learne...

NLP 语料库 大全

此语料库清单包括了中文与英文,大家且看且珍惜…… 国内可用免费语料库(凡没有标注不可用的链接均可用) (一) 国家语委 1.国家语委现代汉语语料库http://www.cnc...

nltk(3)——语料库

NLTK包含众多一系列的语料库,这些语料库可以通过nltk.package 导入使用。每一个语料库可以通过一个叫做“语料库读取器”的工具读取语料库,例如:nltk.corpus 每一个语料库都包含许多...

Kaldi学习笔记:跑Aurora语料库

1、Aurora语料库 跟tidigits有点类似,说话的内容也是1-9ZO,test有1000条数据,train有8000多条数据。在Kaldi中没有Aurora的样例,可以在tidigits的样...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)