Stardict 81部中文词典下载

stardict在sourceforge项目里的词典都不见,估计是由于版权方面的问题导致的,不过以前那些还是可以继续用的,没有下载的可以备份一份。每个字典文件夹里都有一个.ifo文件,可以用记事本打开,就知道是什么字典。如果要给多看系统用,找到对应的字典文件夹,如:stardict-gaojihanyudacidian_fix,将文件夹中的.idx 、.ifo、.dict三个文件拷贝到DK_System\system\dict下面。同一个字典的上述三个文件齐备该字典才可正常使用。

常用的几个字典,单独压缩成了独立的压缩包,直接解压缩复制到多看系统DK_System\system\dict下面即可。

↓-朗道英汉字典.rar http://dl.dbank.com/c0fj9j2t4j
↓-牛津现代英汉双解词典.rar http://dl.dbank.com/c0z7dopgjh
↓-高级汉语字典.rar http://dl.dbank.com/c0fqoh24g5
↓-现代汉语词典.rar http://dl.dbank.com/c01zj9wglw
↓-国际标准汉字大辞典.rar http://dl.dbank.com/c0352ue5oz

由于整个压缩包超过了Dbank单个文件上传的200Mb大小限制,分卷压缩成3个包.

stardict_zh_Cn.part1.rar  http://dl.dbank.com/c0jmbcy1th
stardict_zh_Cn.part2.rar  http://dl.dbank.com/c0rs5edc9m
stardict_zh_Cn.part3.rar  http://dl.dbank.com/c0oilzce3m

—————-压缩包中包含的词典列表——————
cdict-gb dictionary(en – zh_CN)
牛津现代英汉双解词典oxford-gb dictionary(en – zh_CN)
牛津英汉双解美化版
stardict1.3 dictionary(en – zh_CN)Sun Dict(en – zh_CN)
xdict-ec-gb dictionary(en – zh_CN)
xdict-ce-gb dictionary(zh_CN – en)
cedict-gb dictionary(zh_CN – en)
朗道英汉字典langdao-ec-gb dictionary(en – zh_CN)
朗道汉英字典langdao-ce-gb dictionary(zh_CN – en)
懒虫简明英汉词典lazyworm-ec dictionary(en – zh_CN)
懒虫简明汉英词典lazyworm-ce dictionary(zh_CN – en)
牛津简明英汉袖珍辞典oxfordjm-ec dictionary(en – zh_CN)
英汉汉英专业词典ProECCE dictionary
Hanzi Master (zh_CN – en)
湘雅医学专业词典XiangYa Medical dictionary
高级汉语大词典Advance Chinese big dictionary (zh_CN – zh_CN)
高级汉语大词典(修正版)Advance Chinese big dictionary (zh_CN – zh_CN)
国际标准汉字大辞典 International standard Chinese big dictionary (zh_CN – zh_CN)
汉语成语词典Chinese idiom dictionary (zh_CN – zh_CN)
汉语成语词典(修正版)Chinese idiom dictionary (zh_CN – zh_CN)
汉语成语词典(美化版)
现代汉语词典Modern Chinese dictionary (zh_CN – zh_CN)
现代汉语词典(修正版)Modern Chinese dictionary (zh_CN – zh_CN)
21世纪英汉汉英双向词典21 century bidirectional dictionary
英汉专业词典 quick_eng-zh_CN
21世纪双语科技词典 21 century bidirectional science and technology dictionary
新世纪英汉科技大词典ncce-ec
新世纪汉英科技大词典ncce-ce
KDic11万英汉词典 kdic-ec-11w(en – zh_CN)
计算机词汇kdic-computer-gb dictionary
佛光大辞典 FoGuang big dictionary (Buddhism)
法相辞典FaXiang dictionary (Buddhism)
佛学大辞典FoXue big dictionary (Buddhism)
中国佛教术语汉英词典 Soothill-Hodous Dictionary of Chinese Buddhist Terms(zh_CN – en)
佛教术语英汉词典 Eng-Ch-Eng dic of Buddhist terms
陈义孝佛学常见辞汇
三藏法数SanZunFaSu (Buddhism)
Chin-Eng-Buddhist
唯識名詞白話新解 yusig
Bulkwang Fo-Kuang
Various-Buddhist
汉维词典 Chinese-Uyghur Dictionary
维汉词典 Uyghur-Chinese Dictionary
汉维词典 Chinese-Uyghur Dictionary (Uyghur Latin Writing Edition)
维汉词典 Uyghur-Chinese Dictionary (Uyghur Latin Writing Edition)
德汉词典 quick_de-zh_CN
新德汉词典 xindehan
德汉词典 Fundset
汉德辞典 HanDeDict
汉法词典 Chinese-French dictionary
法汉汉法词典 French-Chinese and Chinese-French dictionary
我爱法语-英汉词典 English-Chinese dictionary
我爱法语-英法词典 English-French dictionary
我爱法语-法汉词典 French-Chinese dictionary
我爱法语-法英词典 French-English dictionary
我爱法语-法法词典 French-French dictionary
我爱法语-法意词典 French-Italian dictionary
汉日词典 kdic-cj dictionary
日汉词典 kdic-jc dictionary
日中简明专业词典 jc-special dictionary
DrEye4in1词典
DrEye5in1词典
DrEye汉日词典
DrEye日汉词典
小学馆-中日词典
小学馆-日中词典
本草纲目
英文字根字典
一典通俄汉词典
Unihan
五笔86
五笔98
康熙字典
梵高著名作品赏析
康熙字典文字版
廣韻
廣韻反查
汉越 Han-Viet
越汉 Viet-Han
中韩词典 Naver
the MDBG CC-CEDICT Chinese-English dictionary

非中文相关的词典,可以在这里继续访问http://www.stardict.cn/forum/viewtopic.php?f=11&t=945818



摘自:http://irising.me/2011/07/9021/

展开阅读全文

中文词典的扩充和组织

09-04

分词技术是中文信息处理中的关键技术之一,是信息检索、文本分类、文本聚类等各种文本处理技术的基础。目前中文分词算法逐渐趋于成熟,其分词准确率已基本能满足应用需求。rn 词典在分词技术中扮演着至关重要的角色。一方面,词典的规模(收录的词条数目)是影响分词准确率的一个重要因素。目前的词典规模都在10万个词条左右,只能满足于一般的文本(如传统的新闻报道等);随着Internet的广泛普及,日益增加的未登录词对分词技术是一个巨大的挑战,传统的中文词典已越来越难对付目前对Internet文本的分词要求,因此扩充中文核心词典是一个十分有意义的事情。rn 我最近的一个工作就是新词检测,不寻求优美的检测算法,而只追求最终的效果。通过对北大天网CWT100G数据集的统计分析,我已经抽取了近100万个新词(当然有一些噪音),其中根据我的评价方法得分最高的前10万条左右的新词效果相当不错。感兴趣的同志请与我联系:gdding@hotmail.com。以下是其中的一部分新词(其中右列为评分值):rn保险公司 102.1217630598rn老夫 101.4161935225rn千万 101.3831813758rn玩家 99.8747389063rn网络游戏 99.2633686672rn贝克汉姆 98.6127246394rn百万 97.8989631474rn萨达姆 97.5115719667rn律师事务所 97.4145752689rn信息技术 96.6513122347rn微软 96.0803421691rn姚明 95.9885301657rn新技术 95.9283498033rn帮主 94.3097484228rn化成 94.2552672475rn放入 94.2174890261rn闻言 94.0920991382rn短信 94.0665508006rn中国足球 93.9756640568rn航空公司 93.3904036729rn公司总经理 93.3007389538rn解决方案 92.9160832220rn主管部门 92.8771068835rn冷冷 92.6888841223rn管理部门 92.6264385327rn数百 92.4165308552rn系列产品 92.4150737852rn基础设施 92.4018776391rn管理系统 92.3439132146rn证券市场 92.2664635335rn点击 92.2370180445rn什麽 91.9666818061rn学家 91.9266075102rn中国市场 91.7831884230rn道长 91.7680148179rn新产品 91.7312686223rn万元 91.6393529512rn掌门 91.5954090766rn拉住 91.4054745027rn部份 91.3910453982rn剑法 91.3175642456rn抱住 91.2809315778rn小白 91.0912774799rn安全生产 90.8164919757rn高达 90.8024993815rn皇马 90.6885143725rn数码相机 90.6165621700rn证券公司 90.5219773434rn副主任 90.3355731737rn国际市场 90.2767902975rn信息系统 90.2392757515rn送回 90.1219871204rn金融机构 90.1152273859rn产品质量 90.1095372176rn环境保护 89.8504855693rn摇摇头 89.8206738428rn风险投资 89.5960110694rn经济增长 89.5194082573rn公安机关 89.5085702094rn领导干部 89.4859910310rn米卢 89.4656572355rn链接 89.4646065803rnrn 词典在分词技术中扮演的重的角色还体现在,词典的存储组织方式是影响分词速度的关键因素,对于静态词典来说,采用双数组TRIE树来词典组织是非常不错的选择,这种组织方式使得在查找词条时只需要作几次加法即可判断一个词条是否在词典中,因此查找速度极快,再加上词典的装载开销很小(只是读入数据而已),且很少占用内存,因此十分适合中文分词;本人最近的试验标明,基于双数组TRIE树来组织词典,最大匹配分词的速度可达52MB/秒(测试环境:CPU P4 3.2G,内存512MB)。本人将在后续的文章中介绍这种词典组织方法,并将本人写的词典管理和最大匹配程序打包,供各位同仁共享。感兴趣的读者可与我联系:gdding@hotmail.com。rn 论坛

没有更多推荐了,返回首页