厉害了!竟然有程序员在GitHub上建了一个新华词典数据库

今天,给大家推荐一个GitHub上的一个热门项目——chinese-xinhua ,一个新华字典数据库,截至今日,该项目已经获得了 927个「star」以及 230个「fork」。可能是知道的太少了


这个数据库收录了包括14032条歇后语,16142个汉字,31648个成语。(GitHub项目地址:https://github.com/pwxcoo/chinese-xinhua


该数据库的所有数据都放在data/ 目录,对性能没需求的话,可以直接使用作者的新华字典 API 。下面,我们一起来详细了解一下这个数据库



项目结构


该数据库的项目结构如下:


chinese-xinhua/
|
+- .vscode/
|
  |
|
  +- launch.json <-- VSCode 配置文件
|
+- data/ <-- 数据文件夹
|
  |
|
  +- idiom.json <-- 成语
|  |
|  +- word.json <-- 汉字
|
  |
|
  +- xiehouyu.json <-- 歇后语
|  |
|  +- ci.json <-- 词语
|
  |
|
  +- ci.csv <-- 词语(csv 版本)
|
+- scripts/ <-- 脚本文件夹
|
  |
|
  +- addAbbreviation.py <-- 给成语添加首字母缩写的脚本
|  |
|  +- chengyu.py <-- 下载成语脚本
|
  |
|
  +- word.py <-- 下载汉字脚本
|  |
|  +- xiehouyu.py <-- 下载歇后语脚本
|
  |
|
  +- ci.py <-- 下载词语脚本



数据库介绍


成语


[
    {
        "derivation""语出《法华经·法师功德品》下至阿鼻地狱。”",
        "example""但也有少数意志薄弱的……逐步上当,终至堕入~。★《上饶集中营·炼狱杂记》",
        "explanation""阿鼻梵语的译音,意译为无间”,即痛苦无有间断之意。常用来比喻黑暗的社会和严酷的牢狱。又比喻无法摆脱的极其痛苦的境地。",
        "pinyin""ā bí dì yù",
        "word""阿鼻地狱",
        "abbreviation""abdy"
    },
    ...
]



词语


[
    { 
        "ci""宸纶"
        "explanation""1.帝王的诏书﹑制令。" 
    },
    ...
]



汉字


[
    {
        "word""嗄",
        "oldword""嗄",
        "strokes""13",
        "pinyin""á",
        "radicals""口",
        "explanation""嗄〈叹〉  同啊”。表示省悟或惊奇  嗄!难道这里是没有地方官的么?--宋·佚名《新编五代史平话》  嗄á叹词。在句首,〈表〉疑问或反问~,这是什么?~,你想干什么?"嗄"另见shà㈠。  嗄shà  ⒈声音嘶哑~声。  嗄a 1.助词。表示强调﹑肯定或辩解。 2.助词。方言。表示疑问或反诘。  嗄xià 1.见"嗄饭"。 2.见"嗄程"。",
        "more""嗄 ga、a 部首 口 部首笔画 03 总笔画 13  嗄2 shà 〈形〉 (1) 声音嘶哑的 [hoarse] 终日嚎而嗌不嗄。--《老子》 (2) 又如嗄哑,嗄嘶(嗓音嘶哑) 嗄 shà 〈叹〉 (1) 什么 [what]--表示否定 我要丢个干干净,看你嗄法把我治。--清·蒲松龄《聊斋俚曲集》 (2) 旧时仆役对主人、下级对上级的应诺声 [yes] 带进来”。两边军士应一声嗄”,即将牛皋推至面前。--《说岳全传》 另见á 嗄1 á 〈叹〉 同啊”(á)。表示省悟或惊奇 [ah] 嗄!难道这里是没有地方官的么?--宋·佚名《新编五代史平话》 另见shà 嗄1 shà ㄕㄚ╝ 嗓音嘶哑。 郑码janr,u55c4,gbke0c4 笔画数13,部首口,笔顺编号2511325111354 嗄2 á ㄚˊ 同啊2”。 郑码janr,u55c4,gbke0c4 笔画数13,部首口,笔顺编号2511325111354"
    },
    ... 
]



API接口


GET、POST均可,返回数据格式为JSON。下面将以GET做示例


直接请求成语,则需要两个参数:

● type=idiom 表示需要请求成语

● word=兴高采烈 表示请求的成语


示例,如请求兴高采烈的成语,返回结果如下:


640?wx_fmt=jpeg


当你请求的是成语时,返回的结果包括:成语的来源、成语的解释、成语的拼音、用成语造的句子以及成语的首字母缩写。


直接请求拼音首字母缩写,需要两个参数:

● type=idiom 表示需要请求成语

● word=xgcl 表示请求的成语拼音首字母缩写


请求歇后语,同样需要两个参数

● type=xiehouyu 表示需要请求歇后语

● riddle=王婆 表示请求的歇后语的语面。可以模糊匹配


640?wx_fmt=jpeg


请求歇后语,结果会返回带有你输入的关键词的所有歇后语。


请求汉字,需要两个参数

● type=word 表示需要请求汉字

● word=吴 表示请求的汉

感兴趣的可以到GitHub上看看,果然是最怕程序员有文化。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值