武学与Python(一)

本文介绍了如何结合武侠元素和深度学习,使用Python从新华字典中提取汉字,生成128x128的图像作为武学图标,并探讨了将文字信息存储到图像中以及从图像中解析文字的方法,实现了武学名称的自动化生成。
摘要由CSDN通过智能技术生成

前言

最近沉迷武侠小说和武侠网络游戏,被里边的武学招式深深的吸引住了。武侠小说还好,整个江湖世界由作者搭建而起,主角也在起稿之后定了下来。且不说独一无二,但是武侠小说里但主角大多拥有被人无法获得的独特心法和极为给力的招式。但武侠网络游戏不同。虽然每个在线玩家在剧情当中能够体会到主角的感觉,但是每个玩家并不是独一无二的。他们有着同样的技能图标,有着同样的武学名称。有人会说,就算这些都一样,但是不同的手法和反应速度,每个玩家也会不同。我就在想,可不可以使用某些方法,让程序自动生成武侠网易的技能图标和武学名称呢?


起手式—仙人指路

既然是武学名称,那自然是由汉字组成。我去搜索了以下,找到了一个十分完备的汉字库,没错,那就是新华字典。这个仓库包含了14032 条歇后语,16142个汉字,264434个词语,31648个成语。没错,我们总共才有16142个汉字,可以用一张图像随意进行范围覆盖。用多大的图像呢?我们来算算:128*128=16384。好巧啊,常用的128*128图像正好能够对所有汉字进行全覆盖。那就这么决定了,使用128*128的图像作为汉字的载体。到这里有人要问了,为啥要用图像来承载所有汉字?目前我的想法是:

  • 可以将武学图标和武学名称统一到这张图像上。
  • 目前来看深度学习在可以很好的处理图像中的某些问题。

第一式—浑水摸鱼

直接下载下来的新华字典较为的冗余,但我们只需要其中但汉字,故我们需要对这个数据库做一个数据的提取。我们先来看看汉字库的json文件

    {
   
        "word": "吖",
        "oldword": "吖",
        "strokes": "6",
        "pinyin": "ā",
        "radicals": "口",
        "explanation": "喊叫天~地。\n 形容喊叫的声音高声叫~~。\n\n 吖ā[吖啶黄](-dìnghuáng)〈名〉一种注射剂。\n ────────────────—\n \n 吖yā 1.呼;喊。",
        "more": "吖 a 部首 口 部首笔画 03 总笔画 06  吖2\nyā\n喊,呼喊 [cry]\n不索你没来由这般叫天吖地。--高文秀《黑旋风》\n吖\nyā\n喊声\n则听得巡院家高声的叫吖吖。--张国宾《合汗衫》\n另见ā\n吖1\nā\n--外国语的音译,主要用于有机化学。如吖嗪\n吖啶\nādìng\n[acridine] 一种无色晶状微碱性三环化合物c13h9n,存在于煤焦油的粗蒽馏分中,是制造染料和药物(如吖啶黄素和奎吖因)的重要母体化合物\n吖1\nyā ㄧㄚˉ\n(1)\n喊叫天~地。\n(2)\n形容喊叫的声音高声叫~~。\n郑码jui,u5416,gbkdfb9\n笔画数6,部首口,笔顺编号251432\n吖2\nā ㄚˉ\n叹词,相当于呵”。\n郑码jui,u5416,gbkdfb9\n笔画数6,部首口,笔顺编号251432"
    },

可以看出,汉字的json拥有着非常丰富的信息,但是呢,我们只需要其中的word字段。为了方便,我们可以使用python来提取这个字段,并构成一个新的json文件。

import json
# 读取json文件
f = ope
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值