mysql 拼音搜汉字_mysql实现用拼音搜索中文的数据库实现

这篇博客介绍了如何在MySQL中创建表和插入拼音数据,以及使用自定义函数`to_pinyin`将汉字转换为拼音,实现拼音搜索中文的功能。通过创建`t_base_pinyin`表存储拼音和对应的Unicode码,然后利用函数将汉字转为拼音,为拼音搜索提供支持。
摘要由CSDN通过智能技术生成

标签:

1、创建表:

CREATE TABLE

IF NOT EXISTS `t_base_pinyin` (

`pin_yin_` VARCHAR (255) CHARACTER

SET gbk NOT NULL,

`code_` INT (11) NOT NULL,

PRIMARY KEY (`code_`)

) ENGINE = INNODB DEFAULT CHARSET = latin1;

2、插入数据:

INSERT INTO t_base_pinyin (pin_yin_, code_)

VALUES

("a", 20319),

("ai", 20317),

("an", 20304),

("ang", 20295),

("ao", 20292),

("ba", 20283),

("bai", 20265),

("ban", 20257),

("bang", 20242),

("bao", 20230),

("bei", 20051),

("ben", 20036),

("beng", 20032),

("bi", 20026),

("bian", 20002),

("biao", 19990),

("bie", 19986),

("bin", 19982),

("bing", 19976),

("bo", 19805),

("bu", 19784),

("ca", 19775),

("cai", 19774),

("can", 19763),

("cang", 19756),

("cao", 19751),

("ce", 19746),

("ceng", 19741),

("cha", 19739),

("chai", 19728),

("chan", 19725),

("chang", 19715),

("chao", 19540),

("che", 19531),

("chen", 19525),

("cheng", 19515),

("chi", 19500),

("chong", 19484),

("chou", 19479),

("chu", 19467),

("chuai", 19289),

("chuan", 19288),

("chuang", 19281),

("chui", 19275),

("chun", 19270),

("chuo", 19263),

("ci", 19261),

("cong", 19249),

("cou", 19243),

("cu", 19242),

("cuan", 19238),

("cui", 19235),

("cun", 19227),

("cuo", 19224),

("da", 19218),

("dai", 19212),

("dan", 19038),

("dang", 19023),

("dao", 19018),

("de", 19006),

("deng", 19003),

("di", 18996),

("dian", 18977),

("diao", 18961),

("die", 18952),

("ding", 18783),

("diu", 18774),

("dong", 18773),

("dou", 18763),

("du", 18756),

("duan", 18741),

("dui", 18735),

("dun", 18731),

("duo", 18722),

("e", 18710),

("en", 18697),

("er", 18696),

("fa", 18526),

("fan", 18518),

("fang", 18501),

("fei", 18490),

("fen", 18478),

("feng", 18463),

("fo", 18448),

("fou", 18447),

("fu", 18446),

("ga", 18239),

("gai", 18237),

("gan", 18231),

("gang", 18220),

("gao", 18211),

("ge", 18201),

("gei", 18184),

("gen", 18183),

("geng", 18181),

("gong", 18012),

("gou", 17997),

("gu", 17988),

("gua", 17970),

("guai", 17964),

("guan", 17961),

("guang", 17950),

("gui", 17947),

("gun", 17931),

("guo", 17928),

("ha", 17922),

("hai", 17759),

("han", 17752),

("hang", 17733),

("hao", 17730),

("he", 17721),

("hei", 17703),

("hen", 17701),

("heng", 17697),

("hong", 17692),

("hou", 17683),

("hu", 17676),

("hua", 17496),

("huai", 17487),

("huan", 17482),

("huang", 17468),

("hui", 17454),

("hun", 17433),

("huo", 17427),

("ji", 17417),

("jia", 17202),

("jian", 17185),

("jiang", 16983),

("jiao", 16970),

("jie", 16942),

("jin", 16915),

("jing", 16733),

("jiong", 16708),

("jiu", 16706),

("ju", 16689),

("juan", 16664),

("jue", 16657),

("jun", 16647),

("ka", 16474),

("kai", 16470),

("kan", 16465),

("kang", 16459),

("kao", 16452),

("ke", 16448),

("ken", 16433),

("keng", 16429),

("kong", 16427),

("kou", 16423),

("ku", 16419),

("kua", 16412),

("kuai", 16407),

("kuan", 16403),

("kuang", 16401),

("kui", 16393),

("kun", 16220),

("kuo", 16216),

("la", 16212),

("lai", 16205),

("lan", 16202),

("lang", 16187),

("lao", 16180),

("le", 16171),

("lei", 16169),

("leng", 16158),

("li", 16155),

("lia", 15959),

("lian", 15958),

("liang", 15944),

("liao", 15933),

("lie", 15920),

("lin", 15915),

("ling", 15903),

("liu", 15889),

("long", 15878),

("lou", 15707),

("lu", 15701),

("lv", 15681),

("luan", 15667),

("lue", 15661),

("lun", 15659),

("luo", 15652),

("ma", 15640),

("mai", 15631),

("man", 15625),

("mang", 15454),

("mao", 15448),

("me", 15436),

("mei", 15435),

("men", 15419),

("meng", 15416),

("mi", 15408),

("mian", 15394),

("miao", 15385),

("mie", 15377),

("min", 15375),

("ming", 15369),

("miu", 15363),

("mo", 15362),

("mou", 15183),

("mu", 15180),

("na", 15165),

("nai", 15158),

("nan", 15153),

("nang", 15150),

("nao", 15149),

("ne", 15144),

("nei", 15143),

("nen", 15141),

("neng", 15140),

("ni", 15139),

("nian", 15128),

("niang", 15121),

("niao", 15119),

("nie", 15117),

("nin", 15110),

("ning", 15109),

("niu", 14941),

("nong", 14937),

("nu", 14933),

("nv", 14930),

("nuan", 14929),

("nue", 14928),

("nuo", 14926),

("o", 14922),

("ou", 14921),

("pa", 14914),

("pai", 14908),

("pan", 14902),

("pang", 14894),

("pao", 14889),

("pei", 14882),

("pen", 14873),

("peng", 14871),

("pi", 14857),

("pian", 14678),

("piao", 14674),

("pie", 14670),

("pin", 14668),

("ping", 14663),

("po", 14654),

("pu", 14645),

("qi", 14630),

("qia", 14594),

("qian", 14429),

("qiang", 14407),

("qiao", 14399),

("qie", 14384),

("qin", 14379),

("qing", 14368),

("qiong", 14355),

("qiu", 14353),

("qu", 14345),

("quan", 14170),

("que", 14159),

("qun", 14151),

("ran", 14149),

("rang", 14145),

("rao", 14140),

("re", 14137),

("ren", 14135),

("reng", 14125),

("ri", 14123),

("rong", 14122),

("rou", 14112),

("ru", 14109),

("ruan", 14099),

("rui", 14097),

("run", 14094),

("ruo", 14092),

("sa", 14090),

("sai", 14087),

("san", 14083),

("sang", 13917),

("sao", 13914),

("se", 13910),

("sen", 13907),

("seng", 13906),

("sha", 13905),

("shai", 13896),

("shan", 13894),

("shang", 13878),

("shao", 13870),

("she", 13859),

("shen", 13847),

("sheng", 13831),

("shi", 13658),

("shou", 13611),

("shu", 13601),

("shua", 13406),

("shuai", 13404),

("shuan", 13400),

("shuang", 13398),

("shui", 13395),

("shun", 13391),

("shuo", 13387),

("si", 13383),

("song", 13367),

("sou", 13359),

("su", 13356),

("suan", 13343),

("sui", 13340),

("sun", 13329),

("suo", 13326),

("ta", 13318),

("tai", 13147),

("tan", 13138),

("tang", 13120),

("tao", 13107),

("te", 13096),

("teng", 13095),

("ti", 13091),

("tian", 13076),

("tiao", 13068),

("tie", 13063),

("ting", 13060),

("tong", 12888),

("tou", 12875),

("tu", 12871),

("tuan", 12860),

("tui", 12858),

("tun", 12852),

("tuo", 12849),

("wa", 12838),

("wai", 12831),

("wan", 12829),

("wang", 12812),

("wei", 12802),

("wen", 12607),

("weng", 12597),

("wo", 12594),

("wu", 12585),

("xi", 12556),

("xia", 12359),

("xian", 12346),

("xiang", 12320),

("xiao", 12300),

("xie", 12120),

("xin", 12099),

("xing", 12089),

("xiong", 12074),

("xiu", 12067),

("xu", 12058),

("xuan", 12039),

("xue", 11867),

("xun", 11861),

("ya", 11847),

("yan", 11831),

("yang", 11798),

("yao", 11781),

("ye", 11604),

("yi", 11589),

("yin", 11536),

("ying", 11358),

("yo", 11340),

("yong", 11339),

("you", 11324),

("yu", 11303),

("yuan", 11097),

("yue", 11077),

("yun", 11067),

("za", 11055),

("zai", 11052),

("zan", 11045),

("zang", 11041),

("zao", 11038),

("ze", 11024),

("zei", 11020),

("zen", 11019),

("zeng", 11018),

("zha", 11014),

("zhai", 10838),

("zhan", 10832),

("zhang", 10815),

("zhao", 10800),

("zhe", 10790),

("zhen", 10780),

("zheng", 10764),

("zhi", 10587),

("zhong", 10544),

("zhou", 10533),

("zhu", 10519),

("zhua", 10331),

("zhuai", 10329),

("zhuan", 10328),

("zhuang", 10322),

("zhui", 10315),

("zhun", 10309),

("zhuo", 10307),

("zi", 10296),

("zong", 10281),

("zou", 10274),

("zu", 10270),

("zuan", 10262),

("zui", 10260),

("zun", 10256),

("zuo", 10254);

3、创建函数:

DROP FUNCTION IF EXISTS to_pinyin;

DELIMITER $

CREATE FUNCTION to_pinyin(NAME VARCHAR(255) CHARSET gbk)

RETURNS VARCHAR(255) CHARSET gbk

BEGIN

DECLARE mycode INT;

DECLARE tmp_lcode VARCHAR(2) CHARSET gbk;

DECLARE lcode INT;

DECLARE tmp_rcode VARCHAR(2) CHARSET gbk;

DECLARE rcode INT;

DECLARE mypy VARCHAR(255) CHARSET gbk DEFAULT ‘‘;

DECLARE lp INT;

SET mycode = 0;

SET lp = 1;

SET NAME = HEX(NAME);

WHILE lp 

SET tmp_lcode = SUBSTRING(NAME, lp, 2);

SET lcode = CAST(ASCII(UNHEX(tmp_lcode)) AS UNSIGNED);

SET tmp_rcode = SUBSTRING(NAME, lp + 2, 2);

SET rcode = CAST(ASCII(UNHEX(tmp_rcode)) AS UNSIGNED);

IF lcode > 128 THEN

SET mycode =65536 - lcode * 256 - rcode ;

SELECT CONCAT(mypy,pin_yin_) INTO mypy FROM t_base_pinyin WHERE CODE_ >= ABS(mycode) ORDER BY CODE_ ASC LIMIT 1;

SET lp = lp + 4;

ELSE

SET mypy = CONCAT(mypy,CHAR(CAST(ASCII(UNHEX(SUBSTRING(NAME, lp, 2))) AS UNSIGNED)));

SET lp = lp + 2;

END IF;

END WHILE;

RETURN LOWER(mypy);

END;

$

DELIMITER ;

4、创建视图:

CREATE VIEW v_pinyin AS SELECT

u.id,

to_pinyin (u.displayname) AS pinyin,

u.displayName

FROM

wsm_userinfo u

标签:

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
实现拼音搜索功能的方法主要有两种: 1. 基于全文检索引擎,如 Elasticsearch、Solr 等,利用其支持中文分词和拼音转换的功能,将数据存储到搜索引擎,然后通过搜索引擎提供的 API 进行搜索操作。 2. 自建拼音检索表,将需要被检索的字段的拼音转换后存储到一个大表,然后通过 SQL 语句进行搜索操作。 下面以第二种方法为例,介绍一下如何实现拼音搜索功能: 1. 创建拼音检索表 拼音检索表可以使用 MySQL 或其他关系型数据库创建。表结构如下: ``` CREATE TABLE pinyin_index ( id int(11) NOT NULL AUTO_INCREMENT, text varchar(255) NOT NULL COMMENT '原始文本', pinyin varchar(255) NOT NULL COMMENT '拼音', PRIMARY KEY (id), KEY pinyin (pinyin) ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='拼音检索表'; ``` 2. 插入数据 将需要被检索的字段转换成拼音后插入到拼音检索表。这里以一个简单的例子来说明: 假设要检索的字段为 `name`,原始值为 `张三`,则可以使用 Python 的 pypinyin 将其转换成拼音: ```python from pypinyin import lazy_pinyin name = '张三' pinyin = ''.join(lazy_pinyin(name)) ``` 将 `name` 和 `pinyin` 插入到拼音检索表: ``` INSERT INTO pinyin_index (text, pinyin) VALUES ('张三', 'zhangsan'); ``` 3. 搜索操作 使用 SQL 语句进行搜索操作,如下所示: ```sql SELECT text FROM pinyin_index WHERE pinyin LIKE '%zhang%' AND pinyin LIKE '%san%'; ``` 这条 SQL 语句会搜索出所有拼音包含 `zhang` 和 `san` 的记录,即 `张三`。 需要注意的是,由于拼音可能会有多音字的情况,所以需要对数据进行去重操作,以避免搜索结果出现重复。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值