⼀、采⽤正则表达式⽅法
主要基于数据库采⽤UTF-8和客户端也是⽤UTF-8的字符集⽅式⽣成的数据,这样可以结合中⽂字体库设定起⽌来筛选。
select id,name from ma_net where name ~ '[吖-座]';
说明:
~ 匹配,区分⼤⼩写 'jimi' ~ '.*jimi.*'
~* 匹配,不区分⼤⼩写 'jimi' ~* '.*JIMI.*'
结果如下:
⼆、采⽤编码范围搜索
u2e80-ua4cf
包含了中⽇朝部⾸补充、康熙部⾸、表意⽂字描述符、中⽇朝符号和标点、⽇⽂平假名、⽇⽂⽚假名、注⾳字母、谚⽂兼容字母、象形字注释标志、注⾳字母扩展、中⽇朝笔画、⽇⽂⽚假名语⾳扩展、带圈中⽇朝字母和⽉份、中⽇朝兼容、中⽇朝统⼀表意⽂字扩展A、易经六⼗四卦符号、中⽇韩统⼀表意⽂字、彝⽂⾳节、彝⽂字根
uf900-ufaff
中⽇朝兼容表意⽂字
ufe30-ufe4f
中⽇朝兼容形式
基于上述学习及分析,那么找字符串带中⽂的数据则可以⽤:
select id,name from ma_net_190723_2 where name ~ '[\u2e80-\ua4cf]|[\uf900-\ufaff]|[\ufe30-\ufe4f]';
上述两种⽅法是可以找到字符串含中⽂的字符,但如果在遇到只需要判断⾸字符是否是中⽂,则可以利⽤ascii码特点,将其转换成ascii码⼤于127的是⾮中⽂字符。
⽤SQL语句表⽰:select id,name from ma_net_190723_2 where ascii(name)>127;上述些⽅法,仅抛砖引⽟。