今天在做mysql的一个搜索的时候发现我用 select name from contact where name like
'%a%'的时候出来的结果除了包含a的名字外连包含中文“新”的名字也出现在搜索结果里面,这令我想弄清楚mysql的匹配模式和规则到底是怎么样的,
所以决定查查资料了解了解,另外在匹配的时候正则表达式也很常用!所以准备在这里记录我学习这两个玩意的收获!
出现这个问题的原因是:MySQL在查询字符串时是大小写不敏感的,在编绎MySQL时一般以ISO-8859字符集作为默认的字符集,因此在比较过程中
中文编码字符大小写转换造成了这种现象。
解决办法
1.在建表的时候对于包含中文的字段加上“BINARY”属性,使之进行二进制比
较,例如讲"name char(10)"改成"name char(10) BINARY"。但是这样你对该表的该字段进行匹配的时候是区分大小写的。
2.
如果使用源码编译MySQL,可以在编译的时候使用--with--charset=gbk参数,这样mysql就直接支持中文查找和排序。
3.
使用mysql的locate函数来判断。如:
SELECT * from table WHERE
locate(substr,str)>0 ;
locate()有两个形式:
LOCATE(substr
,str
)
,
LOCATE(substr
,str
,pos
)。返回substr在str中的位置,如果str不包含substr返回0。这个函数也是不
区分大小写的。
4.这样使用sql语句:SELECT * from TABLE WHERE FIELDS LIKE BINARY
'%FIND%',但是这和1一样是区分大小写的如果你想进行不区分大小写的查询的时候就要使用upper或者lower进行转换。
5.使用
binary和ucase函数及concat函数。ucase是讲英文全部转换大写,concat对字符串进行连接。新的sql语句如下:
select id,title,name from achech_com.news where binary ucase(title)
like concat('%',ucase('a'),'%')
也可以写为select
id,title,name from achech_com.news where binary ucase(title) like
ucase('%a%')
检索的结果还算满意吧,不过速度可能会因此而慢N毫秒喔。 因为使用like和%进行匹配的话对效率会有一定的影响。
正则表达式:
正
则表达式是为复杂搜索指定模式的强大方式。
^
所
匹配的字符串以后面的字符串开头
mysql> select "fonfo" REGEXP "^fo$"; ->
0(表示不匹配)
mysql> select "fofo" REGEXP &