1. 产生原因: 读取时的编码和存储的编码不一致导致
用 utf8 的方式去读以 latin 方式存储的数据 当然会乱码
数据入库的时候存的是latin1编码,你查询时用UTF8编码,而latin1无法转化为utf8故显示乱码。
如下:
2. 解决办法:
(1): 查看数据库编码
show variables like 'character%';
发现数据库存和取编码不一致
名词解释:
character_set_client:客户端请求数据的字符集
character_set_connection:客户机/服务器连接的字符集
character_set_database:默认数据库的字符集,无论默认数据库如何改变,都是这个字符集;
如果没有默认数据库,那就使用 character_set_server指定的字符集,
这个变量建议由系统自己管理,不要人为定义。
character_set_filesystem:把os上文件名转化成此字符集,即把 character_set_client转换character_set_filesystem,
默认binary是不做任何转换的
character_set_results:结果集,返回给客户端的字符集
character_set_server: 数据库服务器的默认字符集
character_set_system: 系统字符集,这个值总是utf8,不需要设置。这个字符集用于数据库对象(如表和列)的名字,也用于存储在目录表中的函数的名字。
(2): 修改编码
set names utf8;
set names utf8等价于:
SET character_set_client = utf8; //表示SQL离开客户端时的编码
SET character_set_results = utf8; //服务器返回的结果集编码
SET character_set_connection = utf8; //服务器接收后转换的字符编码
这样就规定了客户端和服务器之间通信编码的统一。
再次查询:
3. 结论:
你在初始数据入库的时候都是Latin1编码的数据,后面执行set names utf8后,查询的数据从latin1转为utf8就会乱码