GBK字符集碰到的问题

问题:

出问题的系统是j2ee架构,JSP页面采用的字符集是GBK,

在录入一个生僻字"㛃"字后,查询显示在页面时出现问题。



分析:

首先,这个生僻字不在GBK字符集,因为eclipse编辑器无法save为GBK格式。所以,在HTML里面出现了Http Entity Code,㛃 (即生僻字"㛃"),浏览器自动通过unicode来解决。碰巧我们使用了c:out标签,如果escapseXml=true,则会把&转义为&,所以html显示㛃(实际代码:㛃),所以加上escapseXml=false,则html显示正常。
最好的办法还是建议在JSP页面使用UTF-8字符来解决,将来也能更好的处理国际化的其他字符。


小插曲:
在Tomcat测试时没有设置charset filter,tomcat会使用确认iso-8859-1来解析,老是乱码。
 web.xml中字符集的filter如下,顺序需要放在最前面
 
<filter>
        <filter-name>Set Character Encoding</filter-name>
        <filter-class>org.apache.catalina.filters.SetCharacterEncodingFilter</filter-class>
        <init-param>
            <param-name>encoding</param-name>
            <param-value>UTF-8</param-value>
        </init-param>
        <init-param>
            <param-name>ignore</param-name>
            <param-value>false</param-value>
        </init-param>
    </filter>
    
    <filter-mapping>
        <filter-name>Set Character Encoding</filter-name>
        <url-pattern>/*</url-pattern>
    </filter-mapping>

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 在 MySQL 中,您可以使用下面的 SQL 语句来将数据库的字符集设置为 utf8: ``` ALTER DATABASE database_name CHARACTER SET utf8 COLLATE utf8_unicode_ci; ``` 如果您想将数据库中的某个表的字符集设置为 gbk,可以使用下面的 SQL 语句: ``` ALTER TABLE table_name CHARACTER SET gbk COLLATE gbk_chinese_ci; ``` 当您将数据库的字符集设置为 utf8,而表的字符集设置为 gbk 时,会发生什么呢?这样做会导致 MySQL 在查询表时出现乱码,因为数据库和表的字符集不匹配。因此,建议您将数据库和表的字符集都设置为 utf8,这样就可以避免乱码问题。 另外,在 MySQL 中,您还可以使用下面的 SQL 语句来查看当前数据库的字符集和排序规则: ``` SHOW VARIABLES LIKE 'character_set_database'; SHOW VARIABLES LIKE 'collation_database'; ``` 您也可以使用下面的 SQL 语句来查看某个表的字符集和排序规则: ``` SHOW TABLE STATUS LIKE 'table_name'; ``` 希望这些信息能帮助您。 ### 回答2: 在MySQL中,可以通过设置数据库的字符集为utf8来将数据库的字符集设置成utf8。这可以通过在创建数据库时使用"CREATE DATABASE database_name CHARACTER SET utf8"语句来实现,或通过在已经存在的数据库上执行"ALTER DATABASE database_name CHARACTER SET utf8"语句来修改字符集。 当数据库的字符集设置为utf8时,但其中的表的字符集设置为gbk时,会导致一些影响。首先,数据库对象(如表名、列名等)在不同的字符集下可能会以不同的方式存储。例如,一个以utf8字符集创建的表,在gbk字符集下表名可能会对应不上,导致在使用表时出现问题。 其次,对于存储在表中的数据,如果表的字符集和数据库的字符集不一致,可能会导致数据无法正确存储或读取。例如,当将一个存储了gbk字符的数据插入到一个utf8字符集的列中时,可能会导致数据无法正确存储或者存储后以乱码的形式读取。 另外,当数据库的字符集和表的字符集不一致时,在进行比较或排序等操作时可能会出现问题。因为不同的字符集具有不同的排序规则,可能会导致数据在排序时出现错误的结果。 为避免以上问题,一般建议数据库的字符集和表的字符集保持一致。如果需要将整个数据库的字符集gbk改为utf8,需要将数据库中的表的字符集也一起修改,可以通过ALTER TABLE语句来实现。但在修改字符集时,需要注意备份数据,并对数据库和表进行合适的测试,以确保数据的完整性和一致性。 ### 回答3: 在MySQL中,可以通过以下步骤将数据库字符集设置为utf8: 1. 登录MySQL数据库,输入命令"show variables like 'character%';",查看当前的字符集配置。 2. 如果当前字符集配置中,variables表中character_set_database的值不是utf8,则需要进行修改。 3. 输入命令"SET character_set_database = utf8;",将数据库的字符集设置为utf8。 4. 使用命令"ALTER DATABASE 数据库名 DEFAULT CHARACTER SET utf8;"将数据库的默认字符集设置为utf8。 5. 修改配置文件(my.cnf或my.ini),找到[mysqld]段后添加或修改以下配置: [mysqld] character-set-server=utf8 collation-server=utf8_general_ci 6. 重启MySQL服务,使配置修改生效。 当将数据库字符集设置为utf8而表字符集设置为gbk时,会导致以下影响: 1. 支持字符集不一致:数据库字符集为utf8,而表中的字符集gbk,可能会遇到字符集不兼容的问题。例如,当在utf8字符集下插入包含gbk字符集中特殊字符的数据时,可能会出现乱码或无法插入的情况。 2. 查询结果不一致:由于字符集不一致,当进行查询时,可能会导致数据无法正常匹配。例如,使用utf8字符集进行查询时,可能无法正确匹配包含gbk字符集中特殊字符的数据。 3. 数据存储空间增大:utf8字符集相对于gbk字符集,存储同样内容的数据所需的存储空间会更大一些。因此,将数据库字符集设置为utf8可能会导致存储空间的增加。 综上所述,将数据库字符集设置为utf8而表字符集设置为gbk的影响主要包括字符集不兼容、查询结果不一致以及存储空间增大。为了避免这些问题,建议将数据库和表的字符集保持一致,以便数据的插入、查询和存储能够正常进行。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值