MySql jdbc URL 参数及编码说明

最新推荐文章于 2024-07-06 19:54:08 发布

dns007

最新推荐文章于 2024-07-06 19:54:08 发布

阅读量6.1k

点赞数

分类专栏： sql java

本文链接：https://blog.csdn.net/lipei1220/article/details/50969315

版权

java 同时被 2 个专栏收录

70 篇文章 1 订阅

订阅专栏

sql

9 篇文章 0 订阅

订阅专栏

mysql JDBC URL格式如下：
jdbc:mysql://[host:port]/[database][?参数名1][=参数值1][&参数名2][=参数值2]...

现只列举几个重要的参数，如下表所示：

参数名称	参数说明	缺省值	最低版本要求
user	数据库用户名（用于连接数据库）		所有版本
password	用户密码（用于连接数据库）		所有版本
useUnicode	是否使用Unicode字符集，如果参数characterEncoding设置为gb2312或gbk，本参数值必须设置为true	false	1.1g
characterEncoding	当useUnicode设置为true时，指定字符编码。比如可设置为gb2312或gbk	false	1.1g
autoReconnect	当数据库连接异常中断时，是否自动重新连接？	false	1.1
autoReconnectForPools	是否使用针对数据库连接池的重连策略	false	3.1.3
failOverReadOnly	自动重连成功后，连接是否设置为只读？	true	3.0.12
maxReconnects	autoReconnect设置为true时，重试连接的次数	3	1.1
initialTimeout	autoReconnect设置为true时，两次重连之间的时间间隔，单位：秒	2	1.1
connectTimeout	和数据库服务器建立socket连接时的超时，单位：毫秒。 0表示永不超时，适用于JDK 1.4及更高版本	0	3.0.1
socketTimeout	socket操作（读写）超时，单位：毫秒。 0表示永不超时	0	3.0.1

通常mysql连接URL可以设置为：
jdbc:mysql://localhost:3306/test?user=root&password=&useUnicode=true&characterEncoding=gbk&autoReconnect=true&failOverReadOnly=false

在使用数据库连接池的情况下，最好设置如下两个参数：
autoReconnect=true&failOverReadOnly=false

指定字符的编码、解码格式的作用。

例如：mysql数据库用的是gbk编码，而项目数据库用的是utf-8编码。这时候如果添加了useUnicode=true&characterEncoding=UTF-8 ，那么作用有如下两个方面：

1. 存数据时：

数据库在存放项目数据的时候会先用UTF-8格式将数据解码成字节码，然后再将解码后的字节码重新使用GBK编码存放到数据库中。

2.取数据时：

在从数据库中取数据的时候，数据库会先将数据库中的数据按GBK格式解码成字节码，然后再将解码后的字节码重新按UTF-8格式编码数据，最后再将数据返回给客户端。

注意：在xml配置文件中配置数据库utl时，要使用&的转义字符也就是&

例如：<property name="url" value="jdbc:mysql://localhost:3306/email?useUnicode=true&characterEncoding=UTF-8" />

编码知识：

ASCII码：一共规定了128个字符的编码，英语用128个符号编码就够了，只占用了一个字节的后面7位，最前面的1位统一规定为0。
Unicode：针对各国文字、符号进行统一性编码。规定了符号的二进制代码，却没有规定这个二进制代码应该如何存储，定长编码对于存储来说是极大的浪费。

GBK编码：能够用来同时表示繁体字和简体字，而gb2312只能表示简体字，gbk是兼容gb2312编码的。

UTF-8：是Unicode的实现方式之一，它是一种变长的编码方式。它可以使用1~4个字节表示一个符号，根据不同的符号而变化字节长度。UTF-8的编码规则很简单，只有二条：

1）对于单字节的符号，字节的第一位设为0，后面7位为这个符号的unicode码。因此对于英语字母，UTF-8编码和ASCII码是相同的。

2）对于n字节的符号（n>1），第一个字节的前n位都设为1，第n+1位设为0，后面字节的前两位一律设为10。剩下的没有提及的二进制位，全部为这个符号的unicode码。

下表总结了编码规则，字母x表示可用编码的位。

下面，还是以汉字“严”为例，演示如何实现UTF-8编码。

已知“严”的unicode是4E25（100111000100101），根据上表，可以发现4E25处在第三行的范围内（0000 0800-0000 FFFF），因此“严”的UTF-8编码需要三个字节，即格式是“1110xxxx 10xxxxxx 10xxxxxx”。然后，从“严”的最后一个二进制位开始，依次从后向前填入格式中的x，多出的位补0。这样就得到了，“严”的UTF-8编码是“11100100 10111000 10100101”，转换成十六进制就是E4B8A5。

参考