这是PHP:两个服务器同步数据开发手记的第二篇,主要解决同步数据过程中的中文编码问题,简单说就是在使用JSON encode和decode时GBK和UTF-8之间的编码转换问题。
由于历史遗留问题,数据库表的编码是gbk_general_ci,原来的程序读写数据库时并没有 set names utf8或 set names gbk,而现在要加入同步代码,原先的想法把同步代码写到一个PHP文件中,定时执行,读写数据库时先query一句set names utf8, 但后来发现这个方法弊端太多,实时同步这点无论如何做不到,只好把同步代码嵌入到原有的程序中。但这样一来原来的程序使用的gbk字符集和同步代码使用的utf8字符串相冲突,本地数据和远程数据时常出现乱码。最终的解决方案:原来程序保持不变,同步代码中的中文经过两层转码,一是从数据库中读出的gbk字符集先转成utf8后再encode,远程服务器对utf8编码decode后再转成gbk编码。
用到的函数:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
|
function
cn_json_encode(
$value
,
$options
= 0)
{
return
json_encode(cn_json_convert_encoding(
$value
,
"GBK"
,
"UTF-8"
));
}
function
cn_json_decode(
$str
,
$assoc
= false,
$depth
= 512)
{
return
cn_json_convert_encoding(json_decode(
$str
,
$assoc
),
"UTF-8"
,
"GBK"
);
}
function
cn_json_convert_encoding(
$m
,
$from
,
$to
)
{
switch
(
gettype
(
$m
)) {
case
'integer'
:
case
'boolean'
:
case
'float'
:
case
'double'
:
case
'NULL'
:
return
$m
;
case
'string'
:
return
mb_convert_encoding(
$m
,
$to
,
$from
);
case
'object'
:
$vars
=
array_keys
(get_object_vars(
$m
));
foreach
(
$vars
as
$key
) {
$m
->
$key
= cn_json_convert_encoding(
$m
->
$key
,
$from
,
$to
);
}
return
$m
;
case
'array'
:
foreach
(
$m
as
$k
=>
$v
) {
$m
[cn_json_convert_encoding(
$k
,
$from
,
$to
)] = cn_json_convert_encoding(
$v
,
$from
,
$to
);
}
return
$m
;
default
:
}
return
$m
;
}
|
有了这几个函数,以后就不用为JSON中的中文编码发愁了。