JSP传参乱码,万恶的全角字符
最近在做一个网站项目需要前台增加一个
remark(备注)字段传递到后台保存。前台的处理是一个输入文本框。
后台接收使用简单的代码:
request.getParameter("remark");
由于页面是异步的请求,有多个request,为了防止remark字段丢失,使用保存到session的方法。
request.getSession().setAttribute("remark", request.getParameter("remark"));
请求结束之后,发现数据库里面除了remark内容为英文的可以保存成功,中文的全部是被URLEncoder编码之后的乱码。
于是在网上查了很多资料,结果都没成功,以为很多都不靠谱,最后发现,中文格式的remark字段被传递到后台之后,都其实是全角字符:
%和%
这俩看上去还是有区别的吧?传参过来使用的是全角字符%,也不知道是哪一步出了错,反正解码不了。
于是使用下面函数实现全角到半角的转换
/**
* 全角对应于ASCII表的可见字符从!开始,偏移值为65281
*/
static final char SBC_CHAR_START = 65281; // 全角!
/**
* 全角对应于ASCII表的可见字符到~结束,偏移值为65374
*/
static final char SBC_CHAR_END = 65374; // 全角~
/**
* ASCII表中除空格外的可见字符与对应的全角字符的相对偏移
*/
static final int CONVERT_STEP = 65248; // 全角半角转换间隔
/**
* 全角空格的值,它没有遵从与ASCII的相对偏移,必须单独处理
*/
static final char SBC_SPACE = 12288; // 全角空格 12288
/**
* 半角空格的值,在ASCII中为32(Decimal)
*/
static final char DBC_SPACE = ' '; // 半角空格
/**
* <PRE>
* 全角字符->半角字符转换
* 只处理全角的空格,全角!到全角~之间的字符,忽略其他
* </PRE>
*/
public static String qj2bj(String src) {
if (src == null) {
return src;
}
StringBuilder buf = new StringBuilder(src.length());
char[] ca = src.toCharArray();
for (int i = 0; i < src.length(); i++) {
if (ca[i] >= SBC_CHAR_START && ca[i] <= SBC_CHAR_END) { // 如果位于全角!到全角~区间内
buf.append((char) (ca[i] - CONVERT_STEP));
} else if (ca[i] == SBC_SPACE) { // 如果是全角空格
buf.append(DBC_SPACE);
} else { // 不处理全角空格,全角!到全角~区间外的字符
buf.append(ca[i]);
}
}
return buf.toString();
}
于是正确的代码如下:
String remarkDecodeTemp = request.getParameter("remark");
//中文保存很奇怪,必须全角字符转半角字符
remarkDecodeTemp = BCConvertUtil.qj2bj(remarkDecodeTemp);
//解码utf-8
String remarkDecode = URLDecoder.decode(remarkDecodeTemp,"utf-8");
request.getSession().setAttribute("remark", remarkDecode);