要跟上节奏,html编辑器把功能都屏蔽了,换markdown 。
接上文‘参数解析实现’,对于%开头的byte处理,如下:
case '%':
int dh = in.read();// 高位
int dl = in.read();// 地位
if(dh >= 0 && dl >= 0) {
buffer.append((byte)((TypeUtil.convertHexDigit((byte)dh) << 4) + TypeUtil.convertHexDigit((byte)dl)));
}
break;
然后,根据当前Request characterEncoding,决定如何转化为String,其中涉及到中文乱码的问题也是此处toString发生的。
上述的处理,类似new String(bytes, charset),编解码由StringCoding来提供,真正的实现肯定是委托给Charset.Decoder 完成。
public String(byte bytes[], Charset charset) {
this.value = StringCoding.decode(charset, bytes, offset, length);
}
常用的编解码实现可以参考:UTF-8,GBK,ISO-8859-1
附:bytes 转换为hex实现 - encode
http://www.cnblogs.com/cb168/p/5196807.html
/**
* bytes 转换为hex
* eg: "中文123".getBytes("GBK") -> D6 D0 CE C4 31 32 33
**/
public static String bytes2HexString(byte[] array) {
int length = array.length;
// 每个byte用两个字符才能表示,所以字符串的长度是数组长度的两倍
StringBuilder sb = new StringBuilder(length * 2);
for (int i = 0; i < length; i++) {
int intTmp = array[i];
// 把负数转换为正数
while (intTmp < 0) {
intTmp = intTmp + 256;
}
// 小于0F的数需要在前面补0
if (intTmp < 16) {
sb.append("0");
}
sb.append(Integer.toString(intTmp, 16)).append(" ");
}
return sb.toString().toUpperCase();
}
附:中文乱码
中文乱码,初学者一定会遇到的问题。对于前后端的数据交互,另外一种角度解释: 浏览器根据charset编码提交,server根据server配置的charset解码处理,如果charset不一致,中文肯定乱码。如果声明设置charset,没有乱码问题,那只能是运气好,默认charset是统一的。
中文乱码解决很简单:html <meta charset="UTF-8">
, servlet request.setCharacterEncoding("UTF-8");
统一即可。
附:表单编码的典型范例,springframework 的ServletServerHttpRequest
private static InputStream getBodyFromServletRequestParameters(HttpServletRequest request) throws IOException {
ByteArrayOutputStream bos = new ByteArrayOutputStream(1024);
Writer writer = new OutputStreamWriter(bos, FORM_CHARSET);
Map<String, String[]> form = request.getParameterMap();
for (Iterator<String> nameIterator = form.keySet().iterator(); nameIterator.hasNext();) {
String name = nameIterator.next();
List<String> values = Arrays.asList(form.get(name));
for (Iterator<String> valueIterator = values.iterator(); valueIterator.hasNext();) {
String value = valueIterator.next();
writer.write(URLEncoder.encode(name, FORM_CHARSET));
if (value != null) {
writer.write('=');
writer.write(URLEncoder.encode(value, FORM_CHARSET));
if (valueIterator.hasNext()) {
writer.write('&');
}
}
}
if (nameIterator.hasNext()) {
writer.append('&');
}
}
writer.flush();
return new ByteArrayInputStream(bos.toByteArray());
}