中文乱码害死人啊。
纠结了一下午的中文乱码,虽没解决,但是基本不影响我使用。但是还有个地方没搞明白,先把测试的情况记录下来,以便日后给自己一个恍然大悟的机会。
我用HttpURLConnection想web服务器发送数据,获取的数据没有乱码。总体分下面几种情况:
1.服务器用serverlet:
a.用get方式请求,HttpURLConnection是在Android上的,所以默认编码格式是utf-8,在doGet里用request.getParameter("name")方法得到的是用iso8859-1字符集编码的,我得到该字符串,对该字符串先用iso8859-1编码,再用utf-8解码,可以得到正确的string。
b.用post方式请求,在发送的时候把查询字符串用utf-8编码,发送byte[]。在服务器里,情况和上面的1.a.情况相同,没乱码。
2.服务器用struts:
a.用get方式请求,客户端同1.a.。在服务器里也区分不出来是get还是post,反正弄个setter和getter就完事了。在服务器里,得到的字符串是用iso8859-1编码的。
b.用post方式请求,客户端同1.b.。在服务器端,得到的字符串是用utf-8编码的。
意思就是说在struts里,相同的数据,提交方式不同,得到的字符串的解码格式是不同的,但是编码的格式是相同的,而且struts里判断不出来时get还是post(至少我不知道怎么判断)。
我也尝试了在html里用表单的形式发送请求,结果和HttpURLConnection完全相同。
解决方法:
tomcat5中,为了保证get数据采用UTF8编码,在server.xml中进行了如下设置:
<Connector port="8080" maxThreads="150" minSpareThreads="25"
maxSpareThreads="75" enableLookups="false" redirectPort="8443"
acceptCount="100" debug="99" connectionTimeout="20000"
disableUploadTimeout="true" URIEncoding="UTF-8"/>
这里指定了get时候的数据编码。但是,当使用IIS作为webserver转发servlet/jsp请求给Tomcat时候,这个设置却失效了。其实原因很简单:IIS是通过AJP协议,把请求转发到Tomcat监听的8009端口上的,所以这里针对8080的设置自然就无效了。正确的方法是进行下面的设置:
<Connector port="8009" enableLookups="false" redirectPort="8443"
debug="0" protocol="AJP/1.3" URIEncoding="UTF-8"/>