最近遇到Httpclient的GetMethod的url参数问题,实验需要用getmethod获取网页内容,但url总是报错,说是url非法,先是中文问题,中文乱码,url里的中文通过urlencode用utf8编码后,可以解决,另外url的一些特殊字符,如&,括号等也是要编码后,再发送请求,遇到一个棘手的问题是,我把所有中文字符,特殊字符都处理后,还是报错,非法。
高了半天,没发现错误在哪,几乎抓狂,后来,把未经过编码的url,也就是带中文或特殊字符的url,输入到火狐的地址框,竟然能正常访问,显而易见,浏览器都是对url进行预处理了的,然后再请求服务器,通过火狐的firebug,查看请求头信息,url是经过编码处理了的,关键就在这里了,通过观察火狐对url的处理,发现的问题,还是自己太粗心了,原来是url里的空格在作怪啊,火狐除了对中文和特殊字符进行了编码,对空格也进行了编码,这个空格就像隐身了似的,自己写程序的时候最容易忽视,空格编码为%20,这样将空格都变成%20后就可以了。