首先,android端从windows端下载一段中文文字,
public String downLoad(String urlStr){
InputStream is = null;
try{
URL url = new URL(urlStr);
HttpURLConnection urlCon = (HttpURLConnection)url.openConnection();
is = urlCon.getInputStream();
byte[] buffer = new byte[is.available()];
is.read(buffer);
String gbk = new String(buffer,"GBK");
buffer = gbk.getBytes("UTF-8");
return new String(buffer ,"UTF-8");
}catch(IOException e){
e.printStackTrace();
}finally{
try{
if(is!=null)is.close();
}catch(IOException e){
e.printStackTrace();
}
}
return null;
需要注意的问题:
1. 获取数据不能用Reader 要用字节流 如果用BufferReader的readLine()方法来读取字符流
后果是部分编码信息丢失,因为readLine()默认调用了本地UTF-8 编码格式对字符流的中文部分进行编码, 而对于UTF-8和GBK兼容的字母符号则保留了原来的GBK编码形式
实质上是出现了混合编码的情况,结果就无法转换了。
2. windows的中文编码是GBK格式的,而android是UTF-8, 所以在buffer得到字节数组里面 是有保留GBK编码信息的 因此不能直接将buffer转换成UTF-8
如果直接转换 new String (buffer,"UTF-8") 则中文乱码,
要先将buffer转换成完整GBK格式String 再转换成保留UTF-8信息的字节数组 buffer = gbk.getBytes("UTF-8")
最后转换成UTF-8 new String (buffer,"UTF-8");
再有的问题就是从windows上下载文件是的中文url 和带空格url的问题
mp3URL = ("http://192.168.42.1:8090/mp3/"+URLEncoder.encode("给未来的自己.mp3","UTF-8")).replaceAll("\\+", "%20");
首先需要给中文名编码 因为编码结束的时候 空格被编码成了 "+" , 所以需要用 URL 的编码格式里面代表 空格的符号取代 "+" , \\+ 是正则表达式
%20是 URL编码格式 的空格