为了防止无良网站的爬虫抓取文章,特此标识,转载请注明文章出处。LaplaceDemon/SJQ。
http://www.cnblogs.com/shijiaqi1066/p/3753224.html
1. URLConnection概述
URLConnection是一个抽象类,表示指向URL指定资源的活动连接。
URLConnection类本身依赖于Socket类实现网络连接。一般认为,URLConnection类提供了比Socket类更易于使用、更高级的网络连接抽象。但实际上,大多数程序员都会忽略它。因为URLConnection太贴近HTTP协议。它假定传输的内容前面都有MIME首部或类似的东西。但大多数协议(如FTP和SMTP)并不使用MIME首部。
URLConnection继承树查看如下:
URLConnection类声明为抽象类,除了connect()方法,其他方法都已经实现。URLConnection的三个实现子类都位于sun.net.www包下。
URLConnection类的保护类型的构造方法:
protected URLConnection(URL url)
构造一个到指定 URL 的 URL 连接。
connect()方法由子类实现本地与服务器的连接方式。一般使用TCP socket,但也可以使用其他其他机制来建立。
abstract void connect()
打开到此 URL 引用的资源的通信链接(如果尚未建立这样的连接)。
当派生URLConnection子类时,通常会覆盖URLConnection的其他方法,使其返回有意义的值。
1.1 读取首部
String getContentType()
返回 Content-type 头字段的值。即数据的MIME内容类型。若类型不可用,则返回null。
除了HTTP协议,极少协议会使用MIME首部。若内容类型是文本。则Content-type首部可能会包含一个标识内容编码方式的字符集。
例:Content-type:text/html; charset=UTF-8
int getContentLength()
返回 Content-length 头字段的值。该方法获取内容的字节数。许多服务器只有在传输二进制文件才发送Content-length首部,在传输文本文件时并不发送。若没有该首部,则返回-1。
若需要知道读取的具体字节数,或需要预先知道创建足够大的缓冲区来保存数据时,可以使用该方法。
String getContentEncoding()
返回 Content-encoding 头字段的值。获取内容的编码方式。若内容无编码,则该方法返回null。
注意:Content-encoding(内容编码)与字符编码不同。字符编码方式由Content-type首部或稳定内容的信息确定,它指出如何使用字节指定字符。内容编码方式则指出字节如何编码其他字节。
例:若编码格式为x-gzip,则可以使用java.util.zip.GZipInputStream来解码。
long getDate()
返回 date 头字段的值。获取请求的发送时间。即自1900年1月1日子夜后过去的毫秒数。
注意:这是从服务器的角度看到的发送时间。可能与本地时间不一致。若首部不包括Date字段,则返回0。
long getExpiration()
返回 expires 头字段的值。获取Expires的值。若无该字段,则返回0。0即表示不过期,永远缓存。
注意:该值是自1970年1月1日上午12:00后的毫秒数。
long getLastModified()
返回 last-modified 头字段的值。该值是自1900年1月1日子夜后过去的毫秒数。若无该字段,则返回0。
1.2 获取任意首部字段
String getHeaderField(String name)
返回指定的头字段的值。
Map<String,List<String>> getHeaderFields()
返回头字段的不可修改的 Map。