URL和URLConnection类
URL是Uniform Resource Locator(统一资源定位器)的缩写。在WWW风行后,以URL表示Internet上各种数据资源的位置,已经成为一种标准的方式。为了处理方便,Java将URL封装成URL类, 我们可以用一个URL对象记录下完整的URL信息。
URL类为我们提供了不同的构造方法:
public URL(String spec)
这个构造方法用指定的URL来创建一个URL对象,比如:
try { URL rul=new URL("http://www.sina.com.cn/***/***.html"); catch(MalformedURLException e){ …… } |
public URL(String protocol,String host,int port,String file) 该构造方法用指定的协议、主机名、端口号、文件路径及文件名创建一个URL对象,记住file变量必须以下划线开始。比如我们要表示URL:http://www.ntu.edu.cn:80/local/searchresult.html
则可以这样表示:
try { URL url=new URL("http","www.ntu.edu.cn",80,"/local/searchresult.html"); } catch(MalformedURLException e) { …… } |
public URL(String protocol, String host, String file)
该构造方法用指定的协议、主机名、路径及文件名创建URL对象。
public URL( URL contoxt, String spec)
该构造方法用已存在的URL对象context创建URL对象。示例如下:
try{ URL base=new URL("http://www.strange.com.cn:80/x-file/1112.html"); URL loc=new URL(base , "#change"); } catch(MalformedURLException e) { } |
URL类中一些很基本的方法如下:
public final Obect getContent() 这个方法取得传输协议。
public String getFile() 这个方法取得资源的文件名。
public String getHost() 这个方法取得机器的名称。
public int getPort() 这个方法取得端口号。
public String getProtocol() 这个方法取得传输协议。
public String toString() 这个方法把URL转化为字符串。
1 实例:URL对象的创建及使用
下面我们举例介绍URL对象的创建及使用,见示例12-3。
【程序源代码】
1 // ==================== Program Description ========================== 2 // 程序名称:示例12-3: Myurl.java 3 // 程序目的:熟悉URL对象的创建及使用 4 // ============================================================== 5 import java.net. *; 6 import java.io.*; 7 8 class Myurl 9 { 10 public static void main(String args[]) 11 { 12 try { 13 URL url=new URL("http://www.tsinghua.edu.cn/chn/index.htm"); 14 System.out.println("the Protocol: "+url.getProtocol()); 15 System.out.println("the hostname: " +url.getHost()); 16 System.out.println("the port: "+url.getPort()); 17 System.out.println("the file:"+url.getFile()); 18 System.out.println(url.toString()); 19 } 20 catch(MalformedURLException e) { 21 System.out.println(e); 22 } 23 } 24 } |
【程序输出结果】
the Protocol: http the hostname: www.tsinghua.edu.cn the port: -1 the file:/chn/index.htm http://www.tsinghua.edu.cn/chn/index.htm |
【程序注解】
在第13行先实例化一个URL对象url,然后在第14~18行分别调用了URL对象的一些基本方法:getProtocol()、getHost()、getPort()和getFile(),分别取得了与URL相应的协议、主机名、端口和文件。如果URL地址不对,在第21行抛出MalformedURLException异常。
URLConnection是一个抽象类,代表与URL指定的数据源的动态连接,URLConnection类提供比URL类更强的服务器交互控制。URLConnection允许用POST或PUT和其他HTTP请求方法将数据送回服务器。在java.net包中只有抽象的URLConnection类,其中的许多方法和字段与单个构造器一样是受保护的,这些方法只可以被URLConnection类及其子类访问。
使用URLConnection 对象的一般方法如下:
(1)创建一个URL对象。
(2)调用URL对象的openConnection()方法创建这个URL的URLConnection对象。
(3)配置URLConnection。
(4)读首部字段。
(5)获取输入流并读数据。
(6)获取输出流并写数据。
(7)关闭连接。
当然我们并不需要完成所有这些步骤。比如我们可以接受URL类的默认设置,则可以不设置URLConnection;还有我们有时仅仅需要从服务器读取数据,并不需要向服务器发送数据,则我们就可以省去获取输出流并写数据这一步。
当创建URLConnection对象后,我们可以使用URLConnection对象的操作方法:
public int getContentLength() 获得文件的长度。
public String getContentType() 获得文件的类型。
public long getDate() 获得文件创建的时间。
public long getLastModified() 获得文件最后修改的时间。
public InputStream getInputStream() 获得输入流,以便读取文件的数据。
如果URL类的构造函数的参数有问题,比如字符内容不符合URL位置表示法的规定、指定的传输协议不是Java所能接受时,那么构造函数就会抛出MalformedURLException异常,这时一定要用try 和catch语句处理。
2 实例:使用URLConnection从Web服务器读取文件
接下来,我们用上面的方法从Web服务器上读取文件的信息,将文件的信息打印到屏幕。见示例12-4。
【程序源代码】
1 // ==================== Program Description ===================== 2 // 程序名称:示例12-4: URLDemo .java 3 // 程序目的:URLConnection类的用法 4 //============================================================= 5 import java.io.*; 6 import java.net.*; 7 import java.util.Date; 8 9 class URLDemo 10 { 11 public static void main(String args[]) throws Exception 12 { 13 System.out.println("starting...."); 14 int c; 15 URL url=new URL("http://www.sina.com.cn"); 16 URLConnection urlcon=url.openConnection(); 17 System.out.println("the date is :"+new Date(urlcon.getDate())); 18 System.out.println("content_type :"+urlcon.getContentType()); 19 InputStream in=rulcon.getInputStream(); 20 while (((c=in.read())!=-1)) 21 { 22 System.out.print((char)c); 23 } 24 in.close(); 25 } 26 } |
【程序输出结果】
starting.... the date is :Thu Mar 27 00:00:13 CST 2003 content_type :text/html ………………//网页文件内容 //--> </body> |
【程序注解】
在第15行中我们实例化了一个URL,接着就通过调用URL对象的openConnection()方法返回一个URLConnection类的对象urlcon。然后就分别调用了URLConnectin类的常用方法,返回了URL的一些基本信息。这些方法是:getDate()返回日期,getContentType()返回文件类型text/html,getInputStream()获得输入流,然后通过输入流取得文件(in.read()),并在标准输出上输出(System.out.println()),我们看到的是一个网页源代码文件。在IE中我们可以查看源代码文件,其实就是通过这种方法实现的。