综述:统一资源定位符(URL)是统一资源标志符的一个下种。统一资源标志符(URI)确定一个资源,而统一资源定位符不但确定一个资源,而且还表示出它在哪里。一般统一资源定位符的开始标志着一个计算机网络所使用的网络协议。
组成:基本URL包含模式(或称协议)、服务器名称(或IP地址)、路径和文件名,如“协议://授权/路径?查询”。完整的、带有授权部分的普通统一资源标志符语法看上去如下:协议://用户名:密码@子域名.域名.顶级域名:端口号/目录/文件名.文件后缀?参数=值#标志
- 第一部分:模式/协议(scheme)–>它告诉浏览器如何处理将要打开的文件。最常用的模式是超文本传输协议(Hypertext
Transfer Protocol,缩写为HTTP),这个协议可以用来访问网络。 其他协议如下:
/*
https----用安全套接字层传送的超文本传输协议
ftp------文件传输协议
mailto---电子邮件地址
file-----当地电脑或网上分享的文件
news-----Usenet新闻组
gopher---Gopher协议
*/
- 第二部分:文件所在的服务器的名称或IP地址,后面是到达这个文件的路径和文件本身的名称。服务器的名称或IP地址后面有时还跟一个冒号和一个端口号。它也可以包含接触服务器必须的用户名称和密码。路径部分包含等级结构的路径定义,一般来说不同部分之间以斜线(/)分隔。询问部分一般用来传送对服务器上的数据库进行动态询问时所需要的参数。有时候,URL以斜杠“/”结尾,而没有给出文件名,在这种情况下,URL引用路径中最后一个目录中的默认文件(通常对应于主页),这个文件常常被称为index.html
或 default.htm。
import java.io.IOException;
import java.net.MalformedURLException;
import java.net.URL;
/**
* URL(String spec):绝对路径构建
* URL(URL context,String spec):相对路径构建
* URL由四部分组成:协议、存放资源的域名、资源文件名或者端口号
* @author Administrator
*
*/
public class URLDemo {
public static void main(String[] args) throws IOException {
// URL url = new URL("http://www.baidu.com:80");
URL url = new URL("http://www.baidu.com:80/index.html#aa?uname=test");//锚点:#aa
System.out.println("协议:" + url.getProtocol());
System.out.println("域名:" + url.getHost());
System.out.println("端口:" + url.getPort());
System.out.println("资源:" + url.getFile());
System.out.println("相对路径:" + url.getPath());
System.out.println("锚点:" + url.getRef());//锚点
//?参数:存在锚点则返回null,否则返回?之后的所有内容
System.out.println("参数:" + url.getQuery());
System.out.println(url.getContent());
}
}
输出结果:协议:http
域名:www.baidu.com
端口:80
资源:/index.html
相对路径:/index.html
锚点:aa?uname=test
参数:null
sun.net.www.protocol.http.HttpURLConnection$HttpInputStream@a87cbde
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.net.URL;
public class URLDemo02 {
public static void main(String[] args) throws IOException {
URL url = new URL("http://www.baidu.com");//主页,默认资源
//获取资源 网络流
/*编解码集不统一,出现乱码
InputStream is = url.openStream();
byte[] flush = new byte[1024];
int len = 0;
while(-1!=(len=is.read(flush))){
System.out.println(new String(flush,0,len));
}
is.close();
*/
//使用转换流
BufferedReader br =
new BufferedReader(new InputStreamReader(url.openStream(),"utf-8"));
BufferedWriter bw =
new BufferedWriter(new OutputStreamWriter(new FileOutputStream("baidu.html"),"utf-8"));
String msg = null;
while(null!=(msg=br.readLine())){
//System.out.println(msg);
bw.append(msg);
bw.newLine();
}
bw.flush();
bw.close();
br.close();
}
}