2.1 URI与URL、URN
- URL是浏览器寻找信息时所需的具体位置。URl是人们对HTTP和其他协议的常用访问点:浏览器指向一个URL,浏览器就会发送适当的协议报文向服务器获取内容。
- URI是一类更通用的资源标识符,URL是它的子集,URI的两个主要子集:URL、URN。
- URL是通过描述资源的位置来获取资源,而URN是通过资源的名字来获取资源(与所处位置无关)。
- URL由三部分组成:
- 第一部分:协议类型、方案
- 第二部分:服务器名称、位置
- 第三部分:所需获取资源的具体路径
例:http://www.yahoo.com/image/logo.gif
上例中:第一部分:http://
第二部分:www.yahoo.com
第三部分:image/logo.gif
2.2 URL的语法
URL基本由九部分组成:方案、用户、密码、主机、端口、路径、参数、查询、片段
- 方案
方案实际上就是规定如何访问资源的主要标识符,负责告诉解析URL的应用程序使用的是什么协议。
方案组件必须以字母符号开始,且在URL中由第一个:将其与主体部分分开。
- 主机与端口
在URL中主机可以是类似“www.baidu.com”这种服务器名称,也可以是“192.168.1.3”这种IP地址,主要标识的是URL访问的具体服务器
端口组件标识了服务器正在监听的网络端口。
- 用户名和密码
很多服务器是需要用户名和密码才可以登录访问数据的,举例如下:
ftp://ftp.prep.ai.edu/pub/gnu
该例没有用户名和密码部分,只是标准的方案、主机和路径,如果所访问的服务器需要用户名和密码而用户没有主动填写,它通常会自动添加默认用户名(anonymous)和密码(IE会设置为IEUser)。
ftp://anonymous@ftp.prep.ai.edu/pub/gnu
该例是anonymous为用户名,用@将用户名和其他部分隔离开。
ftp://anonymous:password@ftp.prep.ai.edu/pub/gnu
该例和上例类似,只是增加了密码组件部分,用户名和密码之间用“:”隔开。
- 路径
路径是URL访问服务器资源时寻找资源的具体位置的路径,其标识用“/”将各路径段连接在一起,组成完整路径。
- 参数
对很多方案来说,只有简单的用户名、密码、路径等信息是不足够的,还需要某些参数,负责解析URL的应用程序可以根据这些参数来访问资源。
比如FTP协议有两种传输模式,二进制和文本形式,在具体使用总,如何选择传输模式就是靠参数组件来设置了。
其格式为:由“;”将其与其他部分分隔开,例:ftp://ftp.prep.ai.edu/pub/gnu;type=d
- 查询字符串
访问某些资源时可能其内容过于庞大,而访问所需资源是某些小部分内容,此时需要查询字符串。
例:访问数据库。假如数据库内有物品清单,并可以对清单内物品进行查看是否有货,则可以用下列URL访问
查看编号为12341的物品:http://www.sqlwp.com/store?item=12341
其格式为:用符号“?”将其与其他组件部分隔开,如需多个参数则在参数与参数间用符号“&”隔开。
例:http://www.sqlwp.com/store?item=12341&color=blue
- 片段
有些资源类型,比如HTML,除资源级可以划分外,还可以做进一步划分。
比如访问资源是一个大型带有章节的文档,理想的情况时访问某个章节,此时需要使用片段组件。
片段组件挂在URL的右手边,最前面加个符号#与其他部分分割。
例:http://www.sqlwp.com/store#color=blue
2.3 方案
- http:超文本传输协议方案,除没有用户名和密码外,与通用URL格式相符,默认端口80.
格式:http://host:port/path?query#frag
示例:http://localhost.com:80/index.html
- https:与http相似,唯一区别为添加了网景SSL,为http提供了加密机制,默认端口443.
格式:https://host:port/path?query#frag
示例:https://localhost.com:80/index.html
- mailto:URL指向的是E-mail地址,
格式:mailto:RCF-822-addr-spec
示例:mailto:joe@joes-hard.com
- ftp:文件传输协议,可用于上传及下载文件方面等用途。
格式:ftp://user:password@host:port/path;param
示例:ftp://anonymous:password@ftp.prep.ai.edu/pub/gnu
- rtsp、rtspu:RTSP是可以通过实时流传输协议解析的音视频媒体资源的标识符。
格式:rtsp://user:password@host:port/path
示例:rtsp://www.joes-hard.com:554/video
- file:访问服务器的文件资源,如省略主机名,则访问默认正在使用的本地主机。
格式:file://host/path
示例:file://localhost/words/111.doc
- news:我也没懂,也没地用到
- telnet:用于访问交互式业务,可通过telnet协议访问的交互式应用协议。
格式:telnet://user:password@host:port/
示例:telnet://www.joes-hard.com:554/