HTTP协议之URL

概念:
——URI统一资源标识符(Uniform Resource Identifier)是抽象的定义了URI用户对网络中(一般指万维网)的资源通过特定的协议进行交互操作。包含了URL和URN。是一个用于标识某一互联网资源名称的字符串。
——URL统一资源定位符(Uniform Resource Locator)是标识一个互联网资源,并指定对其进行操作或取得该资源的方法的同意资源标识符。
——URN统一资源名称 (Uniform Resource Name, URN)
唯一标识一个实体的标识符,但是不能给出实体的位置。

protocol(协议类型):
file 资源是本地计算机上的文件。格式file://
ftp 通过 FTP访问资源。格式 FTP://
gopher 通过 Gopher 协议访问该资源。
http 通过 HTTP 访问该资源。 格式 HTTP://
https 通过安全的 HTTPS 访问该资源。 格式 HTTPS://
mailto 资源为电子邮件地址,通过 SMTP 访问。 格式 mailto:
MMS 通过 支持MMS(流媒体)协议的播放该资源。(代表软件:Windows Media Player)格式 MMS://
ed2k 通过 支持ed2k(专用下载链接)协议的P2P软件访问该资源。(代表软件:电驴) 格式 ed2k://
Flashget 通过 支持Flashget:(专用下载链接)协议的P2P软件访问该资源。(代表软件:快车) 格式 Flashget://
thunder 通过 支持thunder(专用下载链接)协议的P2P软件访问该资源。(代表软件:迅雷) 格式 thunder://
news 通过 NNTP 访问该资源。

hostname(主机名):
是指存放资源的服务器的域名系统(DNS) 主机名或 IP 地址。有时,在主机名前也可以包含连接到服务器所需的用户名和密码(格式:username:password@hostname)。

port(端口号):
整数,可选,省略时使用方案的默认端口,各种传输协议都有默认的端口号,如http的默认端口为80。如果输入时省略,则使用默认端口号。有时候出于安全或其他考虑,可以在服务器上对端口进行重定义,即采用非标准端口号,此时,URL中就不能省略端口号这一项。

path(路径):
由零或多个“/”符号隔开的字符串,一般用来表示主机上的一个目录或文件地址。

parameters(参数):
这是用于指定特殊参数的可选项。

query(查询):
可选,用于给动态网页(如使用CGI、ISAPI、PHP/JSP/ASP/ASP。NET等技术制作的网页)传递参数,可有多个参数,用“&”符号隔开,每个参数的名和值用“=”符号隔开。

fragment(信息片断):
字符串,用于指定网络资源中的片断。例如一个网页中有多个名词解释,可使用fragment直接定位到某一名词解释。

示例:在百度搜索框搜索 bs rev_pq&tn= ,点击百度一下后,地址栏改变如下:

http://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&tn=98759660_hao_pg&wd=bs%20%20rev_pq%26tn%3D
&rsv_pq=dcff157d00007108&rsv_t=5137a95FE09Tn9n2i5j1KGD8tWnSBkr240KCLxCwZvtKpIZfnvzkwDBkDtHf2dbGoHbnULLw
&rsv_enter=1&rsv_sug3=4&rsv_sug2=0&inputT=8394&rsv_sug4=8394

下面是对地址栏的分析:
http——使用的协议;
://——分隔符;
www.baidu.com——主机名;
/s*——请求资源所在的位置;
?——分隔符,后面是用户提交时的参数;
Ie——页面编码格式;
&——分隔符;
F——搜索判断,f=8(用户自主搜索),f=3(下拉框推荐),f=1(相关搜索);
rsv_bp——判断是第几次搜索,0为第一次搜索,1为第二次或者多次搜索;
tn——纪录搜索来自哪里,当你使用账户登录后,就会有此项纪录,比如,你登录百度空间或者登录了遨游浏览器;
wd——当前搜索的关键词或者内容;
bs——上一次搜索的词或者内容,百度竞价的展现的关键词;
rsv_spt——识别浏览器,IE内核的浏览器是3,火狐是1;
inputT——从在搜索框中输入/修改字符到点击百度一下的时间,单位是毫秒;
oq——相关搜索的主词,例如,搜索seo时,出现的相关搜索,它的oq=seo;
rsp——第n+1个相关搜索,例如rsp=4,它就是第5个相关搜索;
rsv_sug3——键盘重复速度(Keyboard Repeat Speed),取决于输入字符的速率;
dsp——表示访问所使用的设备;

这些是网站中GET传参,而inputT、rsv_sug3是需要传参的名,等号后面的字符是值,每个传参的名之间&分割,与页面地址之间用英文状态下的?分割。一般常用表单提交,程序会把这个参数及值写进数据库。这些参数名是百度程序员定义的,具体是什么作用就只有百度程序员自己知道了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

继学先生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值