以下是阅读python核心编程web 开发后的心得笔记
1 统一资源定位符
URL(Uniform Resource Locator,统一资源定位符),它是一个Web地址,用来定位一个文档,或者调用CGI程序来为客户端产生一个文档。
URI(Uniform Resource Identifier,统一资源标识)
URN(Uniform Resource Name,统一资源名称)
URL格式:
prot_sch://net_loc/path;param?query#frag
pro_sch | 网络协议或者下载规划 |
net_loc | 服务器位置 |
path | 文件或CGI应用程序路径 |
param | 可选参数 |
query | 连接符(&)连接键值对 |
frag | 拆分文档中的特殊锚 |
user:passwd@host:port
user和passwd只会在使用FTP连接时用到。
20.2.2 urlparse模块
1. urlparse.urlparse()
将URL字符串拆分成前述的六个部分,以一个元组的形式返回这六个部分。
urlparse(urlstr, defProtSch=None, allowFrag=None)
例如
2. urlparse.urlunparse()与urlparse.urlparse()正好相反,把含url六个部分的元组重新组合成url字符串。
urlunparse(urltup)
3. urlparse.urljoin()
取得baseurl(基路径,即net_loc附加一个完整的路径,但不包括终端文件),并与newurl连接起来,用于生成多个相关的url字符串。
urljoin(baseurl, newurl, allowFrag=None)
20.2.3 urllib模块
1. urllib.urlopen()
打开一个给定url字符串与Web连接,并返回文件类对象。
urlopen(urlstr, postQueryData=None)
若无给定协议或下载规划&#x