使用urllib包 urllib.request.open()打开网页 使用encode()decode()解码
•URL的一般格式为(带方括号[]的为可选项):
protocol :// hostname[:port] / path /[;parameters][?query]#fragment
•URL由三部分组成:
–第一部分是协议:http,https,ftp,file,ed2k…
–第二部分是存放资源的服务器的域名系统或IP地址(有时候要包含端口号,各种传输协议都有默认的端口号,如http的默认端口为80)。
第三部分是资源的具体地址,如目录或文件名等