小甲鱼python

入门
url 网页的地址 URL library
url由三部分组成:
1.协议,常见的有http,https,ftp,file(访问本地文件夹),ed2k(电驴的专用链接)
2.存放资源的服务器的域名系统(DNS)或IP地址(优势要包含端口号,各种传输协议都有默认的端口号,如http的默认端口号为80)
3.主机资源的具体地址,如目录和文件名等。
1 2用 ?/隔开 2 3用/隔开 1 2是不可缺少的 3优势可以省略
python3把urllib模块和urllib2模块合并了, url其实是一个包

一共四个模块

第一个:最复杂也最重要,包含了对服务器请求的发出,跳转,代理和安全等各个方面。

import urllib.request
response = urllib.request.urlopen("http://www.fishc.com")
html = response.read()
print(html)
html = html.decode("utf-8")
print(html)

编码
计算机是美国人发明的,ASCII编码采用1个字节存储,包含了大小写英文字母,数字和一些字符。不足以表示各国语言。
中国制定了GB 2312编码
Unicode编码 一开始浪费空间储存空间。 ----->UTF-8:当文本是ASCII编码的字符时,用1个字节,当我呢本事其他Unicde字符时,按一定算法转换,每个字符使用1~3个字符存放

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值