一、使用urllib库访问百度首页
1.引用urllib库
import urllib.request
2.定义一个url
import urllib.request
url = 'http://www.baidu.com'
3.模拟浏览器发送请求
import urllib.request
url = 'http://www.baidu.com'
response = urllib.request.urlopen(url)
4.获取html的源码【read方法返回的是字节形式的二进制数据】
import urllib.request
url = 'http://www.baidu.com'
response = urllib.request.urlopen(url)
content = response.read()
print(content) # 打印页面源码
5.将二进制的数据转换为字符串【解码,decode('编码的格式(普遍是utf-8')】
import urllib.request
url = 'http://www.baidu.com'
response = urllib.request.urlopen(url)
content = response.read().decode('utf-8')
print(content)