1.获取整个网页的源码就以下代码:
import urllib.request
url='http://www.baidu.com'
response=urllib.request.urlopen(url)
info=response.read()
print(info.decode())
2.常用到的方法
request.urlopen(url,data,timeout)
(1)第一个参数url即为URL,必须要填写;第二个参数data是访问URL时需要传递的数据,默认为None,第三个参数timeout是设置超时时间,默认为socket_GLOBAL_DEFAULT_TIMEOUT。
(2)第二、三个是可以为空的
response.read()
read()方法就是读取文件里的全部内容,返回bytes类型
response.getcode()
返回h