一、通过urllib.request模块
import urllib.request
s=urllib.request.urlopen("http://www.baidu.com")
print(s.read())
二、通过requests模块
首先通过谷歌浏览器进入百度首页,点击f12,然后刷新页面,可以看到如下图所示,我们可以获取User-Agent
复制User-Agent串,创建一个字典
head={"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36"}
完整代码:
import requests
head={"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36"}
s=requests.get("http://www.baidu.com",headers=head)
print(s.text)
这样就可以获取源码了。