先引入模块 urllib.request和re
import requests
import re
定义一个url链接
url="http://blog.csdn.net"
浏览器伪装,定义一个headers头
headers=("user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3741.400 QQBrowser/10.5.3863.400")
将headers添加到真实的报头中去,首先建立一个opener对象,再将其添加进去
opener=urllib.request.build_opener()
opener.addheaders=[headers]
将其安装为全局(不然就只能用opener打开)
urllib.request.install_opener(opener)
然后获取首页信息
data=urllib