爬取网站需要安装requests和lxml,获取和解析网站的包,安装教程见我上一篇文章
- x.get(url,headers) url请求地址,headers为http请求的头,当网站使用反爬虫技术时可以使用
- x.text自动解码成中文
- x.content当x.text解码不正确时,为原始没有编码动作的解码,可手动解码
import requests
response = requests.get('https://www.yhdmk.com/')
# print(response.text)
print(response.content.decode('utf-8'))