导入工具包 win+r;输入cmd; 输入pip install BeautifulSoup4 输入pip install requests
主页代码:
import requests
# 导入bs4套件
from bs4 import BeautifulSoup
newsurl = 'http://www.baidu.com/'
# 发送get请求
res = requests.get(newsurl)
# 设置网页编码格式,如果不设置的话会产生中文乱码,编码格式按照爬取得网页来设置
res.encoding='utf-8'
# 将网页放入BeautifulSoup中,获取网页中的文本内容,把html标签都除掉,html.parser为剖析器,如果不自己设置系统会自动分配一个剖析器
soup = BeautifulSoup(res.text, "html.parser")
print(res.text)