Beautifulsoup学习笔记+实战项目（绝对详细）

Braylon1002

于 2020-03-12 21:56:31 发布

阅读量2.2k

点赞数 5

分类专栏：大数据数据挖掘文章标签： python 爬虫 Beautifulsoup

本文链接：https://blog.csdn.net/qq_40742298/article/details/104828729

版权

文章目录

安装
demo
实战爬取
- 爬取百度热门人物排行
- 大学排名爬取

安装

pip install beautifulsoup4

卸载：

pip uninstall beautifulsoup4

## import

import requests
import os
from bs4 import BeautifulSoup
import bs4
import re

demo

r = requests.get("网址")
r.encoding = r.apparent_encoding
demo = r.text
soup = BeautifulSoup(demo, 'html.parser')
res = list()
for item in soup.find_all('a', string=re.compile('疫')):
    res.append(item.string)
print(res)

上面可以简单的看作一段代码，大致意思就是在网页上寻找中含有“疫”的内容。
具体的用法会在后面给出。

Beautifulsoup操作

首先我们先明确html的基本结构
在这里插入图片描述
是很明显的树状结构。

基本元素

最低0.47元/天解锁文章