引言:
面相(新手and老手)的教程
提起BeautifulSoup相信大家都有些了解,但有没有这种经历:一看大佬开源项目一头雾水--这是啥!!?😵😭 看了看官方文档,完全看不懂... ,没事,我来救你
什么?...你说你完全没听过,没事,赶紧过来我来救你
1,最基本的--是啥
BeautifulSoup是一个用来解析提取源码信息的第三方库...,说白了就是从源码中拿走你要的信息的工具🔧,适用于爬虫领域🐛,如果你连爬虫是啥都不知道,建议你先了解一下(用法本人上上篇讲过)
2,咋用
先要解析源码:(源码会被解析成列表,所以可以用列表方法,这点以后会说)
from bs4 import BeautifulSoup
soup=BeautifulSoup(html,"html.parser")
(1)最基本的,find()和find_all()😀
源码:本人前端不好不要嘲笑😕
<html>
<div>
<a>class=12345<a>
<a>class=abcde<a>
<b>class=tttt<b>
<div>
<html>=12345
find:找到源码中的第一个
soup.find("a")
输出-<a>class
find_all:找到所有
soup.find_all("a") #[<a>...<a>, <a>...<a>]列表方法:soup.find_all("a")[0] #<a>第一个<a>]
2.选择器(select)(逐渐上头😇)
soup.select("a")#找到所有a标签,同理可有列表方法soup.select("a")[0]
soup.select("[class]")#查找所有class属性和所在标签的其它元素
soup.select("a[class]")查找所有带class属性的a标签及元素
欢迎大佬前来补充😀😎😘