python 爬虫使用到bs4的介绍

最新推荐文章于 2024-08-03 19:27:22 发布

weixin_39366520

最新推荐文章于 2024-08-03 19:27:22 发布

阅读量244

点赞数

分类专栏： python 文章标签： python 爬虫 pycharm

本文链接：https://blog.csdn.net/weixin_39366520/article/details/124671036

版权

python 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

bs4是对某些内容做逻辑的提取，比如html文件，xml，json格式的数据

bs4: 的安装 >pip install --user bs4

使用:

from bs4 import BeautifulSoup

page = BeautifulSoup(data,"html.parser") #指定html解释器

#2。从bs4 找数据  find（标签 ，属性=值） find_all（标签 ，属性=值）

table=page.find('div',class_="news-nr-box")
#class是python的关键字，

trs = table.find_all('tr',align="center",bgcolor="#FFFFFF")
 
for tr in trs:
    tds = tr.find_all('td')
    name = tds[0].text#.text 表示提取到被标签标记的内容
    high = tds[1].text
    low = tds[2].text
    xianjia = tds[3].text
    danwei = tds[4].text
    date = tds[5].text

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39366520

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 爬虫使用到bs4的介绍

bs4是对某些内容做逻辑的提取，比如html文件，xml，json格式的数据bs4: 的安装 >pip install --user bs4使用:from bs4 import BeautifulSouppage = BeautifulSoup(data,"html.parser") #指定html解释器#2。从bs4 找数据 find（标签，属性=值） find_all（标签，属性=值）table=page.find('div',class_="news-nr-box
复制链接

扫一扫