python 爬虫使用到bs4的介绍

bs4是对某些内容做逻辑的提取,比如html文件,xml,json格式的数据

bs4: 的安装 >pip install --user bs4

使用:

from bs4 import BeautifulSoup

page = BeautifulSoup(data,"html.parser") #指定html解释器

#2。从bs4 找数据  find(标签 ,属性=值) find_all(标签 ,属性=值)

table=page.find('div',class_="news-nr-box")
#class是python的关键字,

trs = table.find_all('tr',align="center",bgcolor="#FFFFFF")
 
for tr in trs:
    tds = tr.find_all('td')
    name = tds[0].text#.text 表示提取到被标签标记的内容
    high = tds[1].text
    low = tds[2].text
    xianjia = tds[3].text
    danwei = tds[4].text
    date = tds[5].text
   

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值