提取网页特定数据的案例

本文介绍了如何利用Python的BeautifulSoup库从HTML文件中提取所需数据。通过解析HTML,可以轻松获取网页上的特定信息。
摘要由CSDN通过智能技术生成

BeautifulSoup可以使我们通过网页的标签找到网页中我们想要的特定数据。本案例可以清楚地理顺从html文件变化到我们想要获得的数据。Python程序如下:

from bs4 import BeautifulSoup
import requests
url = 'http://new.cpc.com.tw/division/mb/oil-more4.aspx'

html = requests.get(url).text
bs = BeautifulSoup(html, 'html.parser')
#print(bs)
data = bs.find_all('span' ,{'id':'Showtd'} )
#print(data)
rows = data[0].find_all('tr')
#print(rows)

prices = list()
i = 0
for row in rows:
    if i < 16:
        print(row)
    cols = row.find_all("td")
    if len(cols[1].text ) > 0:
        item = [cols[0].text, cols[1].text, cols[2].text, cols[3].text]
        prices.append(item)
    i += 1
i = 0
for p in prices:
    if i < 16:
        print(p)
    i += 1
现在从变量容器的变化过程,认识提取
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值