python双色球数据

最新推荐文章于 2024-10-23 07:00:00 发布

RL明日

最新推荐文章于 2024-10-23 07:00:00 发布

阅读量254

点赞数

文章标签： html 前端

本文链接：https://blog.csdn.net/qq_49594899/article/details/133930099

版权

一、前提声明

1、高亮显示的双色球xpath路径

//tbody[@id="tdata"]/tr/td[contains(@class,'chartBall01')]/text() = //tbody[@id="tdata"]/tr/td[@class="chartBall01"]/text()

<> text <> ：<><>两者之间是文本信息，加上/text()没有问题

2、数据解析

for tr in resp.xpath('//tbody[@id="tdata"]/tr[not(contains(@class,"tdbck"))]')

每个tr为一行:输出为:

期数xpath路径

二、完整代码及运行结果

1、代码


import requests
from lxml import etree
#发送请求
url = 'https://datachart.500.com/ssq/'
heardes = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36'
}

#获取结果
respond = requests.get(url,headers=heardes)
respond.encoding = 'gbk'

resp = etree.HTML(respond.text)
a = resp.xpath('//tbody[@id="tdata"]/tr/td[@class="chartBall01"]/text()')

b = resp.xpath('//tbody[@id="tdata"]/tr[not(contains(@class,"tdbck"))]')
print(b)
#逐行打印
reds = [tr.xpath('./td[contains(@class,"chartBall01")]/text()') for tr in resp.xpath('//tbody[@id="tdata"]/tr[not(contains(@class,"tdbck"))]')] #数据过滤以及提取
"""
列表推导式，相当于
for tr in resp.xpath('//tbody[@id="tdata"]/tr[not(contains(@class,"tdbck"))]'):
    print(tr.xpath('./td[contains(@class,"chartBall01")]/text()')
"""
blues = resp.xpath('//tbody[@id="tdata"]/tr/td[@class="chartBall02"]/text()')
title = resp.xpath('//tbody[@id="tdata"]/tr/td[@align="center"]/text()')

for t,r,b in zip(title,reds,blues):
    print(f'第{t}期:红球是{r}-----蓝球是{b}')

#处理结果