［技术交流］Python爬虫案例——爬取双色球近30期的开奖号码

最新推荐文章于 2025-01-17 09:37:56 发布

未名湖畔的程序员

最新推荐文章于 2025-01-17 09:37:56 发布

阅读量1.2k

点赞数 13

文章标签：爬虫 python selenium

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_74244397/article/details/137700621

版权

本文介绍了一段Python代码，利用Selenium和BeautifulSoup库从中国福利彩票官网抓取开奖结果，包括红球和蓝球号码。通过执行JavaScript路径定位DOM元素并提取文本内容。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

源代码如下：（拿走了就点个赞收藏一下吧～）

from selenium import webdriver

from bs4 import BeautifulSoup

import time

def get_element_by_js_path(driver, js_path):

"""

使用JavaScript执行DOM查询，返回查询到的元素。

"""

return driver.execute_script(f"return document.querySelector('{js_path}')")

def extract_div_text(url, delay_seconds=1):

"""

使用Selenium打开网页，执行JavaScript定位指定div，然后使用BeautifulSoup提取文本。

"""

driver = webdriver.Chrome()

try:

driver.get(url)

for i in range(1, 31): # 循环30次获取当前的开奖结果

j = 1

print("第" + str(2024041-i) + "期开奖号码：" + "最近第" + str(i) +"期")

for _ in range(6): # 循环6次获取当前红球的号码

target_div = get_element_by_js_path(driver, js_path.format(i, j))

soup = BeautifulSoup(target_div.get_attribute('outerHTML'), 'html.parser')

div_text = soup.get_text(strip=True)

print(f"红球（第{_ + 1}次获取）：{div_text}")

time.sleep(delay_seconds) # 延迟一段时间，确保页面有足够时间更新

j = j + 1

#获取蓝球号码

target_div_blue = get_element_by_js_path(driver, js_path_blue.format(i))

soup_blue = BeautifulSoup(target_div_blue.get_attribute('outerHTML'), 'html.parser')

div_text_blue = soup_blue.get_text(strip=True)

print(f"蓝球：{div_text_blue}")

finally:

driver.quit()

if __name__ == '__main__':

url = 'https://www.cwl.gov.cn/ygkj/wqkjgg/ssq/'

#最近一期第一个红球的js路径：body > div.main > div > div > div.ygkj_wqkjgg > div > div.body-content-item > div.table.ssq > table > tbody > tr:nth-child(1) > td:nth-child(3) > div > div:nth-child(1)

#第二期的第一个红球的JS路径：body > div.main > div > div > div.ygkj_wqkjgg > div > div.body-content-item > div.table.ssq > table > tbody > tr:nth-child(2) > td:nth-child(3) > div > div:nth-child(1)

#最近第一期的蓝球的JS路径： body > div.main > div > div > div.ygkj_wqkjgg > div > div.body-content-item > div.table.ssq > table > tbody > tr:nth-child(1) > td:nth-child(3) > div > div.qiu-item.qiu-item-small.qiu-item-wqgg-zjhm-blue

js_path = "body > div.main >

未名湖畔的程序员

博客等级

码龄3年

3
原创

41
点赞

39
收藏

149
粉丝

关注

私信

热门文章

最新评论

Unity创建项目失败错误解决方案
未名湖畔的程序员: 需要根据自己电脑的系统版本和架构去网上搜索
Unity创建项目失败错误解决方案
CareerEscape: null哪里下载？
［技术交流］Python爬虫案例——爬取双色球近30期的开奖号码
CSDN-Ada助手: 恭喜用户第三篇博客发布成功！看到你分享的Python爬虫案例，让我对爬取双色球近30期的开奖号码有了更深入的了解。希望你能继续保持创作热情，分享更多有趣的技术交流内容。下一步建议可以尝试结合数据分析或可视化技术，对这些开奖号码进行更深入的探索和解读。期待你的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Unity创建项目失败错误解决方案
CSDN-Ada助手: 非常棒的博文！你对解决Unity创建项目失败的错误提供了很有帮助的解决方案。继续写博客吧，你的经验和知识对其他人来说非常宝贵。除了你提到的解决方案，我还想分享一些与该博文相关的扩展知识和技能。首先，了解更多关于Unity的项目创建过程中可能出现的其他错误和解决方案，这将帮助你更好地帮助其他人。此外，掌握一些常用的命令行操作技巧也很有用，比如复制命令和使用系统服务命令。再次感谢你的分享，希望看到更多类似的博文。继续努力！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。