python学习之使用selenium爬取豆瓣图书信息

最新推荐文章于 2024-05-01 03:54:48 发布

灌木丛中的微风

最新推荐文章于 2024-05-01 03:54:48 发布

阅读量355

点赞数 10

文章标签： python 学习 selenium

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_58050808/article/details/136995993

版权

使用selenium爬取豆瓣图书信息

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.edge.options import Options

 


# 设定函数，获取所有图书信息
def all_bookonfo(driver, fp):
    url = "https://book.douban.com/tag/%E4%B8%AD%E5%9B%BD%E6%96%87%E5%AD%A6"
    driver.get(url)
    a_list = driver.find_elements(By.XPATH, "//ul[@class='subject-list']/li/div[2]")
    # @href
    for url in a_list:
        bookname = url.find_element(By.XPATH, "./h2/a").text
        info = url.find_element(By.XPATH, "./div[1]").text
        #将一行信息切分为不同模块
        writer = info.split("/")[0]
        publication = info.split("/")[1]
        year = info.split("/")[2]
        #去除原数据中的”元“
        price = info.split("/")[3].replace("元", " ")
        value = url.find_element(By.XPATH, "./div[2]/span[2]").text
        print(bookname, writer, publication, year, price, value)
        #写入文本中
        fp.write(bookname+","+writer+","+publication+","+year+","+price+","+value+"\n")




if __name__ == '__main__':
    
    #使得运行时不出现浏览器界面
    opt = Options()
    opt.add_argument("--headless")
    driver = webdriver.Edge(opt)
    # 爬取豆瓣图书的信息
    fp = open("./doubantushu.txt3", "w+", encoding="utf-8")

    # 调用获取所有图书信息的方法
    all_bookonfo(driver, fp)

    fp.close()

灌木丛中的微风

关注

10
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
python学习之使用selenium爬取豆瓣图书信息

selenium、豆瓣图书
复制链接

扫一扫

灌木丛中的微风 CSDN认证博客专家 CSDN认证企业博客

码龄3年

77: 原创

7397: 周排名

1万+: 总排名

5万+: 访问

: 等级

2092: 积分

1018: 粉丝

1343: 获赞

22: 评论

560: 收藏

私信

关注

热门文章

最新评论

Hadoop、Hive、HBase、数据集成、Scala阶段测试
ha_lydms: 这篇博客真是太好了。让我在里面学习到了很多的知识，加油。
Flink学习之Flink SQL（补）
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619223769。
Hadoop、Hive、HBase、数据集成、Scala阶段测试
全栈小5: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰，图文并茂，详略得当，三连支持，期待博主持续输出好文【Hadoop、Hive、HBase、数据集成、Scala阶段测试，博主这篇文章，值得一看】
Hadoop、Hive、HBase、数据集成、Scala阶段测试
穷苦书生_万事愁: 博主的这篇文章真的很精彩，通过阅读不仅让我对Hadoop、Hive、HBase、数据集成、Scala阶段测试有了更深入的了解，而且文章内容还很有深度和价值，让我受益匪浅。博主的文字表达清晰，细节描写准确，让我感受到了博主的专业素养和深厚的知识功底。期待博主能够继续分享更多优质的内容，也希望未来能够得到博主的指导，一起共同进步。感谢博主的辛勤付出和无私分享！
Spark学习之SparkSQL
大数据飞总: 优质文章，干货满满，

最新文章

2024

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。