【selenium爬虫测试】对网页中帖子标题进行爬取

晓昕昕

已于 2023-06-06 10:22:39 修改

阅读量186

点赞数

文章标签： python 爬虫 selenium

于 2023-06-06 10:12:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zwyxqzxx/article/details/131061973

版权

from selenium import webdriver
import re
from selenium.webdriver.common.by import By
from time import sleep
o=webdriver.ChromeOptions()
o.add_experimental_option('detach',True)
d=webdriver.Chrome(options=o)
num=0
open=0
while(open==0):
    try:
        d.get("https://tieba.baidu.com/f?kw=%E6%8A%97%E5%8E%8B%E8%83%8C%E9%94%85&ie=utf-8&pn="+str(num))
        sleep(2)
        t1=d.find_elements(By.CLASS_NAME,'j_th_tit')
        text=[]
        tem=t1[0].text
        text.append(tem)
        print(tem)
        for i in t1:
            tem2=i.text
            if(tem!=tem2):
                text.append(tem2)
                print(tem2)
                tem=tem2
        num=num+50
    except:
        open=1

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
【selenium爬虫测试】对网页中帖子标题进行爬取

【代码】【selenium爬虫测试】对网页中帖子标题进行爬取。
复制链接

扫一扫

晓昕昕 CSDN认证博客专家 CSDN认证企业博客

码龄14年

6: 原创

74万+: 周排名

85万+: 总排名

9516: 访问

: 等级

91: 积分

9: 粉丝

9: 获赞

19: 评论

75: 收藏

私信

关注

热门文章

最新评论

【数据分析大作业爬虫+数据清洗+可视化分析】Python抓取视频评论并生成词云、情感指数柱状图、性别比例饼图及评论信息表格
南河的参宿: 请问怎么解决，我也出现这个问题了
【数据分析大作业爬虫+数据清洗+可视化分析】Python抓取视频评论并生成词云、情感指数柱状图、性别比例饼图及评论信息表格
m0_71874271: 为什么一直显示我BV链接不正确呢
算法与分析学习题目记录——分治法
CSDN-Ada助手: 恭喜您写出了第四篇博客，标题为“算法与分析学习题目记录——分治法”！看得出您对算法学习十分认真，不断钻研，这是十分值得敬佩的。希望您能够继续保持这样的学习态度和热情，不断挑战自我，不断进步。下一步的创作建议是可以选择一些与分治法相关的应用场景或者实际问题，通过分析解决方案，来加深对分治法的理解和运用。期待您的下一篇博客！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
【selenium爬虫测试】对网页中帖子标题进行爬取
CSDN-Ada助手: 恭喜您写了这篇精彩的博客！对网页中帖子标题进行爬取，这是一个非常有用的技能。不过，我还想提出一点建议：在下一篇博客中，您可以尝试对网页中的其他元素进行爬取，例如文章内容、作者信息等等，这将会让您的技能更加全面。期待您的下一篇作品！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply6 看奖励名单。
【数据分析大作业爬虫+数据清洗+可视化分析】Python抓取视频评论并生成词云、情感指数柱状图、性别比例饼图及评论信息表格
m0_64697021: 载入代理IP失败，请检查httpipcfg.txt是否正确存在脚本目录！怎么解决

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

晓昕昕 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。