用selenium定位网页元素并储存到文本文件中

#导包
from selenium import webdriver
#创建类
class spider():
    # 定义属性
    def __init__(self):
        self.url = "https://tieba.baidu.com/index.html"
#定义方法
    def write_keep(self):
    # 打开谷歌
       driver = webdriver.Chrome()
    # 设置隐式等待
       driver.implicitly_wait(5)
    #窗口最大化
       driver.maximize_window()
    # 打开百度贴吧网址
       driver.get(self.url)
    #打开文件
       file = open("spider1.txt", "w")
    #抓取元素保存到文件中
       for i in range(1, 11):
           ele = driver.find_element_by_xpath('//*[@id="right_wrap"]/div[3]/div/ul/li[' + str(i) + ']/a').text
           print(i,ele)
           # 去掉字符间可能存在的空格
           ss = ''.join(ele.split())
            # 写入文件
           file.write(str(i) + "  " + ss + "\n")
           # 关闭文件
       file.close()
#类的实例化与调用
if __name__ == '__main__':
    spider1 = spider()
    spider1.write_keep()

结果:
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值