python3爬虫selenium爬取今日头条财经新闻

**

python3爬虫selenium爬取今日头条财经新闻

**
使用selenium爬取今日头条财经版块新闻标题,并保存至本地文档。
参考文章:https://blog.csdn.net/qq_42689278/article/details/84590798

from selenium import webdriver
import time #导入时间库
#给txt文件命名
def txt_name():
    d = time.localtime( time.time())          
    t_n = 'D:/python/workspace/toutiaonews/'+'newstitle_{}.{}.txt'.format(d[1],d[2])
    return t_n

#获取当前时间
def get_time():
    d = time.localtime( time.time())      
    dd = "现在是{}年{}月{}日{}时{}分".format(d[0],d[1],d[2],d[3],d[4])
    return dd
    
#将爬取的当前时间写入文本
def write_time(t_n):
    t = get_time()
    with open(t_n,'a',encoding='utf-8') as data:  
        print(t,file = data)

#保存标题
def write_info(t_n):
    titles= brower.find_elements_by_xpath('//div[@class="title-box"]/a')#如何找到这个位置
    for title in titles:
        con = title.text
        with open(t_n,'a',encoding='utf-8') as data:  
            print(con,file = data) 

#下拉界面
def get_manyinfo(t_n):
    brower.execute_script("window.scrollTo(0,1000);")
    time.sleep(1)# 推迟执行的秒数
    t = 0
    while t < 10:
        for i in range(30):
            brower.execute_script("window.scrollTo(0,document.body.scrollHeight);")
            time.sleep(3)
        write_info(t_n)
        brower.refresh()
        t += 1
    else:
        brower.close()
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值