Selenium爬取会计师事务所新闻信息——以中准会计师事务所为例

预期效果

可以看到,该会计师事务所共有17页新闻,每一页有20条新闻,如果一个一新闻点开,收集具有某些关键字的新闻标题、内容、地址等信息,比较费时,使用爬虫可以较快爬取下来。
在这里插入图片描述
在这里插入图片描述

代码实现

from selenium import webdriver
import re
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import requests
from bs4 import BeautifulSoup
import re
import csv

browser = webdriver.Chrome()
wait=WebDriverWait(browser, 10)

def search(i,j):
    try:
        browser.get('http://www.zhongzhuncpa.com/list-58956b7d6a3919c1448ca56a/page{}.shtml'.format(i))
        print('打开第{}页'.for
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值