Python爬虫-----爬取某阁小说

很早以前刚接触python的时候就知道python可以做爬虫,然后自己就学习了下,再借鉴网上大佬的一些经验,写了这么一篇爬虫学习笔记。水平有限还请各位大佬莫要见笑,其中有什么问题,以及可优化的地方,也请大佬们提出来,共同学习一起进步!这篇文章问两个部分web网页自动化操作和爬虫数据爬取因为我借鉴大佬的部分是爬虫那一部分,他只能给特定的url来获取相应的数据,我加入了搜索在选择具体的小说的功能,索引加上了web相关的操作准备相关的库,以及环境安装selenium安装 tqdm》web网页操作首
摘要由CSDN通过智能技术生成

很早以前刚接触python的时候就知道python可以做爬虫,然后自己就学习了下,再借鉴网上大佬的一些经验,写了这么一篇文章。水平有限还请各位大佬莫要见笑,其中有什么问题,以及可优化的地方,也请大佬们提出来,共同学习一起进步!

这篇文章问两个部分web网页自动化操作爬虫数据爬取
因为我借鉴大佬的部分是爬虫那一部分,他只能给特定的url来获取相应的数据,我加入了搜索在选择具体的小说的功能,索引加上了web相关的操作

准备相关的库,以及环境

安装 selenium
安装 tqdm https://blog.csdn.net/DU_Python/article/details/109532477 (自卖自夸一手)
安装 BeautifulSoup
下载 chromedriver 下载地址 http://npm.taobao.org/mirrors/chromedriver/ 一般对应你的谷歌浏览器版本下载就好

  • 首先打开网站笔趣阁,这里加了属性,使浏览器在后台运行
  • 进行web操作,搜索小说将得到的结果存为字典
# _*_ coding=utf-8 _*_
import requests
import time
from tqdm import tqdm
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions
from selenium.webdriver.common.by import By


def input_novel_name(novel_name):
    """搜索输入的书名,返回一个书名和相应链接的字典"""
    # 设置浏览器为后台运行模式
    base_url = 'https://www.xsbiquge.com/'
    option = webdriver.ChromeOptions()
    option.add_argument('headless')
    # 以后台运行的方式打开浏览器
    browser = webdriver.Chrome(r'C:\Users\Administrator\PycharmProjects\untitled\spider\chromedriver.exe',
                               options=option)  # 括号内第一个参数为Chromedriver的本地位置
    # 访问网站
    browser.get(base_url)
    # 设置隐式等待
    wait = WebDriverWait(browser, 20, 0.2)
    # web操作的元素定位点
    input_locator = (By.XPATH, "//input[@id='keyword']")  # 搜索框定位
    button_locator = (By.XPATH, "//input[@class='button']")  # 搜索按钮定位
    e = wait.until(expected_conditions.presence_of_element_located(input_locator))  # 等待元素可见
    e.send_keys(novel_name)  # 输入小说名
    b = wait.until(expected_conditions.element_to_be_clickable(button_locator))  # 等待元素可以点击
    b.click()

    try:
        browser.find_element_by_xpath('//img')  # 先做一个判断,看结果页是否包含我们目标页面的元素
        link_name = []  # 存储搜索到的书名
        link_herf = []  # 书名对应的链接
        # 保存整个页面我们需要的内容(每一条结果的title和herf)
        for link in browser.find_elements_by_xpath("//a[@class='result-game-item-title-link']"):
            link_herf.append(link.get_attribute('href'))  # 获取herf属性内容
            link_name.appe
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
智慧校园整体解决方案是响应国家教育信息化政策,结合教育改革和技术创新的产物。该方案以物联网、大数据、人工智能和移动互联技术为基础,旨在打造一个安全、高效、互动且环保的教育环境。方案强调从数字化校园向智慧校园的转变,通过自动数据采集、智能分析和按需服务,实现校园业务的智能化管理。 方案的总体设计原则包括应用至上、分层设计和互联互通,确保系统能够满足不同用户角色的需求,并实现数据和资源的整合与共享。框架设计涵盖了校园安全、管理、教学、环境等多个方面,构建了一个全面的校园应用生态系统。这包括智慧安全系统、校园身份识别、智能排课及选课系统、智慧学习系统、精品录播教室方案等,以支持个性化学习和教学评估。 建设内容突出了智慧安全和智慧管理的重要性。智慧安全管理通过分布式录播系统和紧急预案一键启动功能,增强校园安全预警和事件响应能力。智慧管理系统则利用物联网技术,实现人员和设备的智能管理,提高校园运营效率。 智慧教学部分,方案提供了智慧学习系统和精品录播教室方案,支持专业级学习硬件和智能化网络管理,促进个性化学习和教学资源的高效利用。同时,教学质量评估中心和资源应用平台的建设,旨在提升教学评估的科学性和教育资源的共享性。 智慧环境建设则侧重于基于物联网的设备管理,通过智慧教室管理系统实现教室环境的智能控制和能效管理,打造绿色、节能的校园环境。电子班牌和校园信息发布系统的建设,将作为智慧校园的核心和入口,提供教务、一卡通、图书馆等系统的集成信息。 总体而言,智慧校园整体解决方案通过集成先进技术,不仅提升了校园的信息化水平,而且优化了教学和管理流程,为学生、教师和家长提供了更加便捷、个性化的教育体验。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值