分享111个HTML娱乐休闲模板，总有一款适合您

最新推荐文章于 2024-03-07 12:32:08 发布

亚丁号

最新推荐文章于 2024-03-07 12:32:08 发布

阅读量524

点赞数

分类专栏： Html 文章标签： python 开发语言

本文链接：https://blog.csdn.net/zy0412326/article/details/129099183

版权

Html 专栏收录该内容

67 篇文章 6 订阅

订阅专栏

文章提供了111个HTML娱乐休闲模板的下载链接，并展示了使用Python进行数据采集的代码示例，该代码适用于从特定网站抓取信息，包括各种类型的网站模板如瑜伽、音乐、美容等。此外，还包含了清理和管理下载文件夹的辅助函数。

摘要由CSDN通过智能技术生成

分享111个HTML娱乐休闲模板，总有一款适合您

111个HTML娱乐休闲模板下载链接：https://pan.baidu.com/s/1mqmJLctj9oQbJt6Oo8IuBA?pwd=ep3t
提取码：ep3t

Python采集代码下载链接：采集代码.zip - 蓝奏云

响应式美容养生服务行业网站模板

SPA美容养生会所网站模板

SPA美容服务中心响应式网站模板

打造健康生活方式宣传网站模板

import os
import shutil
import time
from time import sleep
from docx import Document
from docx.shared import Inches
from framework.base.BaseFrame import BaseFrame
from sprider.business.DownLoad import DownLoad
from sprider.business.SeleniumTools import SeleniumTools
from sprider.business.SpriderTools import SpriderTools
from selenium import webdriver
from selenium.webdriver.common.by import By
from sprider.model.SpriderEntity import SpriderEntity
from sprider.access.SpriderAccess import SpriderAccess

title_name = "娱乐休闲"


class ChinaZJsSelenium:
    base_url = "https://sc.chinaz.com/"  # 采集的网址
    save_path = "D:\\Freedom\\Sprider\\ChinaZ\\"
    sprider_count = 111  # 正在采集第20页的第20个资源，共22页资源
    sprider_start_count = 0

    word_content_list = []
    folder_name = ""
    page_end_number = 0
    max_pager = 24  # 每页的数量
    haved_sprider_count = 0  # 已经采集的数量
    page_count = 1  # 每个栏目开始业务content="text/html; charset=gb2312"
    filter_down_file = []
    word_image_count = 5  # word插入图片数量 同时也是明细采集图片和描述的数量
    sprider_detail_index = 0  # 明细方法采集的数量 累加
    sprider_top_level = "HTML"

紫色风格瑜伽机构宣传网站模板

响应式演唱会音乐会票务网站模板

紫色风格在线娱乐游戏网站模板

HTML5音乐资讯音频分享网站模板

黑色炫酷摇滚音乐分享网站模板

瑜伽馆瑜伽培训中心网站模板

HTML5音频音乐资讯网站模板

HTML5热门游戏体验宣传网站模板

演唱会嘉宾宣传介绍网页模板

HTML5演唱会票务服务网站模板

极简风酒店预定服务网站模板

网游手游公司HTML5网站模板

极简风格图书店HTML5网站模板

咖啡屋宣传网站HTML5模板

皮肤护理机构HTML5网站模板

SPA水疗中心HTML5网站模板

商务休闲咖啡饮品网页模板

电影电视节目视频网站模板

多风格游戏电玩网站HTML模板

电子竞技游戏官网HTML5模板

社交媒体电影视频HTML5模板

在线影院视频资源平台网站模板

音频播客音乐网站HTML5模板

女性美容Spa网站HTML模板

娱乐音乐资讯发布平台网站模板

休闲时光饮料店HTML5模板

电子竞技游戏网站HTML5模板

娱乐新闻图片博客单页模板

在线3D高清影院HTML5模板

水果果汁饮料店网站模板

人像摄影拍摄网站模板

宽屏简洁咖啡甜点网站模板

扑克纸牌游戏网站模板

在线交友社区社交网站模板

桑拿按摩会所网站模板

粉色甜美冰淇淋店网站模板

女人美容养生网站模板


    def sprider(self, title_name):
        """
       采集
       医疗保健 https://sc.chinaz.com/moban/YiLiaoBaoJian.html
       电子产品 https://sc.chinaz.com/moban/DianZiChanPin.html
       电子商务 https://sc.chinaz.com/moban/DianZiShangWu.html
       婚纱模板 https://sc.chinaz.com/moban/HunShaMoBan.html
       电脑主机 https://sc.chinaz.com/moban/DianNaoZhuJi.html
       旅游交通 https://sc.chinaz.com/moban/LvYouJiaoTong.html
       体育竞技 https://sc.chinaz.com/moban/TiYuJingJi.html
       娱乐休闲 https://sc.chinaz.com/moban/YuLeXiuXian.html
       :return:
       """
        if title_name == "医疗保健":
            self.first_column_name = "moban"
            self.folder_name = "HTML医疗保健模板"
            self.second_column_name = "YiLiaoBaoJian"
        elif title_name == "娱乐休闲":
            self.first_column_name = "moban"
            self.folder_name = "HTML娱乐休闲模板"
            self.second_column_name = "YuLeXiuXian"
        elif title_name == "体育竞技":
            self.first_column_name = "moban"
            self.folder_name = "HTML体育竞技模板"
            self.second_column_name = "TiYuJingJi"

        elif title_name == "旅游交通":
            self.first_column_name = "moban"
            self.folder_name = "HTML旅游交通模板"
            self.second_column_name = "LvYouJiaoTong"
        elif title_name == "电脑主机":
            self.first_column_name = "moban"
            self.folder_name = "HTML电脑主机模板"
            self.second_column_name = "DianNaoZhuJi"

        elif title_name == "电子产品":
            self.first_column_name = "moban"
            self.folder_name = "HTML电子产品模板"
            self.second_column_name = "DianZiChanPin"

        elif title_name == "电子商务":
            self.first_column_name = "moban"
            self.folder_name = "HTML电子商务模板"
            self.second_column_name = "DianZiShangWu"

        BaseFrame().right("本次采集参数：日志路径：" + str(BaseFrame().LOG_PATH) + "")
        BaseFrame().right("本次采集参数：sprider_count=" + str(self.sprider_count) + "")
        BaseFrame().right("本次采集参数：title_name=" + title_name + "")
        BaseFrame().right("本次采集参数：second_column_name=" + self.second_column_name + "")
        # self.folder_name = "JS表单验证"
        self.sprider_category = title_name  # 一级目录self.folder_name
        second_folder_name = str(self.sprider_count) + "个" + self.folder_name  # 二级目录
        self.sprider_type = second_folder_name
        self.merchant = int(self.sprider_start_count) // int(self.max_pager) + 1  # 起始页码用于效率采集
        # 原始路径+一级目录+二级目录
        self.file_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name

        self.save_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name + os.sep + self.folder_name
        BaseFrame().debug("开始采集ChinaZJL" + self.folder_name + "...")
        sprider_url = (self.base_url + "/{1}/{0}.html".format(self.second_column_name, self.first_column_name))

        down_path = "D:\\Freedom\\Sprider\\ChinaZ\\" + self.sprider_top_level + "\\" + self.folder_name + "\\" + second_folder_name + "\\Temp\\"
        if os.path.exists(down_path) is True:
            shutil.rmtree(down_path)
        if os.path.exists(down_path) is False:
            os.makedirs(down_path)

        if os.path.exists(self.save_path) is True:
            shutil.rmtree(self.save_path)
        if os.path.exists(self.save_path) is False:
            os.makedirs(self.save_path)
        chrome_options = webdriver.ChromeOptions()
        diy_prefs = {'profile.default_content_settings.popups': 0,
                     'download.default_directory': '{0}'.format(down_path)}
        # 添加路径到selenium配置中
        chrome_options.add_experimental_option('prefs', diy_prefs)
        chrome_options.add_argument('--headless')  # 隐藏浏览器
        # 实例化chrome浏览器时，关联忽略证书错误
        driver = webdriver.Chrome(options=chrome_options)
        driver.set_window_size(1280, 800)  # 分辨率 1280*800
        #
        BaseFrame().debug("开始采集" + sprider_url)
        driver.get(sprider_url)
        # content = driver.page_source

        element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick")  # 列表页面 核心内容 box col3 ws_block masonry-brick
        # element_list = div_elem.find_elements(By.CLASS_NAME, 'item')
        # print(element_list.get_attribute('innerHTML'))

        laster_pager_div = driver.find_element(By.CLASS_NAME, "fenye")
        laster_pager_a = laster_pager_div.find_elements(By.TAG_NAME, 'a')
        laster_pager_url = laster_pager_a[len(laster_pager_a) - 2]
        page_end_number = int(laster_pager_url.text)
        self.page_count = self.merchant
        while self.page_count <= int(page_end_number):  # 翻完停止
            try:
                if self.page_count == 1:
                    self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path)
                    pass
                else:
                    if self.haved_sprider_count == self.sprider_count:
                        BaseFrame().debug("采集到达数量采集停止...")
                        BaseFrame().debug("开始写文章...")
                        self.builder_word(self.folder_name, self.word_content_list)
                        BaseFrame().debug("文件编写完毕，请到对应的磁盘查看word文件和下载文件！")
                        break
                    # (self.base_url + "/sort/{0}/{1}/".format(url_index, self.page_count))
                    # http://soft.onlinedown.net/sort/177/2/
                    # https://sc.chinaz.com//jianli/xiaochengchu_2.html
                    next_url = self.base_url + "/{2}/{0}_{1}.html".format(self.second_column_name, self.page_count,
                                                                          self.first_column_name)

                    driver.get(next_url)

                    element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick")  # 列表页面 核心内容
                    self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path)
                    pass
                # print(self.page_count)
                self.page_count = self.page_count + 1  # 页码增加1
            except Exception as e:
                print("sprider()执行过程出现错误:" + str(e))
                sleep(1)

瑜伽锻炼课程HTML网站模板

澳门棋牌游戏网站模板

棋牌游戏主页网站模板

豪华水疗按摩网站模板

宽屏饮料咖啡厅网站模板

星级豪华酒店预定页面模板

音乐乐队展示网站模板

奶油蛋糕甜品店网站模板

婚恋交友平台网站模板

私人水疗会所网页模板

视频共享平台网站模板

网络视频分享平台网站模板

读书书单推荐网站模板

Rock摇滚音乐会网站模板

音乐乐队演出票务网站模板

瀑布流自适应流媒体网站模板

摇滚乐队演唱会专题网站模板

图片资源素材下载HTML5模板

游戏设计师作品展网站模板

自媒体博客整站html5模板

宽屏户外摄影HTML5模板

宽屏旅游温泉网站模板

欧美图片分享网站模板

单人旅行拍照网站模板

cosplay拍照摄影网站模板

艺人文艺演出网站模板

男士高端造型理发店网站模板

酒店度假别墅网站模板

女性美容养生HTML模板

音乐派对之夜网站模板

生活DIY手艺活网站模板

水疗美容店网站模板

紫色女性美容网站模板

天然的温泉HTML5网页模板

星巴克下午茶小店网站模板

宽屏APA休闲养生网站模板

音乐达人HTML5网站模板

音乐会演出专题HTML5模板

微电影拍摄官方网站模板

日出日落摄影网站模板

唯美休闲小清新网站模板

舞台音乐演唱会网站模板

移动WEB开放平台网站模板

宽屏扁平咖啡馆网站模板

周杰伦演唱会官网网页模板

星空月球探索网站模板

读书文摘杂志网站模板

紫色休闲时光网站模板

宽屏多色块布局网站模板

斯洛克台球网站模板

创意礼品店HTML5模板

北京赛车拉力赛网站模板

import os
import shutil

def void_folder(path):
    # 访问path路径下的文件或文件夹
    lst = os.listdir(path)
    # 打印每一层的文件或文件夹
    for name in lst:
        # 拼接名称，得到绝对路径，判断该文件是否符合是文件夹
        real_path = os.path.join(path, name)
        # 如果是文件夹，则打空格表示，并且递归访问下一层
        if os.path.isdir(real_path):
            # print(name)
            files = os.listdir(real_path)
            if len(files) == 0:
                print("void_folder()："+name)
                shutil.rmtree(real_path)
                endindex = len(real_path) - len(name)
                real_path = real_path[0:endindex]
                void_folder(real_path)
            else:
                void_folder(real_path)
        # 如果不是文件夹，直接打印，不再递归访问下一层
        else:
            #print(name)
            pass
def void_file(dirPath):
    dirs = os.listdir(dirPath)  # 查找该层文件夹下所有的文件及文件夹，返回列表
    for file in dirs:
        file_full_name = dirPath + '/' + file
        file_ext = os.path.splitext(file_full_name)[-1]
        if file_ext is None  or file_ext=="":
            continue

        if "rar" == str(file_ext.split(".")[1]):
            os.remove(file_full_name)
        if "zip" == str(file_ext.split(".")[1]):
            os.remove(file_full_name)
        if "gz" == str(file_ext.split(".")[1]):
            os.remove(file_full_name)
        if "tgz" == str(file_ext.split(".")[1]):
            os.remove(file_full_name)

# 查找指定文件夹下所有相同名称的文件
def search_file(dirPath, fileName):
    dirs = os.listdir(dirPath)  # 查找该层文件夹下所有的文件及文件夹，返回列表
    for currentFile in dirs:  # 遍历列表
        absPath = dirPath + '/' + currentFile

        if os.path.isdir(absPath):  # 如果是目录则递归，继续查找该目录下的文件
            search_file(absPath, fileName)
        elif currentFile == fileName:
            #print(absPath)  # 文件存在，则打印该文件的绝对路径
            os.remove(absPath)

时尚女性化妆品网站模板

灯光下舞台音乐网站模板

图片社区门户首页网页模板

全屏图片Gallery相册模板

专业户外摄影师网站模板

游乐场公司单页html5模板

登山运动休闲网站模板

花束婚礼响应式网站模板

响应式摄影模特CSS3模板

红色大气音乐网站模板

大气冲浪运动单页模板

欧美音乐爱好者网站模板