分享111个HTML动植食物模板,总有一款适合您

分享111个HTML动植食物模板,总有一款适合您

 

111个HTML动植食物模板下载链接:https://pan.baidu.com/s/1gsISZuVZQrjRpruHTRug1A?pwd=qjnl 
提取码:qjnl

Python采集代码下载链接:采集代码.zip - 蓝奏云

HTML5鸟类在线资讯网站模板

HTML5鸟类在线资讯网站模板是一款精美的鸟类资讯在线观看阅读HTML5网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
 

HTML5有机农场农业网站模板

HTML5有机农场农业网站模板是一款适合从事有机农场农业服务行业HTML5网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
 

健康有机蔬菜食物HTML5网站模板

健康有机蔬菜食物HTML5网站模板是一款适合各种有机食物蔬菜在线销售购买的电子商务网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
 

新鲜有机水果商城HTML5网站模板

新鲜有机水果商城HTML5网站模板是一款适合有机水果在线购买服务商城网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
 

响应式有机水果店宣传HTML5网站模板

意大利美食餐馆宣传网站模板

HTML5保健品营养品引导页模板

有机果蔬食品商城响应式网站模板

宠物食品宠物店Bootstrap4模板

鲜花花艺花店HTML5网站模板

有机蔬菜水果食品店HTML5模板

HTML有机食品在线商城网站模板

HTML5茶类饮品店宣传网站模板

养鸡场家禽饲养宣传网站模板

披萨汉堡三明治美食网站模板

健康轻食简餐餐饮美食网站模板

原生态果蔬家禽农场网站模板

保护野生动物新闻资讯网站模板

小酒馆餐饮美食网站模板

import os
import shutil
import time
from time import sleep
from docx import Document
from docx.shared import Inches
from framework.base.BaseFrame import BaseFrame
from sprider.business.DownLoad import DownLoad
from sprider.business.SeleniumTools import SeleniumTools
from sprider.business.SpriderTools import SpriderTools
from selenium import webdriver
from selenium.webdriver.common.by import By
from sprider.model.SpriderEntity import SpriderEntity
from sprider.access.SpriderAccess import SpriderAccess

title_name = "动植食物"


class ChinaZJsSelenium:
    base_url = "https://sc.chinaz.com/"  # 采集的网址
    save_path = "D:\\Freedom\\Sprider\\ChinaZ\\"
    sprider_count = 111 # 正在采集第20页的第20个资源,共22页资源
    sprider_start_count = 0

    word_content_list = []
    folder_name = ""
    page_end_number = 0
    max_pager = 24  # 每页的数量
    haved_sprider_count = 0  # 已经采集的数量
    page_count = 1  # 每个栏目开始业务content="text/html; charset=gb2312"
    filter_down_file = []
    word_image_count = 5  # word插入图片数量 同时也是明细采集图片和描述的数量
    sprider_detail_index = 0  # 明细方法采集的数量 累加
    sprider_top_level = "HTML"

美味西式餐饮美食网站模板

HTML5西式快餐美食网站模板

汉堡三明治餐饮美食网站模板

绿色园艺服务管理网站模板

响应式西式餐厅餐饮美食网站模板

绿茶茶叶抹茶粉HTML5网站模板

保护动物新闻资讯响应式网站模板

响应式美食博客分享网站模板

纯有机农业产品HTML5网站模板

关爱狗狗宠物店宣传网站模板

汉堡快餐店美食宣传网站模板

美味餐厅餐饮美食网站模板

有机牛奶乳制品宣传网站模板

创意咖啡馆饮品店宣传网站模板

农场牧场养殖HTML5网站模板

拯救鸟类拯救动物HTML5网站模板

宠物护理服务机构网站模板

健康营养美食宣传网站模板

花园园艺花艺机构网站模板

绿色有机果蔬农场Bootstrap模板

健康餐饮美食连锁机构网站模板

餐饮美食餐厅服务网站模板

咖啡连锁机构宣传网站模板

美食博客资讯网站模板

在线订餐服务系统网站模板

响应式餐饮美食店宣传网站模板

美味轻食西餐厅网站模板

冰激凌蛋糕美食宣传网站模板

动物园野生动物保护网站模板



    def sprider(self, title_name):
        """
       采集
       医疗保健 https://sc.chinaz.com/moban/YiLiaoBaoJian.html
       电子产品 https://sc.chinaz.com/moban/DianZiChanPin.html
       电子商务 https://sc.chinaz.com/moban/DianZiShangWu.html
       婚纱模板 https://sc.chinaz.com/moban/HunShaMoBan.html
       电脑主机 https://sc.chinaz.com/moban/DianNaoZhuJi.html
       旅游交通 https://sc.chinaz.com/moban/LvYouJiaoTong.html
       体育竞技 https://sc.chinaz.com/moban/TiYuJingJi.html
       娱乐休闲 https://sc.chinaz.com/moban/YuLeXiuXian.html
       艺术时尚 https://sc.chinaz.com/moban/YiShuShiShang.html
       建筑风光 https://sc.chinaz.com/moban/JianZhuFengGuang.html
       动植食物 https://sc.chinaz.com/moban/DongZhiShiWu.html
       :return:
       """
        if title_name == "医疗保健":
            self.first_column_name = "moban"
            self.folder_name = "HTML医疗保健模板"
            self.second_column_name = "YiLiaoBaoJian"
        elif title_name == "动植食物":
            self.first_column_name = "moban"
            self.folder_name = "HTML动植食物模板"
            self.second_column_name = "DongZhiShiWu"

        elif title_name == "建筑风光":
            self.first_column_name = "moban"
            self.folder_name = "HTML建筑风光模板"
            self.second_column_name = "JianZhuFengGuang"
        elif title_name == "艺术时尚":
            self.first_column_name = "moban"
            self.folder_name = "HTML艺术时尚模板"
            self.second_column_name = "YiShuShiShang"
        elif title_name == "娱乐休闲":
            self.first_column_name = "moban"
            self.folder_name = "HTML娱乐休闲模板"
            self.second_column_name = "YuLeXiuXian"
        elif title_name == "体育竞技":
            self.first_column_name = "moban"
            self.folder_name = "HTML体育竞技模板"
            self.second_column_name = "TiYuJingJi"
        elif title_name == "旅游交通":
            self.first_column_name = "moban"
            self.folder_name = "HTML旅游交通模板"
            self.second_column_name = "LvYouJiaoTong"
        elif title_name == "电脑主机":
            self.first_column_name = "moban"
            self.folder_name = "HTML电脑主机模板"
            self.second_column_name = "DianNaoZhuJi"

        elif title_name == "电子产品":
            self.first_column_name = "moban"
            self.folder_name = "HTML电子产品模板"
            self.second_column_name = "DianZiChanPin"

        elif title_name == "电子商务":
            self.first_column_name = "moban"
            self.folder_name = "HTML电子商务模板"
            self.second_column_name = "DianZiShangWu"

        BaseFrame().right("本次采集参数:日志路径:" + str(BaseFrame().LOG_PATH) + "")
        BaseFrame().right("本次采集参数:sprider_count=" + str(self.sprider_count) + "")
        BaseFrame().right("本次采集参数:title_name=" + title_name + "")
        BaseFrame().right("本次采集参数:second_column_name=" + self.second_column_name + "")
        # self.folder_name = "JS表单验证"
        self.sprider_category = title_name  # 一级目录self.folder_name
        second_folder_name = str(self.sprider_count) + "个" + self.folder_name  # 二级目录
        self.sprider_type = second_folder_name
        self.merchant = int(self.sprider_start_count) // int(self.max_pager) + 1  # 起始页码用于效率采集
        # 原始路径+一级目录+二级目录
        self.file_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name

        self.save_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name + os.sep + self.folder_name
        BaseFrame().debug("开始采集ChinaZJL" + self.folder_name + "...")
        sprider_url = (self.base_url + "/{1}/{0}.html".format(self.second_column_name, self.first_column_name))

        down_path = "D:\\Freedom\\Sprider\\ChinaZ\\" + self.sprider_top_level + "\\" + self.folder_name + "\\" + second_folder_name + "\\Temp\\"
        if os.path.exists(down_path) is True:
            shutil.rmtree(down_path)
        if os.path.exists(down_path) is False:
            os.makedirs(down_path)

        if os.path.exists(self.save_path) is True:
            shutil.rmtree(self.save_path)
        if os.path.exists(self.save_path) is False:
            os.makedirs(self.save_path)
        chrome_options = webdriver.ChromeOptions()
        diy_prefs = {'profile.default_content_settings.popups': 0,
                     'download.default_directory': '{0}'.format(down_path)}
        # 添加路径到selenium配置中
        chrome_options.add_experimental_option('prefs', diy_prefs)
        chrome_options.add_argument('--headless')  # 隐藏浏览器
        # 实例化chrome浏览器时,关联忽略证书错误
        driver = webdriver.Chrome(options=chrome_options)
        driver.set_window_size(1280, 800)  # 分辨率 1280*800
        #
        BaseFrame().debug("开始采集" + sprider_url)
        driver.get(sprider_url)
        # content = driver.page_source

        element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick")  # 列表页面 核心内容 box col3 ws_block masonry-brick
        # element_list = div_elem.find_elements(By.CLASS_NAME, 'item')
        # print(element_list.get_attribute('innerHTML'))

        laster_pager_div = driver.find_element(By.CLASS_NAME, "fenye")
        laster_pager_a = laster_pager_div.find_elements(By.TAG_NAME, 'a')
        laster_pager_url = laster_pager_a[len(laster_pager_a) - 2]
        page_end_number = int(laster_pager_url.text)
        self.page_count = self.merchant
        while self.page_count <= int(page_end_number):  # 翻完停止
            try:
                if self.page_count == 1:
                    self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path)
                    pass
                else:
                    if self.haved_sprider_count == self.sprider_count:
                        BaseFrame().debug("采集到达数量采集停止...")
                        BaseFrame().debug("开始写文章...")
                        self.builder_word(self.folder_name, self.word_content_list)
                        BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!")
                        break
                    # (self.base_url + "/sort/{0}/{1}/".format(url_index, self.page_count))
                    # http://soft.onlinedown.net/sort/177/2/
                    # https://sc.chinaz.com//jianli/xiaochengchu_2.html
                    next_url = self.base_url + "/{2}/{0}_{1}.html".format(self.second_column_name, self.page_count,
                                                                          self.first_column_name)

                    driver.get(next_url)

                    element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick")  # 列表页面 核心内容
                    self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path)
                    pass
                # print(self.page_count)
                self.page_count = self.page_count + 1  # 页码增加1
            except Exception as e:
                print("sprider()执行过程出现错误:" + str(e))
                sleep(1)


汉堡王食品网站模板

果蔬零食在线购物网站模板

鲜榨果汁店引导页模板

新鲜水果蔬菜店网站模板

保护森林动物响应式网站模板

宠物护理中心网站模板

Bootstrap私房美食餐厅网站模板

有机果蔬在线购物网站模板

冰淇淋店HTML5网站模板

咖啡店品牌宣传HTML5模板

粗粮面包美食网站模板

原生态自然农场网站模板

狗狗宠物店响应式网站模板

海洋馆HTML5网站模板

西式汉堡披萨餐厅网站模板

极简水果店HTML5网站模板

狗狗宠物商城网站模板

绿色有机农场HTML5模板

蛋糕在线预定网站模板

Bootstrap烧烤餐厅网站模板

轻食餐美食外卖HTML5网站模板

响应式快餐厅HTML5网站模板

美味西式餐饮美食网站模板

家禽农场有机食品网站模板

环境生态保护公益网站模板

披萨咖啡快餐餐厅网站模板

奶牛场生态健康产品HTML5模板

精美的美食汉堡外卖网站模板

美食餐厅食物网站模板

响应式餐厅餐饮网站HTML模板

西餐烹饪美食餐厅网站模板

响应式餐厅网站前端模板下载

美食APP在线预定官网网站模板

谷物农场有机食品网站模板

import os
import shutil

def void_folder(path):
    # 访问path路径下的文件或文件夹
    lst = os.listdir(path)
    # 打印每一层的文件或文件夹
    for name in lst:
        # 拼接名称,得到绝对路径,判断该文件是否符合是文件夹
        real_path = os.path.join(path, name)
        # 如果是文件夹,则打空格表示,并且递归访问下一层
        if os.path.isdir(real_path):
            # print(name)
            files = os.listdir(real_path)
            if len(files) == 0:
                print("void_folder():"+name)
                shutil.rmtree(real_path)
                endindex = len(real_path) - len(name)
                real_path = real_path[0:endindex]
                void_folder(real_path)
            else:
                void_folder(real_path)
        # 如果不是文件夹,直接打印,不再递归访问下一层
        else:
            #print(name)
            pass
def void_file(dirPath):
    dirs = os.listdir(dirPath)  # 查找该层文件夹下所有的文件及文件夹,返回列表
    for file in dirs:
        file_full_name = dirPath + '/' + file
        file_ext = os.path.splitext(file_full_name)[-1]
        if file_ext is None  or file_ext=="":
            continue

        if "rar" == str(file_ext.split(".")[1]):
            os.remove(file_full_name)
        if "zip" == str(file_ext.split(".")[1]):
            os.remove(file_full_name)
        if "gz" == str(file_ext.split(".")[1]):
            os.remove(file_full_name)
        if "tgz" == str(file_ext.split(".")[1]):
            os.remove(file_full_name)

# 查找指定文件夹下所有相同名称的文件
def search_file(dirPath, fileName):
    dirs = os.listdir(dirPath)  # 查找该层文件夹下所有的文件及文件夹,返回列表
    for currentFile in dirs:  # 遍历列表
        absPath = dirPath + '/' + currentFile

        if os.path.isdir(absPath):  # 如果是目录则递归,继续查找该目录下的文件
            search_file(absPath, fileName)
        elif currentFile == fileName:
            #print(absPath)  # 文件存在,则打印该文件的绝对路径
            os.remove(absPath)

健康养生美食网站HTML5模板

儿童餐饮美食料理网站模板

Bootstrap餐厅主题网站模板

餐饮美食食谱博客网站模板

高热量快餐食品网站HTML5模板

蔬菜水果商店网站响应式模板

薯条汉堡西餐美食网站模板

西式快餐汉堡美食网站模板

有机生态农业官网HTML5模板

宠物领养公益平台网站HTML模板

披萨店铺外卖配送网站模板

养马场畜牧业网站HTML5模板

宠物护理培训学校网站模板

有机食品生态农场网站模板

食品农业种植基地网站模板

农业农场畜牧业HTML5模板

在线预订美食餐厅网站模板

大型餐厅菜品介绍网站模板

自助餐美食餐饮网站模板

披萨快餐厅外卖网站模板

快餐美食预订官网网站模板

菜谱大全美食制作网站模板

健康减肥饮食方案网站模板

纯天然有机农产品网站模板

薯条汉堡外卖快餐网站模板

家禽养殖公司响应式模板

棕色风格美洲虎网站模板

宠物医院连锁品牌网站模板

美味佳肴美食网站模板

最后送大家一首诗:

山高路远坑深,
大军纵横驰奔,
谁敢横刀立马?
惟有点赞加关注大军。
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

亚丁号

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值