分享112个HTML动植食物模板,总有一款适合您
112个HTML动植食物模板下载链接:https://pan.baidu.com/s/1GX2kbIzQjM2urM-juGFOrA?pwd=2ky0 提取码:2ky0
Python采集代码下载链接:采集代码.zip - 蓝奏云
美丽的鲜花植物网站模板
美丽的鲜花植物网站模板是一款鲜花花店展示网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
我的宠物个人主页HTML模板
我的宠物个人主页HTML模板是一款适合宠物护理宠物医院网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
私人餐厅官网网站模板
私人餐厅官网网站模板是一款适合餐饮美食公司网站模板。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
健身健康轻食网站模板
健身健康轻食网站模板是一款适合西餐美食轻食网站模板。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
import os
import shutil
import time
from time import sleep
from docx import Document
from docx.shared import Inches
from framework.base.BaseFrame import BaseFrame
from sprider.business.DownLoad import DownLoad
from sprider.business.SeleniumTools import SeleniumTools
from sprider.business.SpriderTools import SpriderTools
from selenium import webdriver
from selenium.webdriver.common.by import By
from sprider.model.SpriderEntity import SpriderEntity
from sprider.access.SpriderAccess import SpriderAccess
title_name = "动植食物"
class ChinaZJsSelenium:
base_url = "https://sc.chinaz.com/" # 采集的网址
save_path = "D:\\Freedom\\Sprider\\ChinaZ\\"
sprider_count = 112 # 正在采集第20页的第20个资源,共22页资源
sprider_start_count = 112
word_content_list = []
folder_name = ""
page_end_number = 0
max_pager = 24 # 每页的数量
haved_sprider_count = 0 # 已经采集的数量
page_count = 1 # 每个栏目开始业务content="text/html; charset=gb2312"
filter_down_file = []
word_image_count = 5 # word插入图片数量 同时也是明细采集图片和描述的数量
sprider_detail_index = 0 # 明细方法采集的数量 累加
sprider_top_level = "HTML"
个人美食博客网站模板
餐厅推荐菜单单页HTML模板
宠物护理店铺官网网站模板
西餐汉堡外卖网站模板
美食餐厅菜单展示网站模板
美食汉堡西餐厅网站模板
宠物狗专卖店网站模板
面包甜点加盟店网站模板
绿色新鲜蔬菜种植网站模板
健康美食专家网站模板
美味佳肴HTML5网站模板
农业种植技术推广网站模板
新鲜的水果商店HTML5模板
蔬菜种植农场网页模板
健康食品食谱单页模板
蔬菜稻米种植业网站模板
跟狗狗宠物相关的网站模板
绿色美食餐厅HTML5模板
鲜花花卉市场展示网站模板
水果加盟连锁店HTML5模板
牛排汉堡官网网站模板
西餐厅美食图片展示模板
美食餐饮图片展示网站模板
def sprider(self, title_name):
"""
采集
医疗保健 https://sc.chinaz.com/moban/YiLiaoBaoJian.html
电子产品 https://sc.chinaz.com/moban/DianZiChanPin.html
电子商务 https://sc.chinaz.com/moban/DianZiShangWu.html
婚纱模板 https://sc.chinaz.com/moban/HunShaMoBan.html
电脑主机 https://sc.chinaz.com/moban/DianNaoZhuJi.html
旅游交通 https://sc.chinaz.com/moban/LvYouJiaoTong.html
体育竞技 https://sc.chinaz.com/moban/TiYuJingJi.html
娱乐休闲 https://sc.chinaz.com/moban/YuLeXiuXian.html
艺术时尚 https://sc.chinaz.com/moban/YiShuShiShang.html
建筑风光 https://sc.chinaz.com/moban/JianZhuFengGuang.html
动植食物 https://sc.chinaz.com/moban/DongZhiShiWu.html
:return:
"""
if title_name == "医疗保健":
self.first_column_name = "moban"
self.folder_name = "HTML医疗保健模板"
self.second_column_name = "YiLiaoBaoJian"
elif title_name == "动植食物":
self.first_column_name = "moban"
self.folder_name = "HTML动植食物模板"
self.second_column_name = "DongZhiShiWu"
elif title_name == "建筑风光":
self.first_column_name = "moban"
self.folder_name = "HTML建筑风光模板"
self.second_column_name = "JianZhuFengGuang"
elif title_name == "艺术时尚":
self.first_column_name = "moban"
self.folder_name = "HTML艺术时尚模板"
self.second_column_name = "YiShuShiShang"
elif title_name == "娱乐休闲":
self.first_column_name = "moban"
self.folder_name = "HTML娱乐休闲模板"
self.second_column_name = "YuLeXiuXian"
elif title_name == "体育竞技":
self.first_column_name = "moban"
self.folder_name = "HTML体育竞技模板"
self.second_column_name = "TiYuJingJi"
elif title_name == "旅游交通":
self.first_column_name = "moban"
self.folder_name = "HTML旅游交通模板"
self.second_column_name = "LvYouJiaoTong"
elif title_name == "电脑主机":
self.first_column_name = "moban"
self.folder_name = "HTML电脑主机模板"
self.second_column_name = "DianNaoZhuJi"
elif title_name == "电子产品":
self.first_column_name = "moban"
self.folder_name = "HTML电子产品模板"
self.second_column_name = "DianZiChanPin"
elif title_name == "电子商务":
self.first_column_name = "moban"
self.folder_name = "HTML电子商务模板"
self.second_column_name = "DianZiShangWu"
BaseFrame().right("本次采集参数:日志路径:" + str(BaseFrame().LOG_PATH) + "")
BaseFrame().right("本次采集参数:sprider_count=" + str(self.sprider_count) + "")
BaseFrame().right("本次采集参数:title_name=" + title_name + "")
BaseFrame().right("本次采集参数:second_column_name=" + self.second_column_name + "")
# self.folder_name = "JS表单验证"
self.sprider_category = title_name # 一级目录self.folder_name
second_folder_name = str(self.sprider_count) + "个" + self.folder_name # 二级目录
self.sprider_type = second_folder_name
self.merchant = int(self.sprider_start_count) // int(self.max_pager) + 1 # 起始页码用于效率采集
# 原始路径+一级目录+二级目录
self.file_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name
self.save_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name + os.sep + self.folder_name
BaseFrame().debug("开始采集ChinaZJL" + self.folder_name + "...")
sprider_url = (self.base_url + "/{1}/{0}.html".format(self.second_column_name, self.first_column_name))
down_path = "D:\\Freedom\\Sprider\\ChinaZ\\" + self.sprider_top_level + "\\" + self.folder_name + "\\" + second_folder_name + "\\Temp\\"
if os.path.exists(down_path) is True:
shutil.rmtree(down_path)
if os.path.exists(down_path) is False:
os.makedirs(down_path)
if os.path.exists(self.save_path) is True:
shutil.rmtree(self.save_path)
if os.path.exists(self.save_path) is False:
os.makedirs(self.save_path)
chrome_options = webdriver.ChromeOptions()
diy_prefs = {'profile.default_content_settings.popups': 0,
'download.default_directory': '{0}'.format(down_path)}
# 添加路径到selenium配置中
chrome_options.add_experimental_option('prefs', diy_prefs)
chrome_options.add_argument('--headless') # 隐藏浏览器
# 实例化chrome浏览器时,关联忽略证书错误
driver = webdriver.Chrome(options=chrome_options)
driver.set_window_size(1280, 800) # 分辨率 1280*800
#
BaseFrame().debug("开始采集" + sprider_url)
driver.get(sprider_url)
# content = driver.page_source
element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick") # 列表页面 核心内容 box col3 ws_block masonry-brick
# element_list = div_elem.find_elements(By.CLASS_NAME, 'item')
# print(element_list.get_attribute('innerHTML'))
laster_pager_div = driver.find_element(By.CLASS_NAME, "fenye")
laster_pager_a = laster_pager_div.find_elements(By.TAG_NAME, 'a')
laster_pager_url = laster_pager_a[len(laster_pager_a) - 2]
page_end_number = int(laster_pager_url.text)
self.page_count = self.merchant
while self.page_count <= int(page_end_number): # 翻完停止
try:
if self.page_count == 1:
self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path)
pass
else:
if self.haved_sprider_count == self.sprider_count:
BaseFrame().debug("采集到达数量采集停止...")
BaseFrame().debug("开始写文章...")
self.builder_word(self.folder_name, self.word_content_list)
BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!")
break
# (self.base_url + "/sort/{0}/{1}/".format(url_index, self.page_count))
# http://soft.onlinedown.net/sort/177/2/
# https://sc.chinaz.com//jianli/xiaochengchu_2.html
next_url = self.base_url + "/{2}/{0}_{1}.html".format(self.second_column_name, self.page_count,
self.first_column_name)
driver.get(next_url)
element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick") # 列表页面 核心内容
self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path)
pass
# print(self.page_count)
self.page_count = self.page_count + 1 # 页码增加1
except Exception as e:
print("sprider()执行过程出现错误:" + str(e))
sleep(1)
狗粮销售宠物网站模板
美食在线下单网站模板
美味的巧克力页面模板
红色温馨宠物之家网站模板
健身轻食馆加盟网站模板
水果乐园菜园网站模板
农田种植技术HTML5模板
美食加盟店网站模板
外卖送餐APP官网模板
甜橙种植农场网站模板
健康轻食美食网站模板
水果奶茶店铺网站模板
多肉盆栽植物商城模板
绿色外卖餐饮网站模板
西餐厅餐饮行业网站模板
餐饮美食外卖预订模板
乡村科技农场网站模板
天然鲜榨果汁网站模板
多用途餐饮店铺主页模板
绿色有机食品农业网站模板
有机食品农业种植网站模板
餐饮店铺外卖网站模板
美食自媒体博客主页模板
有机食品商店网站模板
有机食品农业产品网站模板
园林绿化种植网页模板
感恩节晚餐网站模板
国外餐厅美食网站模板
意面西餐厅响应式模板
美食西餐厅食谱响应式模板
宠物之家响应式网站模板
高端餐饮响应式网站模板
美食菜单定价网站模板
绿色花艺企业网站模板
美食引导页bootstrap模板
米其林美食餐厅网站模板
美食外卖订餐APP下载页模板
西点面包烘培店网站模板
绿色有机蔬菜种植网站模板
有机水果种植基地网站模板
黑色大气动物摄影网站模板
披萨西餐厅企业网站模板
蛋糕甜品制作响应式模板
花草植物种植HTML5模板
健康有机蔬菜果汁店网站模板
汉堡包西餐美食网站模板
咖啡厅餐饮行业网站模板
西式甜点面包店餐饮网站模板
巧克力点心下午茶网站模板
宠物狗乐园响应式网站模板
鸟类摄影作品展示网站模板
扁平化高端西餐厅HTML5模板
人工鳄鱼养殖HTML5模板
外卖订餐平台网站模板
宽屏美食DIY制作网站模板
保护野生动物网站模板
美食糕点制作网站模板
蔬菜预定配送O2O网站模板
宠物狗训练学校网站模板
绿色水果蔬菜外卖网站模板
import os
import shutil
def void_folder(path):
# 访问path路径下的文件或文件夹
lst = os.listdir(path)
# 打印每一层的文件或文件夹
for name in lst:
# 拼接名称,得到绝对路径,判断该文件是否符合是文件夹
real_path = os.path.join(path, name)
# 如果是文件夹,则打空格表示,并且递归访问下一层
if os.path.isdir(real_path):
# print(name)
files = os.listdir(real_path)
if len(files) == 0:
print("void_folder():"+name)
shutil.rmtree(real_path)
endindex = len(real_path) - len(name)
real_path = real_path[0:endindex]
void_folder(real_path)
else:
void_folder(real_path)
# 如果不是文件夹,直接打印,不再递归访问下一层
else:
#print(name)
pass
def void_file(dirPath):
dirs = os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹,返回列表
for file in dirs:
file_full_name = dirPath + '/' + file
file_ext = os.path.splitext(file_full_name)[-1]
if file_ext is None or file_ext=="":
continue
if "rar" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
if "zip" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
if "gz" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
if "tgz" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
# 查找指定文件夹下所有相同名称的文件
def search_file(dirPath, fileName):
dirs = os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹,返回列表
for currentFile in dirs: # 遍历列表
absPath = dirPath + '/' + currentFile
if os.path.isdir(absPath): # 如果是目录则递归,继续查找该目录下的文件
search_file(absPath, fileName)
elif currentFile == fileName:
#print(absPath) # 文件存在,则打印该文件的绝对路径
os.remove(absPath)
餐厅美食作品展示网站模板
餐饮行业Bootstrap模板
有机水果种植农业网站模板
餐厅或咖啡馆网站模板
红色大气美食博客网站模板
粉色简洁蛋糕制作网站模板
斗鸟养鸟遛鸟交流网站模板
专业的花草种植网页模板
汉堡炸鸡美食网站模板
意大利面美食网站模板
美食家浪漫西餐厅整站模板
多肉植物种植网站模板
关于养狗的网站模板
植物花卉种植基地网站模板
专业鸟类百科网站模板
酒店美食频道网站模板
酒店浪漫美食网站模板
HTML5宽屏汉堡美食网页模板
绿色下午茶西餐厅网站模板
大气糕点制作美食网站模板
有机水果加盟网HTML5模板
法式浪漫牛排西餐厅网站模板
米其林西餐厅网站模板
意大利咖啡馆宽屏网站模板
绿色农业门户网站模板
最后送大家一首诗:
山高路远坑深,
大军纵横驰奔,
谁敢横刀立马?
惟有点赞加关注大军。