分享112个HTML旅游交通模板,总有一款适合您
112个HTML旅游交通模板下载链接:https://pan.baidu.com/s/15OctJIB4NtyFddyalXX70A?pwd=7tpa
提取码:7tpa
Python采集代码下载链接:采集代码.zip - 蓝奏云
响应式旅游度假HTML5模板
响应式旅游度假HTML5模板,适合旅游度假公司网站模板。
汽车经销商单页模板
汽车经销商单页模板是一款大气好看的汽车相关网站html单页模板下载。
大山深处的探索网站模板
大山深处的探索网站模板里面包含4个子页面,适合旅游冲浪网站模板。
大气旅游度假酒店网站模板
大气旅游度假酒店网站模板里面包含5个子页面,适合酒店网站模板下载。
自行车竞技比赛专题模板
摩托车俱乐部HTML5模板
户外活动专题网页模板
全国旅游景点查询网站模板
度假旅游企业官网模板
汽车改装维修车行网站模板
自助游自驾游旅游网站模板
旅游景区介绍html5模板
汽车修理厂网站模板
宽屏假日旅游网站模板
狩猎旅行旅游网站模板
户外旅游bootstrap模板
绿色旅游酒店整站模板下载
蓝色出海旅行整站模板下载
国际旅游公司网站模板
户外房车旅游网站模板
import os
import shutil
import time
from time import sleep
from docx import Document
from docx.opc.oxml import qn
from docx.shared import Inches, RGBColor
from framework.base.BaseFrame import BaseFrame
from sprider.business.DownLoad import DownLoad
from sprider.business.SeleniumTools import SeleniumTools
from sprider.business.SpriderTools import SpriderTools
from selenium import webdriver
from selenium.webdriver.common.by import By
from sprider.model.SpriderEntity import SpriderEntity
from sprider.access.SpriderAccess import SpriderAccess
title_name = "旅游交通"
class ChinaZJsSelenium:
base_url = "https://sc.chinaz.com/" # 采集的网址
save_path = "D:\\Freedom\\Sprider\\ChinaZ\\"
sprider_count =112 # 正在采集第14页的第23个资源,共27页资源 debug
sprider_start_count=199
word_content_list = []
folder_name = ""
page_end_number=0
max_pager=24#每页的数量
haved_sprider_count =0 # 已经采集的数量
page_count = 1 # 每个栏目开始业务content="text/html; charset=gb2312"
filter_down_file=[]
word_image_count=5 #word插入图片数量 同时也是明细采集图片和描述的数量
sprider_detail_index = 0# 明细方法采集的数量 累加
sprider_top_level="HTML"
汽车自驾游网站模板下载
徒步旅游线路景点网站模板
郊游旅行景点推荐网站模板
蓝色响应式旅游网页模板
手机移动端旅游网站模板
景区导游专题bootstrap模板
跟汽车相关的APP网站模板
房车自驾游网站模板
户外驴友探险html5模板
户外景点旅游公司网站模板
大气境外游景区景点网页模板
汽车打蜡抛光网站模板
宝马汽车维修站网站模板
露营户外旅游网页模板
旅游酒店住宿网站模板
蓝色天空旅游业网站模板
html5划船漂流旅游网站模板
豪车车友俱乐部网页模板
摩托车竞技HTML5网站模板
CSS3大气视频旅行网站模板
地方旅游景点HTML5模板
HTML5绿色清爽旅游模板
宽屏旅游指南网站模板
紫色旅游窄屏HTML模板
蓝色风格汽车网站模板
漂亮大气的摩托车企业模板
大山风格摄影网站模板
旅行旅游指南网站模板
蓝色清爽旅行网站模板
摩托车汽配销售网站模板
夕阳西下踏青网站模板
夏日休闲度假旅游网站模板
html跑车俱乐部网站模板
探险旅游指南HTML5模板
货运代理公司网站模板下载
自行车运动爱好者网站模板
蓝色海边旅游休闲网站模板
航海运输公司网站模板
公共汽车维修网站模板
html5旅游酒店网站模板
大屏清爽旅游网页模板
英国卡车CSS3网站模板
爱旅行的女人html5模板
摩托车爱好者网站模板
def sprider(self,title_name):
"""
采集
医疗保健 https://sc.chinaz.com/moban/YiLiaoBaoJian.html
电子产品 https://sc.chinaz.com/moban/DianZiChanPin.html
电子商务 https://sc.chinaz.com/moban/DianZiShangWu.html
婚纱模板 https://sc.chinaz.com/moban/HunShaMoBan.html
电脑主机 https://sc.chinaz.com/moban/DianNaoZhuJi.html
旅游交通 https://sc.chinaz.com/moban/LvYouJiaoTong.html
:return:
"""
if title_name == "医疗保健":
self.first_column_name = "moban"
self.folder_name = "HTML医疗保健模板"
self.second_column_name = "YiLiaoBaoJian"
elif title_name == "旅游交通":
self.first_column_name = "moban"
self.folder_name = "HTML旅游交通模板"
self.second_column_name = "LvYouJiaoTong"
elif title_name == "电脑主机":
self.first_column_name = "moban"
self.folder_name = "HTML电脑主机模板"
self.second_column_name = "DianNaoZhuJi"
elif title_name == "电子产品":
self.first_column_name = "moban"
self.folder_name = "HTML电子产品模板"
self.second_column_name = "DianZiChanPin"
elif title_name == "电子商务":
self.first_column_name = "moban"
self.folder_name = "HTML电子商务模板"
self.second_column_name = "DianZiShangWu"
BaseFrame().right("本次采集参数:日志路径:=" + str( BaseFrame().LOG_PATH) + "")
BaseFrame().right("本次采集参数:sprider_count=" + str(self.sprider_count) + "")
BaseFrame().right("本次采集参数:title_name="+title_name+"")
BaseFrame().right("本次采集参数:second_column_name=" + self.second_column_name + "")
# self.folder_name = "JS表单验证"
self.sprider_category = title_name # 一级目录self.folder_name
second_folder_name = str(self.sprider_count) + "个" + self.folder_name #二级目录
self.sprider_type =second_folder_name
self.merchant=int(self.sprider_start_count) //int(self.max_pager)+1 #起始页码用于效率采集
#原始路径+一级目录+二级目录
self.file_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name
self.save_path = self.save_path+ os.sep + self.sprider_top_level + os.sep+self.folder_name +os.sep + second_folder_name+ os.sep + self.folder_name
BaseFrame().debug("开始采集ChinaZJL"+self.folder_name+"...")
sprider_url = (self.base_url + "/{1}/{0}.html".format(self.second_column_name,self.first_column_name))
down_path="D:\\Freedom\\Sprider\\ChinaZ\\"+self.sprider_top_level +"\\"+self.folder_name +"\\"+second_folder_name+"\\Temp\\"
if os.path.exists(down_path) is True:
shutil.rmtree(down_path)
if os.path.exists(down_path) is False:
os.makedirs(down_path)
if os.path.exists(self.save_path ) is True:
shutil.rmtree(self.save_path )
if os.path.exists(self.save_path ) is False:
os.makedirs(self.save_path )
chrome_options = webdriver.ChromeOptions()
diy_prefs ={'profile.default_content_settings.popups': 0,
'download.default_directory':'{0}'.format(down_path)}
# 添加路径到selenium配置中
chrome_options.add_experimental_option('prefs', diy_prefs)
chrome_options.add_argument('--headless') #隐藏浏览器
# 实例化chrome浏览器时,关联忽略证书错误
driver = webdriver.Chrome(options=chrome_options)
driver.set_window_size(1280, 800) # 分辨率 1280*800
#
BaseFrame().debug("开始采集"+sprider_url)
driver.get(sprider_url)
# content = driver.page_source
element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick") # 列表页面 核心内容 box col3 ws_block masonry-brick
#element_list = div_elem.find_elements(By.CLASS_NAME, 'item')
#print(element_list.get_attribute('innerHTML'))
laster_pager_div = driver.find_element(By.CLASS_NAME, "fenye")
laster_pager_a = laster_pager_div.find_elements(By.TAG_NAME, 'a')
laster_pager_url = laster_pager_a[len(laster_pager_a) - 2]
page_end_number = int(laster_pager_url.text)
self.page_count=self.merchant
while self.page_count <= int(page_end_number): # 翻完停止
try:
if self.page_count == 1:
self.sprider_detail(driver,element_list,self.page_count,page_end_number,down_path)
pass
else:
if self.haved_sprider_count == self.sprider_count:
BaseFrame().debug("采集到达数量采集停止...")
BaseFrame().debug("开始写文章...")
self.builder_word(self.folder_name, self.word_content_list)
BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!")
break
#(self.base_url + "/sort/{0}/{1}/".format(url_index, self.page_count))
#http://soft.onlinedown.net/sort/177/2/
#https://sc.chinaz.com//jianli/xiaochengchu_2.html
next_url = self.base_url + "/{2}/{0}_{1}.html".format(self.second_column_name, self.page_count,self.first_column_name)
driver.get(next_url)
element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick") # 列表页面 核心内容
self.sprider_detail( driver, element_list, self.page_count, page_end_number, down_path)
pass
#print(self.page_count)
self.page_count = self.page_count + 1 # 页码增加1
except Exception as e:
print("sprider()执行过程出现错误:" + str(e))
sleep(1)
旅游公司宽屏网站模板
滨海城市旅游景区网站模板
自行车比赛网站模板
重型机车摩托车网站模板
徒步旅行网站模板源代码
html5户外拓展网站模板
旅游行业公司网站模板
国外旅游资讯网站模板
绿色旅游酒店预订模板
职业车手介绍网站模板
热气球旅游网网站模板
的士行业公司网站模板
跑车销售企业网站模板
旅行客车公司网站模板
海外旅游公司CSS网站模板
探索发现html5网站模板
视频弹出旅游网站模板
风景图片大全网站模板
棕色拿着相机拍照网站模板
旅游景区企业网站模板
雪山旅游景区CSS3网站模板
高端休闲会所网站模板
美国白宫旅游网站模板
特斯拉汽车公司网站模板
国外旅游攻略网站CSS模板
旅行社官网HTML网页模板
温泉度假公司网页模板
国外度假旅游html5模板
滑雪运动户外网站模板
酒店预订网站模板下载
旅游休闲度假网站模板
import os
import shutil
def void_folder(path):
# 访问path路径下的文件或文件夹
lst = os.listdir(path)
# 打印每一层的文件或文件夹
for name in lst:
# 拼接名称,得到绝对路径,判断该文件是否符合是文件夹
real_path = os.path.join(path, name)
# 如果是文件夹,则打空格表示,并且递归访问下一层
if os.path.isdir(real_path):
# print(name)
files = os.listdir(real_path)
if len(files) == 0:
print("void_folder():"+name)
shutil.rmtree(real_path)
endindex = len(real_path) - len(name)
real_path = real_path[0:endindex]
void_folder(real_path)
else:
void_folder(real_path)
# 如果不是文件夹,直接打印,不再递归访问下一层
else:
#print(name)
pass
def void_file(dirPath):
dirs = os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹,返回列表
for file in dirs:
file_full_name = dirPath + '/' + file
file_ext = os.path.splitext(file_full_name)[-1]
if file_ext is None or file_ext=="":
continue
if "rar" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
if "zip" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
if "gz" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
if "tgz" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
# 查找指定文件夹下所有相同名称的文件
def search_file(dirPath, fileName):
dirs = os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹,返回列表
for currentFile in dirs: # 遍历列表
absPath = dirPath + '/' + currentFile
if os.path.isdir(absPath): # 如果是目录则递归,继续查找该目录下的文件
search_file(absPath, fileName)
elif currentFile == fileName:
#print(absPath) # 文件存在,则打印该文件的绝对路径
os.remove(absPath)
橙色登山户外运动网站模板
印度旅游HTML网站模板
户外单车宽屏CSS3网站模板
红色大气冲浪网站模板
海边度假旅游网站模板
渔民码头旅游公司网站模板
海洋世界旅游网站模板
蓝色儿童户外网站模板
自然旅游景点介绍网站模板
登山户外运动网页模板
埃及金字塔旅游公司模板
休闲度假酒店网站模板
旅行社旅游公司网站模板
世界名车汽车网站模板
大气旅行网站单页模板
夕阳下的万里长城网页模板
汽车租赁销售企业模板
最后送大家一首诗:
山高路远坑深,
大军纵横驰奔,
谁敢横刀立马?
惟有点赞加关注大军。