分享137个HTML公司企业模板,总有一款适合您
137个HTML公司企业模板下载链接:https://pan.baidu.com/s/1KFSV1sKVTnIvS-0K0yC2RA?pwd=ircs
提取码:ircs
Python采集代码下载链接:采集代码.zip - 蓝奏云
共享单车公司网站模板下载
共享单车公司网站模板下载是一款自行车爱好者网站模板素材。
扁平宽屏公司网站单页模板
扁平宽屏公司网站单页模板是一款响应式HTML5单页网站模板下载。
物流通用多色调CSS3模板
物流通用多色调CSS3模板是一款响应式HTML5+CSS3物流公司网站模板。
响应式驾校官网HTML模板
响应式驾校官网HTML模板是一款兼容手机端的驾校网站模板下载。
import os
import shutil
import time
from time import sleep
from docx import Document
from docx.shared import Inches
from framework.base.BaseFrame import BaseFrame
from sprider.business.DownLoad import DownLoad
from sprider.business.SeleniumTools import SeleniumTools
from sprider.business.SpriderTools import SpriderTools
from selenium import webdriver
from selenium.webdriver.common.by import By
from sprider.model.SpriderEntity import SpriderEntity
from sprider.access.SpriderAccess import SpriderAccess
title_name = "社会教育"
class ChinaZJsSelenium:
base_url = "https://sc.chinaz.com/" # 采集的网址
save_path = "D:\\Freedom\\Sprider\\ChinaZ\\"
sprider_count = 88 # 116+66+20
sprider_start_count = 0
word_content_list = []
folder_name = ""
page_end_number = 0
max_pager = 24 # 每页的数量
haved_sprider_count = 0 # 已经采集的数量
page_count = 1 # 每个栏目开始业务content="text/html; charset=gb2312"
filter_down_file = []
word_image_count = 5 # word插入图片数量 同时也是明细采集图片和描述的数量
sprider_detail_index = 0 # 明细方法采集的数量 累加
sprider_top_level = "HTML"
宽屏纤细HTML5单页模板
商业保险公司HTML5模板
外贸公司业务网站模板
大气响应式HTML5企业模板
机械工业制造公司网站模板
羊毛线生产制造公司模板
蓝色扁平商务公司模板
响应式手机新闻HTML5模板
企业项目上线倒计时模板
汽车清洗美容公司网站模板
宽屏扁平化家装公司模板
房地产公司简介模板下载
电影票网上订购网站模板
小额贷款公司网站模板
深蓝色高端房产HTML5模板
商务团队公司网站模板
大卡车运输公司网站模板
响应式家具公司HTML5模板
响应式企业前端HTML5模板
在线银行储蓄业务网页模板
农业科技公司网站模板
宽屏大气公司网站模板
精美大气设计公司网站模板
手机应用程序官网网站模板
面包甜点加盟网站模板
分类信息网站html5模板
宽屏摄影作品案例网页模板
集装箱运输公司网站模板
图片素材售卖网站HTML5模板
兼容手机端HTML5企业模板
响应式广告公司HTML5模板
大气单页按摩html5模板
蓝色宽屏木材公司html5模板
蓝色创意广告公司html5模板
白色宽屏设计网站模板
室内创意设计企业模板
旅游酒店官网网站模板
def sprider(self, title_name):
"""
采集
医疗保健 https://sc.chinaz.com/moban/YiLiaoBaoJian.html
电子产品 https://sc.chinaz.com/moban/DianZiChanPin.html
电子商务 https://sc.chinaz.com/moban/DianZiShangWu.html
婚纱模板 https://sc.chinaz.com/moban/HunShaMoBan.html
电脑主机 https://sc.chinaz.com/moban/DianNaoZhuJi.html
旅游交通 https://sc.chinaz.com/moban/LvYouJiaoTong.html
体育竞技 https://sc.chinaz.com/moban/TiYuJingJi.html
娱乐休闲 https://sc.chinaz.com/moban/YuLeXiuXian.html
艺术时尚 https://sc.chinaz.com/moban/YiShuShiShang.html
建筑风光 https://sc.chinaz.com/moban/JianZhuFengGuang.html
动植食物 https://sc.chinaz.com/moban/DongZhiShiWu.html
人物家庭 https://sc.chinaz.com/moban/RenWuJiaTing.html
社会教育 https://sc.chinaz.com/moban/SheHuiJiaoYu.html
:return:
"""
if title_name == "医疗保健":
self.first_column_name = "moban"
self.folder_name = "HTML医疗保健模板"
self.second_column_name = "YiLiaoBaoJian"
elif title_name == "社会教育":
self.first_column_name = "moban"
self.folder_name = "HTML社会教育模板"
self.second_column_name = "SheHuiJiaoYu"
elif title_name == "动植食物":
self.first_column_name = "moban"
self.folder_name = "HTML动植食物模板"
self.second_column_name = "DongZhiShiWu"
elif title_name == "人物家庭":
self.first_column_name = "moban"
self.folder_name = "HTML人物家庭模板"
self.second_column_name = "RenWuJiaTing"
elif title_name == "建筑风光":
self.first_column_name = "moban"
self.folder_name = "HTML建筑风光模板"
self.second_column_name = "JianZhuFengGuang"
elif title_name == "艺术时尚":
self.first_column_name = "moban"
self.folder_name = "HTML艺术时尚模板"
self.second_column_name = "YiShuShiShang"
elif title_name == "娱乐休闲":
self.first_column_name = "moban"
self.folder_name = "HTML娱乐休闲模板"
self.second_column_name = "YuLeXiuXian"
elif title_name == "体育竞技":
self.first_column_name = "moban"
self.folder_name = "HTML体育竞技模板"
self.second_column_name = "TiYuJingJi"
elif title_name == "旅游交通":
self.first_column_name = "moban"
self.folder_name = "HTML旅游交通模板"
self.second_column_name = "LvYouJiaoTong"
elif title_name == "电脑主机":
self.first_column_name = "moban"
self.folder_name = "HTML电脑主机模板"
self.second_column_name = "DianNaoZhuJi"
elif title_name == "电子产品":
self.first_column_name = "moban"
self.folder_name = "HTML电子产品模板"
self.second_column_name = "DianZiChanPin"
elif title_name == "电子商务":
self.first_column_name = "moban"
self.folder_name = "HTML电子商务模板"
self.second_column_name = "DianZiShangWu"
BaseFrame().right("本次采集参数:日志路径:" + str(BaseFrame().LOG_PATH) + "")
BaseFrame().right("本次采集参数:sprider_count=" + str(self.sprider_count) + "")
BaseFrame().right("本次采集参数:title_name=" + title_name + "")
BaseFrame().right("本次采集参数:second_column_name=" + self.second_column_name + "")
# self.folder_name = "JS表单验证"
self.sprider_category = title_name # 一级目录self.folder_name
second_folder_name = str(self.sprider_count) + "个" + self.folder_name # 二级目录
self.sprider_type = second_folder_name
self.merchant = int(self.sprider_start_count) // int(self.max_pager) + 1 # 起始页码用于效率采集
# 原始路径+一级目录+二级目录
self.file_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name
self.save_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name + os.sep + self.folder_name
BaseFrame().debug("开始采集ChinaZJL" + self.folder_name + "...")
sprider_url = (self.base_url + "/{1}/{0}.html".format(self.second_column_name, self.first_column_name))
down_path = "D:\\Freedom\\Sprider\\ChinaZ\\" + self.sprider_top_level + "\\" + self.folder_name + "\\" + second_folder_name + "\\Temp\\"
if os.path.exists(down_path) is True:
shutil.rmtree(down_path)
if os.path.exists(down_path) is False:
os.makedirs(down_path)
if os.path.exists(self.save_path) is True:
shutil.rmtree(self.save_path)
if os.path.exists(self.save_path) is False:
os.makedirs(self.save_path)
chrome_options = webdriver.ChromeOptions()
diy_prefs = {'profile.default_content_settings.popups': 0,
'download.default_directory': '{0}'.format(down_path)}
# 添加路径到selenium配置中
chrome_options.add_experimental_option('prefs', diy_prefs)
chrome_options.add_argument('--headless') # 隐藏浏览器
# 实例化chrome浏览器时,关联忽略证书错误
driver = webdriver.Chrome(options=chrome_options)
driver.set_window_size(1280, 800) # 分辨率 1280*800
#
BaseFrame().debug("开始采集" + sprider_url)
driver.get(sprider_url)
# content = driver.page_source
element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick") # 列表页面 核心内容 box col3 ws_block masonry-brick
# element_list = div_elem.find_elements(By.CLASS_NAME, 'item')
# print(element_list.get_attribute('innerHTML'))
laster_pager_div = driver.find_element(By.CLASS_NAME, "fenye")
laster_pager_a = laster_pager_div.find_elements(By.TAG_NAME, 'a')
laster_pager_url = laster_pager_a[len(laster_pager_a) - 2]
page_end_number = int(laster_pager_url.text)
self.page_count = self.merchant
while self.page_count <= int(page_end_number): # 翻完停止
try:
if self.page_count == 1:
self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path)
pass
else:
if self.haved_sprider_count == self.sprider_count:
BaseFrame().debug("采集到达数量采集停止...")
BaseFrame().debug("开始写文章...")
self.builder_word(self.folder_name, self.word_content_list)
BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!")
break
# (self.base_url + "/sort/{0}/{1}/".format(url_index, self.page_count))
# http://soft.onlinedown.net/sort/177/2/
# https://sc.chinaz.com//jianli/xiaochengchu_2.html
next_url = self.base_url + "/{2}/{0}_{1}.html".format(self.second_column_name, self.page_count,
self.first_column_name)
driver.get(next_url)
element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick") # 列表页面 核心内容
self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path)
pass
# print(self.page_count)
self.page_count = self.page_count + 1 # 页码增加1
except Exception as e:
print("sprider()执行过程出现错误:" + str(e))
sleep(1)
干净的报纸杂志html5模板
橙色服务公司html5模板
安全保护公司网站模板
金碧堂皇酒店住宿官网模板
扁平化设计公司网站模板
iwatch苹果手表网站模板
商务笔记办公网站模板
机械工业公司网站模板
宽屏炫彩手机APP官网模板
创意设计公司单页模板
蓝色宽屏手机APP官网模板
办公家具设计公司单页模板
音乐演唱会票务公司模板
地理研究所公司网站模板
计算机编程科技公司模板
皇家酒店官网网站模板
摄影创意工作室网站模板
绿色宽屏大气模特网站模板
监控器材公司bootstrap模板
工业行业网站模板
海鲜水产公司HTML模板
宽屏商业响应式网站模板
跑步app官网网站模板
大型商场室内设计网站模板
蓝色大气商务办公网站模板
大气商务公司HTML模板
SEO服务网络推广公司模板
企业工作室Bootstrap模板
大气宽屏网吧主页模板下载
创意营销策划公司HTML5模板
奶牛养殖有限公司网站模板
蓝色手机应用开发公司模板
优雅的装饰家具网站模板
宽屏室内装修公司模板下载
极简集团官网响应式模板
大气宽屏官网网站模板
数据分析企业官网网站模板
大气简洁设计机构官网模板
叉车外贸企业网站模板
白色清爽阅读器软件官网模板
人脸识别技术公司网页模板
室内家具建材公司官网模板
金鱼养殖加盟网站模板
紫色室内家居装修网站模板
水力发电公司网站模板
响应式商务科技企业官网模板
酒店游泳池建造网站模板
时尚酒店住宿网站模板下载
扁平化家装装修公司模板
大气图纸设计公司网站模板
大气宽屏商务公司网站模板
运动鞋生产公司网站模板
新闻媒体整站html模板下载
别墅楼盘展示HTML5模板
简洁商务人士网站模板
宽屏商务合作网站模板
橘红色设计公司网站模板
蓝色宽屏摄影工作室网站模板
黑色炫酷企业项目展示模板
精品响应式创意公司官网模板
苹果应用APP设计公司模板
创意自行车设计网站模板
品牌商标注册公司网站模板
名片设计公司网站模板
绿色房屋租赁公司网站模板
灰色宽屏创意html5单页模板
艺术家居生活网站模板
大气律师事务所网站模板
旅行户外策划公司网站模板
手机跑步软件网站模板
简洁白色案例展示网站模板
import os
import shutil
def void_folder(path):
# 访问path路径下的文件或文件夹
lst = os.listdir(path)
# 打印每一层的文件或文件夹
for name in lst:
# 拼接名称,得到绝对路径,判断该文件是否符合是文件夹
real_path = os.path.join(path, name)
# 如果是文件夹,则打空格表示,并且递归访问下一层
if os.path.isdir(real_path):
# print(name)
files = os.listdir(real_path)
if len(files) == 0:
print("void_folder():"+name)
shutil.rmtree(real_path)
endindex = len(real_path) - len(name)
real_path = real_path[0:endindex]
void_folder(real_path)
else:
void_folder(real_path)
# 如果不是文件夹,直接打印,不再递归访问下一层
else:
#print(name)
pass
def void_file(dirPath):
dirs = os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹,返回列表
for file in dirs:
file_full_name = dirPath + '/' + file
file_ext = os.path.splitext(file_full_name)[-1]
if file_ext is None or file_ext=="":
continue
if "rar" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
if "zip" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
if "gz" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
if "tgz" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
# 查找指定文件夹下所有相同名称的文件
def search_file(dirPath, fileName):
dirs = os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹,返回列表
for currentFile in dirs: # 遍历列表
absPath = dirPath + '/' + currentFile
if os.path.isdir(absPath): # 如果是目录则递归,继续查找该目录下的文件
search_file(absPath, fileName)
elif currentFile == fileName:
#print(absPath) # 文件存在,则打印该文件的绝对路径
os.remove(absPath)
基于地理位置app开发网站模板
粉红色装修企业网站模板
产品图册设计网站模板
品牌橱柜公司网站模板
绿色材料设计网站模板
路由器交换机报价网站模板
广告创意策划公司网站模板
清新简洁设计公司网站模板
宽屏响应式企业官网模板
电脑软件设计网站模板
城市规划设计网站模板
web托管服务器网站模板
企业通讯平台网站模板
蓝色扁平网站建设公司模板
宽屏摄影工作室全站模板
红色大气商务办公企业模板
室内装修案例展示网站模板
蓝色推土机机械公司网站模板
快递运输公司网站模板
商务外贸公司bootstrap模板
风能工业设备公司网站模板
扁平化APP应用产品官网模板
摄影工作室作品案例网页模板
网页设计公司bootstrap模板
浅蓝色平面设计企业模板
最后送大家一首诗:
山高路远坑深,
大军纵横驰奔,
谁敢横刀立马?
惟有点赞加关注大军。