分享113个HTML公司企业模板,总有一款适合您

分享113个HTML公司企业模板,总有一款适合您

 

113个HTML公司企业模板下载链接:https://pan.baidu.com/s/1mtN0FPh7V3nbLSPgBL2vlQ?pwd=e77e 
提取码:e77e

Python采集代码下载链接:采集代码.zip - 蓝奏云

NTF公司项目网站HTML5模板

NTF公司项目网站HTML5模板是一款适合公司企业官网网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
 

建筑施工装修公司网站模板

建筑施工装修公司网站模板是一款基于Bootstrap5实现的建筑装修公司网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
 

App应用程序着陆页HTML模板

App应用程序着陆页HTML模板是一款适合应用程序开发公司网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
 

公司代理机构创意网站模板

公司代理机构创意网站模板是一款适合初创公司公司网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
 

import os
import shutil
import time
from time import sleep
from docx import Document
from docx.shared import Inches
from framework.base.BaseFrame import BaseFrame
from sprider.business.DownLoad import DownLoad
from sprider.business.SeleniumTools import SeleniumTools
from sprider.business.SpriderTools import SpriderTools
from selenium import webdriver
from selenium.webdriver.common.by import By
from sprider.model.SpriderEntity import SpriderEntity
from sprider.access.SpriderAccess import SpriderAccess

title_name = "公司企业"


class ChinaZJsSelenium:
    base_url = "https://sc.chinaz.com/"  # 采集的网址
    save_path = "D:\\Freedom\\Sprider\\ChinaZ\\"
    sprider_count = 113  # 116+66+20
    sprider_start_count = 223

    word_content_list = []
    folder_name = ""
    page_end_number = 0
    max_pager = 24  # 每页的数量
    haved_sprider_count = 0  # 已经采集的数量
    page_count = 1  # 每个栏目开始业务content="text/html; charset=gb2312"
    filter_down_file = []
    word_image_count = 5  # word插入图片数量 同时也是明细采集图片和描述的数量
    sprider_detail_index = 0  # 明细方法采集的数量 累加
    sprider_top_level = "HTML"

管道维修水电施工HTML5模板

电子竞技游戏锦标赛网站模板

环境生态保护响应式模板

家政保洁服务公司网站模板

创意响应式企业网站HTML5模板

建筑设计工程师网站HTML5模板

仓储货运快递企业网站模板

正规租车公司官方网站模板

宠物狗交易平台网站模板

新鲜水果超市官网网站模板

Saas软件设计项目启动网站模板

泳池维修清洁服务网站模板

软件商店App开发网站模板

本地商家目录Bootstrap5模板

电影视频制作网站HTML5模板

现代信息技术初创公司HTML5模板

商业金融保险机构网站模板

游泳潜水培训公司HTML5模板

汽车保养维护企业Bootstrap5模板

求职招聘工作发布网站模板

NFT数字作品交易市场网站模板

技术IT解决方案HTML5模板

数字收藏品市场区块链网站模板

建筑艺术工厂安装企业网站模板

附近商家列表目录网站模板

商业咨询企业网站建设HTML5模板

企业顾问财务保险业务HTML5模板

企业集团公司商业网站模板

企业项目启动着陆页网站模板

应用程序软件着陆页HTML5模板


    def sprider(self, title_name):
        """
       采集
       医疗保健 https://sc.chinaz.com/moban/YiLiaoBaoJian.html
       电子产品 https://sc.chinaz.com/moban/DianZiChanPin.html
       电子商务 https://sc.chinaz.com/moban/DianZiShangWu.html
       婚纱模板 https://sc.chinaz.com/moban/HunShaMoBan.html
       电脑主机 https://sc.chinaz.com/moban/DianNaoZhuJi.html
       旅游交通 https://sc.chinaz.com/moban/LvYouJiaoTong.html
       体育竞技 https://sc.chinaz.com/moban/TiYuJingJi.html
       娱乐休闲 https://sc.chinaz.com/moban/YuLeXiuXian.html
       艺术时尚 https://sc.chinaz.com/moban/YiShuShiShang.html
       建筑风光 https://sc.chinaz.com/moban/JianZhuFengGuang.html
       动植食物 https://sc.chinaz.com/moban/DongZhiShiWu.html
       人物家庭 https://sc.chinaz.com/moban/RenWuJiaTing.html
       社会教育 https://sc.chinaz.com/moban/SheHuiJiaoYu.html
       公司企业 https://sc.chinaz.com/moban/GongSiQiYe.html
       :return:
       """
        if title_name == "医疗保健":
            self.first_column_name = "moban"
            self.folder_name = "HTML医疗保健模板"
            self.second_column_name = "YiLiaoBaoJian"
        elif title_name == "公司企业":
            self.first_column_name = "moban"
            self.folder_name = "HTML公司企业模板"
            self.second_column_name = "GongSiQiYe"
        elif title_name == "社会教育":
            self.first_column_name = "moban"
            self.folder_name = "HTML社会教育模板"
            self.second_column_name = "SheHuiJiaoYu"
        elif title_name == "动植食物":
            self.first_column_name = "moban"
            self.folder_name = "HTML动植食物模板"
            self.second_column_name = "DongZhiShiWu"
        elif title_name == "人物家庭":
            self.first_column_name = "moban"
            self.folder_name = "HTML人物家庭模板"
            self.second_column_name = "RenWuJiaTing"

        elif title_name == "建筑风光":
            self.first_column_name = "moban"
            self.folder_name = "HTML建筑风光模板"
            self.second_column_name = "JianZhuFengGuang"
        elif title_name == "艺术时尚":
            self.first_column_name = "moban"
            self.folder_name = "HTML艺术时尚模板"
            self.second_column_name = "YiShuShiShang"
        elif title_name == "娱乐休闲":
            self.first_column_name = "moban"
            self.folder_name = "HTML娱乐休闲模板"
            self.second_column_name = "YuLeXiuXian"
        elif title_name == "体育竞技":
            self.first_column_name = "moban"
            self.folder_name = "HTML体育竞技模板"
            self.second_column_name = "TiYuJingJi"
        elif title_name == "旅游交通":
            self.first_column_name = "moban"
            self.folder_name = "HTML旅游交通模板"
            self.second_column_name = "LvYouJiaoTong"
        elif title_name == "电脑主机":
            self.first_column_name = "moban"
            self.folder_name = "HTML电脑主机模板"
            self.second_column_name = "DianNaoZhuJi"

        elif title_name == "电子产品":
            self.first_column_name = "moban"
            self.folder_name = "HTML电子产品模板"
            self.second_column_name = "DianZiChanPin"

        elif title_name == "电子商务":
            self.first_column_name = "moban"
            self.folder_name = "HTML电子商务模板"
            self.second_column_name = "DianZiShangWu"

        BaseFrame().right("本次采集参数:日志路径:" + str(BaseFrame().LOG_PATH) + "")
        BaseFrame().right("本次采集参数:sprider_count=" + str(self.sprider_count) + "")
        BaseFrame().right("本次采集参数:title_name=" + title_name + "")
        BaseFrame().right("本次采集参数:second_column_name=" + self.second_column_name + "")
        # self.folder_name = "JS表单验证"
        self.sprider_category = title_name  # 一级目录self.folder_name
        second_folder_name = str(self.sprider_count) + "个" + self.folder_name  # 二级目录
        self.sprider_type = second_folder_name
        self.merchant = int(self.sprider_start_count) // int(self.max_pager) + 1  # 起始页码用于效率采集
        # 原始路径+一级目录+二级目录
        self.file_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name

        self.save_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name + os.sep + self.folder_name
        BaseFrame().debug("开始采集ChinaZJL" + self.folder_name + "...")
        sprider_url = (self.base_url + "/{1}/{0}.html".format(self.second_column_name, self.first_column_name))

        down_path = "D:\\Freedom\\Sprider\\ChinaZ\\" + self.sprider_top_level + "\\" + self.folder_name + "\\" + second_folder_name + "\\Temp\\"
        if os.path.exists(down_path) is True:
            shutil.rmtree(down_path)
        if os.path.exists(down_path) is False:
            os.makedirs(down_path)

        if os.path.exists(self.save_path) is True:
            shutil.rmtree(self.save_path)
        if os.path.exists(self.save_path) is False:
            os.makedirs(self.save_path)
        chrome_options = webdriver.ChromeOptions()
        diy_prefs = {'profile.default_content_settings.popups': 0,
                     'download.default_directory': '{0}'.format(down_path)}
        # 添加路径到selenium配置中
        chrome_options.add_experimental_option('prefs', diy_prefs)
        chrome_options.add_argument('--headless')  # 隐藏浏览器
        # 实例化chrome浏览器时,关联忽略证书错误
        driver = webdriver.Chrome(options=chrome_options)
        driver.set_window_size(1280, 800)  # 分辨率 1280*800
        #
        BaseFrame().debug("开始采集" + sprider_url)
        driver.get(sprider_url)
        # content = driver.page_source

        element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick")  # 列表页面 核心内容 box col3 ws_block masonry-brick
        # element_list = div_elem.find_elements(By.CLASS_NAME, 'item')
        # print(element_list.get_attribute('innerHTML'))

        laster_pager_div = driver.find_element(By.CLASS_NAME, "fenye")
        laster_pager_a = laster_pager_div.find_elements(By.TAG_NAME, 'a')
        laster_pager_url = laster_pager_a[len(laster_pager_a) - 2]
        page_end_number = int(laster_pager_url.text)
        self.page_count = self.merchant
        while self.page_count <= int(page_end_number):  # 翻完停止
            try:
                if self.page_count == 1:
                    self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path)
                    pass
                else:
                    if self.haved_sprider_count == self.sprider_count:
                        BaseFrame().debug("采集到达数量采集停止...")
                        BaseFrame().debug("开始写文章...")
                        self.builder_word(self.folder_name, self.word_content_list)
                        BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!")
                        break
                    # (self.base_url + "/sort/{0}/{1}/".format(url_index, self.page_count))
                    # http://soft.onlinedown.net/sort/177/2/
                    # https://sc.chinaz.com//jianli/xiaochengchu_2.html
                    next_url = self.base_url + "/{2}/{0}_{1}.html".format(self.second_column_name, self.page_count,
                                                                          self.first_column_name)

                    driver.get(next_url)

                    element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick")  # 列表页面 核心内容
                    self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path)
                    pass
                # print(self.page_count)
                self.page_count = self.page_count + 1  # 页码增加1
            except Exception as e:
                print("sprider()执行过程出现错误:" + str(e))
                sleep(1)


物流快递货运企业网站HTML模板

创意机构作品展示企业网站模板

建筑工程公司网站HTML5模板

建筑设备租赁公司网站模板

建筑施工单位网站HTML5模板

企业官网着陆页HTML5模板

商业营销多用途HTML着陆页模板

浅蓝色客户服务网站HTML模板

金融资产管理公司HTML5模板

度假村酒店预订平台网站模板

户外广告设计公司网站模板

企业网盘售卖页面HTML模板

应用程序开发设计公司网页模板

加密货币交易行业网站模板

蓝色宽屏公司服务器网站模板

精美搜索引擎优化公司网站模板

智慧洗衣服务公司网站模板

滑板生产厂家网站HTML5模板

房屋建筑设计公司HTML5模板

汽车维修服务网页HTML5模板

在线预订房间酒店网站模板

蓝色大气施工构建网站模板

钢铁制造业中小企业网站模板

创业合作融资公司网站模板

汽车出租公司HTML5网站模板

大型货运物流公司网站模板

橙色翻译服务公司网站模板

野外旅行骑行俱乐部网站模板

创意公司企业单页网站模板

通用广告设计公司网站模板

运输物流公司响应式网站模板

稳重大气的法律咨询网站模板

扁平大气酒店预定网站模板

蓝绿色响应式招聘求职网站模板

主机托管云服务网站模板

紫色域名托管服务网站模板

网站托管虚拟主机HTML5模板

响应式物流货运公司网站模板

简约干净的家居商城网站模板

紫色互联网软件公司网站模板

黄色电子设备维修官网网站模板

红色风格房地产中介网站模板

时尚首饰奢侈品公司网站模板

货运物流公司企业网站模板

法律咨询律师事务所网站模板

酷黑色模特经纪公司网站模板

响应式室内装修设计网站模板

简洁的网络科技公司网站模板

跨境电商企业网站HTML5模板

网络杂志新闻网站HTML5模板

年度最佳游戏奖官网展示模板

PUBG绝地求生游戏宣传网站模板

清新简约室内设计HTML模板

紫色出众的网络服务网站模板

金融服务公司响应式网站模板

绿色虚拟主机运营商网页模板

律师事务所网站设计响应式模板

矿业工业重工网站HTML5模板

大气制造业工业企业网站模板

蓝色游艇租赁网站HTML5模板

创意建筑设计室内装修网站模板

移动支付金融手机网站模板

import os
import shutil

def void_folder(path):
    # 访问path路径下的文件或文件夹
    lst = os.listdir(path)
    # 打印每一层的文件或文件夹
    for name in lst:
        # 拼接名称,得到绝对路径,判断该文件是否符合是文件夹
        real_path = os.path.join(path, name)
        # 如果是文件夹,则打空格表示,并且递归访问下一层
        if os.path.isdir(real_path):
            # print(name)
            files = os.listdir(real_path)
            if len(files) == 0:
                print("void_folder():"+name)
                shutil.rmtree(real_path)
                endindex = len(real_path) - len(name)
                real_path = real_path[0:endindex]
                void_folder(real_path)
            else:
                void_folder(real_path)
        # 如果不是文件夹,直接打印,不再递归访问下一层
        else:
            #print(name)
            pass
def void_file(dirPath):
    dirs = os.listdir(dirPath)  # 查找该层文件夹下所有的文件及文件夹,返回列表
    for file in dirs:
        file_full_name = dirPath + '/' + file
        file_ext = os.path.splitext(file_full_name)[-1]
        if file_ext is None  or file_ext=="":
            continue

        if "rar" == str(file_ext.split(".")[1]):
            os.remove(file_full_name)
        if "zip" == str(file_ext.split(".")[1]):
            os.remove(file_full_name)
        if "gz" == str(file_ext.split(".")[1]):
            os.remove(file_full_name)
        if "tgz" == str(file_ext.split(".")[1]):
            os.remove(file_full_name)

# 查找指定文件夹下所有相同名称的文件
def search_file(dirPath, fileName):
    dirs = os.listdir(dirPath)  # 查找该层文件夹下所有的文件及文件夹,返回列表
    for currentFile in dirs:  # 遍历列表
        absPath = dirPath + '/' + currentFile

        if os.path.isdir(absPath):  # 如果是目录则递归,继续查找该目录下的文件
            search_file(absPath, fileName)
        elif currentFile == fileName:
            #print(absPath)  # 文件存在,则打印该文件的绝对路径
            os.remove(absPath)

时尚美容美发沙龙网站模板

主机域名运营商网站HTML5模板

企业个人求职招聘网站模板

沉稳大气商务网站HTML5模板

清爽室内装修设计网站模板

蓝色网站托管虚拟主机CSS模板

电子书出售着陆页网站模板

音乐软件开发者网站模板

农场有机食品网站HTML5模板

新闻门户网站Bootstrap模板

灰色极简风设计公司网站模板

汽车零部件网站HTML5模板

物流手持终端企业网站模板

扁平云办公服务网站HTML5模板

宽屏大气房产中介网站模板

机械设备租赁企业网站模板

在线汽车租赁公司网站HTML模板

最后送大家一首诗:

山高路远坑深,
大军纵横驰奔,
谁敢横刀立马?
惟有点赞加关注大军。
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

亚丁号

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值