分享111个ASP整站程序源码，总有一款适合您

最新推荐文章于 2024-05-21 23:21:19 发布

亚丁号

最新推荐文章于 2024-05-21 23:21:19 发布

阅读量154

点赞数

文章标签：前端

本文链接：https://blog.csdn.net/zy0412326/article/details/129892263

版权

分享111个ASP整站程序源码，总有一款适合您

111个ASP整站程序源码下载链接：https://pan.baidu.com/s/1vMIRl1zjm0CSVBBPzaGhRA?pwd=yayc
提取码：yayc

Python采集代码下载链接：采集代码.zip - 蓝奏云

我的博客地址：亚丁号-知识付费平台支付后可见扫码付费可见

import os
import shutil

import requests
from bs4 import BeautifulSoup

from framework.base.BaseFrame import BaseFrame
from sprider.access.SpriderAccess import SpriderAccess
from sprider.plugin.SpriderTools import SpriderTools
from sprider.plugin.UserAgent import UserAgent


class CNSourceCoder:
    base_url = "http://www.downcode.com"

    max_pager = 10  # 每页的数量 影响再次采集的起始位置.
    word_image_count = 5  # word插入图片数量 同时也是明细采集图片和描述的数量

    page_end_number = 0
    word_content_list = []
    haved_sprider_count = 0  # 已经采集的数量
    sprider_detail_index = 0  # 明细方法采集的数量 累加

世纪风情网[门户网站]

攀枝花学院学报

蓝琼天空 FreePower362_full 美化版

江苏生活网大型综合站

V265.Com娱乐资源站整站

坤龙论坛

站络中国修改版（精简）

嘉缘人才管理系统V2.15免费版

中国E域在线美化无错第二版

宁波电脑学堂三合一整站程序

游戏CS网站3.0

青葵家教管理系统2.0

灵剑逍遥+论坛整站程序

原始部落蓝雨2005修改版全站程序

黑眼睛设计工作室全站源码05

博瑞网络正版整站程序

凡人网络企业自助建站系统V1.0

宁海健民医疗仪器厂源程序

无忧传奇官方站点（精装版生成HTM）提供下载

中网电影系统China-W

薄冰时期-2005整站

守护天使个人优化版整站程序

Chinawebsite中国网址同盟整站程序

老表创想工作室整站程序

英德社区整站程序

蓝雨设计整站程序 V5.2

漂亮的儿童网站-欣欣乐园

如影相随-黑色相随版

阎良区街道办劳保所全站程序

傲华网络虚拟城市V3.3

青山木业公司整站程序（界面美化）

无忧传奇官方站点（绿色版本生成HTM）提供下载

星星雨全站系统（动易2005美化版）

网讯中国 VOL.1.0

站络中国整站程序含数据

战方网房产楼市

中娱博客修改版

陆城社区 V1.0测试版（整合OBLOG+DVBBS）

搜依网络2005 CMS整站程序

风韵网络全站程序2005版

龙川在线

极速网络空间整站程序

E时代修改乔客7.02美化(无错版)

安庆旅游网

淘秀网址导航2005

可创工作室全站系统

动漫星空整站

酷狗网站

千骄百媚女性教育网（改自ACMS）

易讯建站管理系统 V1.0

简单网络4.03 Build 20050314修正版

八度空间软件站2.0清爽版

中娱信息网2005整站SP1（导航）

中娱信息网2005整站SP1（文学社）

E时代驿站全站（美化无错2005版）

徐州2005在线全站完整版

松子网络 Cms1.2

三方娱乐在线终极版美化整站

金龙网络CMS2004

淘装备网网游虚拟交易平台V1.0

丝语轩整站系统

柳州电台整站系统

自助式小型企业网2.0版

红蜡烛Rv2.0.0

冒险部落蓝雨美化修改版

Ekugo网址导航系统

精美全站

风云 CMS 2005V1.0

芜湖互动娱乐网

游戏3K全站2.5终结版

金无忧音乐小偷美华精简版

亮点网络ASP传奇整站程序完美版

湖南热线全站下载V1.0

思洋网络小型整站程序

八度空间(全站程序)（原：我要论坛资源网）

广西3K战队CS整站

旋风娱乐网（Www.139xx.Com）整站程序(05年2月10日更新)

CMS 2005

热点都市

思洋网络免费资源站整站程序

哆啦工作室

软件创业联盟整站源码

『花韶纷飞』加强版

禽獸空間+[蓝雨修改版]整合小偷程序

逍遥仙境V2005

网蚁在线2.0

中国大学生设计网 V8.0 新春贺岁版

非常视觉V3.02

广东BeYond站整站FwwX V2.0

枫雪视觉设计站

紫色雨真情美化版

心约网络整站 V2.0

心意吧WS 2.0

眉州笑话频道1.0(带22458条数据)

Lccy Blog ACCESS版带最新魔法表情

QYMANAGER(企业管理者) V1.0 完整版

全球旅游网全站系统 V2005 完整版

飞梦网络 2005 V1.5 完美无错版

『旋网』整站下载（小偷类综合）免维护版

KAMSON多媒体教学站

广东E时代网页特效

网游交易平台V3.25免费版

自助式小型企业网

Xtype Cms 1.22(SY修改版)

酷狗网-原工作室

飞梦网络 2005 V1.2

杭州整形美容网

久站互联 V3.0 商业解密版

平潭信息港 V4.0 修正完整版

光山热线网络电台整站程序

LZ8 WS V1.1 雨易修正


    def sprider(self,sprider_name,sprider_count,start_number,
                pager_number,sprider_type,is_show_browse,root_path,
                first_column_name,second_column_name,is_record_db):
        """
        http://www.downcode.com/sort/j_1_2_1.shtml
        :param sprider_name:
        :return:
        """
        self.first_folder_name=sprider_type.upper()
        self.base_path=root_path
        self.first_column_name = first_column_name
        self.second_column_name = second_column_name
        self.sprider_start_count=start_number
        self.is_record_db=is_record_db
        BaseFrame().debug("开始采集[源码下载站]" + self.first_folder_name + "源码...")
        BaseFrame().right("本次采集参数：sprider_count(采集数量):" + str(sprider_count) + "")
        BaseFrame().right("本次采集参数：sprider_name(采集名称):" + sprider_name + "")
        sprider_url = self.base_url + "/{0}/{1}_1.shtml".format(self.first_column_name, self.second_column_name)# 根据栏目构建URL
        BaseFrame().debug("本次采集参数：sprider_url:" + sprider_url)

        self.second_folder_name = str(sprider_count) + "个" + sprider_name  # 二级目录也是wordTitle
        self.merchant = int(self.sprider_start_count) // int(self.max_pager) + 1  # 起始页码用于效率采集
        self.file_path = self.base_path + os.sep + self.first_folder_name + os.sep + self.second_folder_name
        BaseFrame().right("本次采集参数：file_path=" + self.file_path + "")
        # 浏览器的下载路径
        self.down_path = self.base_path + os.sep + self.first_folder_name+ os.sep + self.second_folder_name+ "\\Temp\\"
        BaseFrame().right("本次采集参数：down_path=" + self.down_path + "")
        # First/PPT/88个动态PPT模板/动态PPT模板
        self.save_path = self.base_path + os.sep + self.first_folder_name + os.sep + self.second_folder_name + os.sep + sprider_name
        BaseFrame().right("本次采集参数：save_path=" + self.save_path + "")


        if os.path.exists(self.down_path) is True:
            shutil.rmtree(self.down_path)
        if os.path.exists(self.down_path) is False:
            os.makedirs(self.down_path)

        if os.path.exists(self.save_path) is True:
            shutil.rmtree(self.save_path)
        if os.path.exists(self.save_path) is False:
            os.makedirs(self.save_path)
        response = requests.get(sprider_url, timeout=10, headers=UserAgent().get_random_header(self.base_url))
        response.encoding = 'gb2312'
        soup = BeautifulSoup(response.text, "html5lib")
        #print(soup)
        element_list = soup.find_all('div', attrs={"class": 'j_text_sort_a'})
        page_end_number = 1
        page_end_url = ""
        page_end_title = soup.find("a", attrs={"title": '最后页'})
        page_end_url = page_end_title.get("href")
        if page_end_url is None or page_end_url == "":
            page_end_number = 1
        else:
            page_end_number = (page_end_url.split(".shtml")[0].split("_")[3])

        self.page_count = self.merchant

        while self.page_count <= int(page_end_number):  # 翻完停止
            try:
                if self.page_count == 1:
                    self.sprider_detail(element_list, page_end_number,sprider_count)
                    pass
                else:
                    if int(self.haved_sprider_count) == int(sprider_count):
                        BaseFrame().debug("sprider采集到达数量采集停止...")
                        BaseFrame().debug("开始写文章...")
                        SpriderTools.builder_word(self.second_folder_name,
                                                  self.word_content_list,
                                                  self.file_path,
                                                  self.word_image_count,
                                                  self.first_folder_name)
                        SpriderTools.copy_file(self.word_content_list,
                                               self.save_path,
                                               self.second_folder_name,
                                               self.file_path)
                        SpriderTools.gen_passandtxt(self.second_folder_name, self.word_content_list, self.file_path)
                        BaseFrame().debug("文件编写完毕，请到对应的磁盘查看word文件和下载文件！")
                        break
                    next_url = self.base_url + "/{0}/{1}_{2}.shtml".format(self.first_column_name,
                                                                           self.second_column_name,
                                                                           self.page_count)

                    response = requests.get(next_url, timeout=10, headers=UserAgent().get_random_header(self.base_url))
                    response.encoding = 'gb2312'
                    soup = BeautifulSoup(response.text, "html5lib")
                    element_list = soup.find_all('div', attrs={"class": 'j_text_sort_a'})
                    self.sprider_detail(element_list, page_end_number,sprider_count)
                    pass
                self.page_count = self.page_count + 1  # 页码增加1
            except Exception as e:
                BaseFrame().error("sprider()执行过程出现错误:" + str(e))

最后送大家一首诗:

山高路远坑深,
大军纵横驰奔,
谁敢横刀立马？
惟有点赞加关注大军。