宝塔 bt 蜘蛛统计数量汇总与分类统计 python

在这里插入图片描述
宝塔会员的 网站统计里面看蜘蛛数量 不方便
当站点多的时候不方便,,蜘蛛多少那列不能排序,不能按多少排序
写了个代码 半自动统计 蜘蛛数量
当站点多的时候,只更新诱蜘蛛来的站点,没有蜘蛛的站点不显示!
在这里插入图片描述

总共三个文件:
1)spider_file.txt 统计的的txt文本文件,直接全选复制页面的文本 ,放到txt ,
2) fenlei.txt 文件,用于配置如果你的服务器的网站有各种类型的站点要分类的时候,当然不分类也可以用
3)spider_site_get.py 文本处理与分类 提取脚本,主要就是处理和现实
在这里插入图片描述
使用方法
1)将三个文件放到一个文件夹
2)装好引用
3)配置好站点分类,不配置也可以,配置格式是,井号加分类名字,下面一行一个站点域名
#分类一
站点1
站点2
站点3
站点4

#分类2
站点5
站点6
站点7
spider_site_get.py

import os
import re


def get_spider_site(site_str_list):
    """

    :param site_str_list: 要处理的包含的站点
    :return: 返回一个 元组list
    """
    site_line_temp = []
    for site_str in site_str_list:
        if len(site_str) < 8:
            pass
        else:
            site_str = site_str.strip()
            site_str = re.sub(r"	.*	", "**", site_str)
            site_spider_num = site_str.split("**")
            site_spider_num[1] = site_spider_num[1].replace(",", "")
            site_line_temp.append(site_spider_num)

    site_line_temp = sorted(site_line_temp, key=lambda x: int(x[1]), reverse=True)
    # print(site_line_temp)
    return site_line_temp


def get_file_read(filepath):
    """

    :param filepath: 读取文件路径
    :return: 读取的文本内容,去除换行符,返回行list
    """
    if os.path.exists(filepath):
        pass
    else:
        with open(filepath, "a+", encoding="utf-8") as fw:
            fw.write("")
    with open
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值