python csdn增加访问量

最新推荐文章于 2023-05-07 17:13:25 发布

aa1049372051

最新推荐文章于 2023-05-07 17:13:25 发布

阅读量6.4k

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/aa1049372051/article/details/51993133

版权

python 专栏收录该内容

34 篇文章 3 订阅

订阅专栏

python csdn增加访问量

主方法

# -*- coding:utf-8 -*-
import urllib.request, http.cookiejar, re
import time
import threading
# tools是我的自定义工具类
import tools

'''
模拟访问博客增加访问量
'''


class Csdn(threading.Thread):
    'csdn增加访问量'
    headers = [('host', 'blog.csdn.net'),
               ('User-Agent',
                'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'),
               ]
    domain = 'http://blog.csdn.net'
    url = 'http://blog.csdn.net/%s/article/list/%s'

    def __init__(self, username, page):
        threading.Thread.__init__(self)
        self.username = username
        self.createOpener()
        self.page = page

    @staticmethod
    def getListPages(username):
        '获取总页数'
        Csdn.headers.append(('Referer', 'http://blog.csdn.net/' + username))
        cookie = http.cookiejar.CookieJar()
        cookieProc = urllib.request.HTTPCookieProcessor(cookie)
        opener = urllib.request.build_opener(cookieProc)
        opener.addheaders = Csdn.headers
        url = Csdn.url % (username, 1)
        response = opener.open(url)
        contents = contents = response.read().decode('utf-8', 'ignore')
        pattern = r'<div id="papelist" class="pagelist">([\s\S]*?)共(\d+)页'
        match = re.search(pattern, contents)
        pages = int(match.group(2))
        return pages

    def createOpener(self):
        cookie = http.cookiejar.CookieJar()
        cookieProc = urllib.request.HTTPCookieProcessor(cookie)
        opener = urllib.request.build_opener(cookieProc)
        opener.addheaders = Csdn.headers
        self.opener = opener

    def visitUrl(self):
        '访问列表页获取内容'
        opener = self.opener
        url = Csdn.url % (self.username, self.page)
        response = opener.open(url)
        self.contents = contents = response.read().decode('utf-8', 'ignore')
        self.addVisitNum()

    def addVisitNum(self):
        opener = self.opener
        contents = self.contents
        divPattern = r'<div id="article_list" ([\s\S]*)<div id="papelist" class="pagelist">'
        ulMatch = re.search(divPattern, contents)
        divText = ulMatch.group(1)
        smallPattern = r'<div class="list_item article_item">([\s\S]*?)<span class="link_title"><a href="(.*?)">([\s\S]*?)</a></span>([\s\S]*?)阅读</a>\((\d+)\)'
        match = re.findall(smallPattern, divText)
        for i in match:
            list = {'url': Csdn.domain + i[1], 'name': i[2].strip(), 'num': i[4]}
            opener.open(list['url'])
            print(self.page, list['url'])

    def run(self):
        '线程主方法'
        self.visitUrl()


@tools.runTime
def main():
    '主方法'
    # csdn昵称
    username = 'digyso888'
    pages = Csdn.getListPages(username)
    threads = []
    for page in range(1, pages + 1):
        thread = Csdn(username, page)
        thread.start()
        threads.append(thread)
    # 等待所有线程完成
    for t in threads:
        t.join()
    print("退出主线程")


if __name__ == '__main__':
    main()

import time

'''
自定义工具方法,tools.py
'''


def runTime(func):
    '记录程序运行时间'

    def newFunc(*args, **kwargs):
        start = time.clock()
        res = func(*args, **kwargs)
        end = time.clock()
        print("read: %f s" % (end - start))
        return res

    return newFunc


def log(content, file='test.log', type=1):
    if type == 1:
        f = open(file, 'a+', encoding='utf-8')
    else:
        f = open(file, 'w+', encoding='utf-8')
    f.write(content)

aa1049372051

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python csdn增加访问量

python csdn增加访问量主方法# -*- coding:utf-8 -*-import urllib.request, http.cookiejar, reimport timeimport threading# tools是我的自定义工具类import tools'''模拟访问博客增加访问量'''class Csdn(threading.Thread)
复制链接

扫一扫