本文首发于我的个人博客:尾尾部落
从2016年就开始在简书上写文章,之所以选择这个平台,很大程度上是因为它洁简的后台输入界面,支持MD,非常适合写一些技术类的文章。
从最开始的零星几个粉丝,到粉丝数破百,到现在有700+粉丝,虽然离大牛们动辄数十万的粉丝还有很大的差距,但是看着粉丝数一天天上涨,感觉也很有成就感。于是就想着记录下粉丝数增涨的过程,以后当粉丝数上万后可以回头看看自己是怎么一步一步走到今天的(此处应该是意淫的表情)。但是,也许是简书太乞求简洁,后台都不提供作者粉丝数历史记录的,不像微信公众号、头条、熊掌号这些成熟的自媒体平台,都会给作者提供完善的相关数据记录,让作者可以清晰地跟踪自己粉丝数增长的曲线。
既然简书不提供,自己又希望有这个功能,又不想放弃简书这个平台,那就自己动手,丰衣足食吧。实现起来也很简单,思路如下:
- 写个爬虫,每天定时爬取自己简书账号的各项指标数据(包括粉丝数、喜欢数、文章数等)
- 写一个页面,用来做数据展示
- 没了,就是这么简单。
Talk is cheap, Show you the code
上代码,这里附上爬虫的代码,展示页面做得还不是很完善,就不献丑了。
# -*- coding:utf-8 -*-
import time
import re
import random
import requests
from lxml import etree
from pymongo import MongoClient
client = MongoClient()
def randomUserAgent():
USER_AGENTS = [
"Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; AcooBrowser; .NET CLR 1.1.4322; .NET CLR 2.0.50727)",
"Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; Acoo Browser; SLCC1; .NET CLR 2.0.50727; Media Center PC 5.0; .NET CLR 3.0.04506)",
"Mozilla/4.0 (compatible; MSIE 7.0; AOL 9.5; AOLBuild 4337.35; Windows NT 5.1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)",
"Mozilla/5.0 (Windows; U; MSIE 9.0; Windows NT 9.0; en-US)",
"Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Win64; x64; Trident/5.0; .NET CLR 3.5.30729; .NET CLR 3.0.30729; .NET CLR 2.0.50727; Media Center PC 6.0)",
"Mozilla/5.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0; WOW64; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; .NET CLR 1.0.3705; .NET CLR 1.1.4322)",
"Mozilla/4.0 (compatible; MSIE 7.0b; Windows NT 5.2; .NET CLR 1.1.4322; .NET CLR 2.0.50727; InfoPath.2; .NET CLR 3.0.04506.30)",
"Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN) AppleWebKit/523.15 (KHTML, like Gecko, Safari/419.3) Arora/0.3 (Change: 287 c9dfb30)",