之前做了一个统计CSDN博客的网页,费了一番功夫做好了,并且记录于此。慢慢发现其实效率是蛮低的,毕竟当初的思路是用户请求的时候,后台立马开始抓取网页,就算换使用了多线程,可视还是会有一两秒的延迟,而且当增加功能导致抓取的网页增多的时候,反馈信息的延迟就体现出来了。
如今网页已经没有了维护的价值,所以打算换个思路把实现重建,使得用户使用的速度更快。
其实思路也很简单,就是提前把数据抓取并存储到数据库中,不过这样就有一个要求,数据库里的信息要实时刷新,所以可以定时抓取信息或者更新,由于同学们更新博客的频率不会太快,间隔可以设置的比较长,当然,还可以添加一个立即刷新的功能以供用户需要刷新的时候使用。
此次重建会添加的功能
——标记当前周有更新的成员
——列出所有的最新博文
——其他