上一篇“python之初体验”中我们主要是实现了抓取csdn本人博客列表页面的每一篇博客的阅读数量和标题功能,后来就想我们是有了数量和title,可是我还想要是知道我的每篇阅读数量和日期之间的关系就好了,以及每篇博客的阅读趋势,说到关系和趋势可能再多的语言都显得苍白无力,所以图表可能是最好的一种表现形式,今天要实现的功能就是在python中通过绘制折线图来表明日期和阅读数量的关系。
当然代码是可以复用的,之前的爬取代码我们直接拿过来用就好了,本质上是只需要将我们爬取的数据展示在折线图上面就好了,python中画图常用的就是matplotlib了,当然这个属于第三方模块,需要安装,如果不安装直接导包是会失败的,当然安装就很简单了,这里就不多介绍了。下面是我们代码的完整实例。
#!usr/bin/python
# -*- coding: utf-8 -*-
'''
使用python爬取csdn个人博客的访问量,并用折线图展示出来时间和阅读数目的关系
'''
import urllib2
import re
from bs4 import BeautifulSoup;
#当前的博客列表页号
from http import ResponseUtils
# 导入画图需要的库
from pylab import *
page_num = 1
notLast = 1;
# account = str(raw_input('输入csdn的登录账号:'))
account = '