爬取的网站:http://blog.csdn.net/1024.html
需要爬取的信息如图:
打开页面源代码,发现并没有需要的信息,想起之前爬过的以json格式加载的网易评论,便开始点击查看元素,筛选之后,知道只有蓝色标注那个网址有所需要的内容,如图。然后打开下图的源代码,神奇的东西出现了,在这里,我截取了一部分,如下图。
爬取的网站:http://blog.csdn.net/1024.html
需要爬取的信息如图:
打开页面源代码,发现并没有需要的信息,想起之前爬过的以json格式加载的网易评论,便开始点击查看元素,筛选之后,知道只有蓝色标注那个网址有所需要的内容,如图。然后打开下图的源代码,神奇的东西出现了,在这里,我截取了一部分,如下图。