mirocp-CSDN博客

原创 Python3爬虫学习笔记——xpath练习之爬取起点网玄幻小说排行

这次看完xpath章之后巩固练习 import re import requests from lxml import etree def get_one_page(url): headers = { 'User-Agent':'MOzilla/5.0(Macintosh;Inter Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML...

2018-08-21 16:45:18 2259

原创 Python3爬虫学习笔记——正则表达式练习之爬取起点网完本玄幻小说信息

说来惭愧，在看完崔庆才写的Python3网络爬虫开发实战的requests篇和正则表达式篇后，就想练练手，于是想到了最近书荒，就像看看小说，于是就。。。但是呢，在chrome下参考网站源码还写正则表达式后，并不能获取到想要的数据。查看输出html后，发现获取到的html源码并非与chrome上Elements提供的相同。查询相关资料后了解到Elements显示的源码时经过渲染以后的源码。所以需...

2018-08-13 20:14:31 1296

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人