- 博客(3)
- 收藏
- 关注
转载 Xpath语法和使用示例
Xpath语法Xpath是一门在XML文档中查找信息的语言,可以用来在XML文档中元素和属性进行遍历,是W3C XSLT标准的主要元素 1,节点关系父节点,下面例子中,body是h1元素的父节点,h1是body节点的子节点,子节点可以有零个和多个<body> <h1>小白</h1> <h2>小黑</h2><...
2018-04-06 14:54:13 13617
转载 正则表达式
主要的内容正则表达式常用符号re模块和方法例1----爬取斗破苍穹全文小说例2----爬取糗事百科段子信息正则表达式中的常用符号1,一般字符2,预定义字符集3,数量词4,边界匹配re模块中的search()函数re模块的search()函数匹配并提取第一个符合规律的内容,返回一个正则表达式对象。基本语法为:re.search(pattern, string, flags=0)1,pattern为匹...
2018-04-05 15:29:20 404
转载 爬取酷狗榜单中的top500
首先先看到top500的页面,如下图所示网页版的酷狗没有翻页的操作,所以不能看到后面页数的链接,根据第一页的链接,http://www.kugou.com/yy/rank/home/1-8888.html 我们尝试把链接里面的数字1改为2,果然跳转到第二页去了,这样就好办了,每页显示22条歌曲,所以经过计算,需要23条url链接,后面自己手动创建url具体的操作和解释都下面代码中# -*- e...
2018-04-01 18:58:41 3450
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人