
python
程序猿20
这个作者很懒,什么都没留下…
展开
-
Python爬虫相关技术(xpath和beautifulsoap)
一、xpath xpath用于定位html中的元素。 / 表示从根节点进行查找元素 // 从匹配的当前节点来对文档的节点进行选择 . 选取当前节点 .. 选取当前节点的父节点 @ 选择属性 /html 选取根节点下的所有html元素,也就是整个html文档。 /body/div 选取属于body的子元素中所有div元素。 //div 选取所有div标签的子元素,不管在html文档...原创 2019-01-06 10:31:51 · 1485 阅读 · 0 评论 -
python中的正则表达式
1. 精确匹配,如果直接给出字符,就是精确匹配。 (1)\d可以匹配一个数字; (2)\w可以匹配一个字母或数字; (3).点符号可以匹配任意字符; (4)*星符号表示任意个字符; (5)用+表示至少一个字符; (6)用?表示0个或1个字符; (7)用{n}表示n个字符; (8)用{n,m}表示n-m个字符; (9)\s可以匹配一个空格(也包括Tab等空白符; (10)由于'-...原创 2019-01-03 13:26:43 · 182 阅读 · 0 评论