![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
程序猿20
这个作者很懒,什么都没留下…
展开
-
Python爬虫相关技术(xpath和beautifulsoap)
一、xpathxpath用于定位html中的元素。/ 表示从根节点进行查找元素// 从匹配的当前节点来对文档的节点进行选择. 选取当前节点.. 选取当前节点的父节点@ 选择属性/html 选取根节点下的所有html元素,也就是整个html文档。/body/div 选取属于body的子元素中所有div元素。//div 选取所有div标签的子元素,不管在html文档...原创 2019-01-06 10:31:51 · 1432 阅读 · 0 评论 -
python中的正则表达式
1. 精确匹配,如果直接给出字符,就是精确匹配。(1)\d可以匹配一个数字;(2)\w可以匹配一个字母或数字;(3).点符号可以匹配任意字符;(4)*星符号表示任意个字符;(5)用+表示至少一个字符;(6)用?表示0个或1个字符;(7)用{n}表示n个字符;(8)用{n,m}表示n-m个字符;(9)\s可以匹配一个空格(也包括Tab等空白符;(10)由于'-...原创 2019-01-03 13:26:43 · 138 阅读 · 0 评论