![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
尘世猫
一个会画工图的程序猿
展开
-
scrapy库
scrapy爬虫框架 爬虫框架是实现爬虫功能的一个软件结构和功能件组合 Scrapy是用纯Python实现一个为了爬取网站数据、提取结构性数据而编写的应用框架,用途非常广泛。 框架的力量,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片,非常之方便。 Scrapy 使用了 Twisted’twɪstɪd异步网络框架来处理网络通讯,可以加快我们的下载速度,不用自己去实...原创 2020-03-24 10:58:39 · 443 阅读 · 0 评论 -
正则表达式 Re库
正则表达式 通用的字符串表达框架 语法 操作符 说明 实例 . 表示任何单个字符 [ ] 字符集 ,对单个字符给出取值范围 [abc] 表示abc,[a-z]表示a-z单个字符 [^] 非字符集,对单个字符给出排除范围 [^abc] 表示除了abc外的单个字符 * 前一个字符0次或无限次扩充 abc*表示ab、abc、abcc等等 + 前一个字符1次或无限次扩充 ...原创 2020-03-23 14:42:49 · 220 阅读 · 0 评论 -
BeautifulSoup库
Beautiful Soup 能够解析、遍历、维护“标签树”的功能库 from bs4 import BeautifulSoup soup=BeautifulSoup('<p>data</p>',"html.parser") soup2=BeautifulSoup(open("D://demo.html"),"html.parser") # data表示待解释内容 ht...原创 2020-03-23 14:02:20 · 84 阅读 · 0 评论 -
Requests库
requests库介绍 import requests r=request.get(url) 此方法构造一个向服务器请求资源的Rquest对象,返回一个Response对象原创 2020-03-21 15:43:56 · 192 阅读 · 0 评论