Python爬虫
python爬虫学习笔记
small-white
面向百度编程(⊙ˍ⊙)
展开
-
BeautifulSoup库-标签解析遍历
目录BeautifulSoup库的介绍BeautifulSoup类的基本元素html的内容遍历BeautifulSoup库的介绍安装:pip install BeautifulSoup4<html> <body>标签树</body> ...</html>BeautifulSoup库是解析...原创 2020-09-22 11:46:10 · 4040 阅读 · 0 评论 -
正则表达式
目录正则表达式的概念正则表达式的语法常用的正则表达式python中Re库正则表达式的概念正则表达式是用来简洁表达一组字符串的表达式,正则表达式是一种通用的字符串表达框架,正则表达式是具有某一类特征的一组字符串,不依赖具体的语言,很多语言都支持正则表达式。'PY''PYY' ------>正则表达式:PY+'PYYY.....原创 2020-05-07 11:43:27 · 309 阅读 · 0 评论 -
Request库的使用
Request库:封装了自动爬取HTML页面,自动网络请求提交的方法的库Request库的7个主要方法:requests.request():构造一个请求,是一下个方法的基础 requests.get():获取HTML网页的主要方法,对应于HTTP的GET requests.head():获取HTML网页头部信息的方法,对应HTML的HEAD requests.post():向HTM...原创 2020-05-07 11:16:07 · 623 阅读 · 0 评论