python爬虫
山高而路远
这个作者很懒,什么都没留下…
展开
-
python BeautifulSoup解析网页
BeautifulSoup是python的HTML/XML解析工具,其是python爬虫重要的模块,解析效果很好,下面就开始学习BeautifulSoup学习。 BeautifulSoup在命令行模式下安装: pip install BeautifulSoup #现在安装的是BeautifulSoup4 python可用的解析器如下: python标准库 BeautifulSoup...原创 2019-11-04 22:10:04 · 526 阅读 · 0 评论 -
python正则表达式高级部分
python3正则表达式,re模块匹配高级部分 \w:匹配[a-zA-Z0-9_] \s:匹配[\r\t\n\f\v] re.S:将换行符当作字符串匹配 re.M:多行分别匹配 \A:匹配整个字符串开始,即使多行re.M和re.S都是 \Z:匹配整个字符串结尾,即使多行re.M和re.S都是 \b:匹配单词边界 \B:匹配非单词边界 (?#注释内容):注释,此处不匹配 (?imsuxL):指定...原创 2019-10-13 22:49:07 · 241 阅读 · 0 评论 -
python爬虫----拉勾网爬虫实践
实现内容:按照城市(程序内列出部分主要城市,可自行在程序中更改)抓取拉勾网的特定职位信息,默认30页 程序运行方法:python3lagou_JobSearch.py 索索岗位名称(中文/英文) 爬虫结果文件自动保存到 city_搜索名称.tsv文件中 第一层:导入模块和程序 requests:网页请求模块 time:主要是等待一段时间,避免频繁访问网页而被禁止访问请求 sys...原创 2019-09-28 21:14:24 · 439 阅读 · 0 评论