爬取数据
小主早安
这个作者很懒,什么都没留下…
展开
-
XPath 语法网址:https://www.w3school.com.cn/xpath/xpath_syntax.asp
原创 2020-12-03 09:45:49 · 738 阅读 · 0 评论 -
数据爬取selenium模块
问题:selenium模块和爬虫之间具有怎样的关联?–便捷的获取网站中动态加载的数据–便捷的实现模拟登陆什么是selenium模块?–环境安装pip install selenium–下载一个浏览器驱动程序http://chromedriver.storage.googleapis.com/index.html一定要安装你电脑上安装的谷歌浏览器的版本去下载查看驱动和浏览器版本的映射关系:http://blog.csdn.net/huilan_same/article/details/51原创 2020-12-02 10:52:22 · 129 阅读 · 0 评论 -
python 爬取简历模板的下载地址
#!/usr/bin/env python# -*- coding:utf-8 -*-#需求:解析下载页面的链接地址http://pic.netbian.com/4kmeinv/# 对模板的首页进行解析# 每个简历模板的详情页拿到# 解析下载地址的链接import requestsfrom lxml import etreeif __name__ == '__main__': headers = { 'User-Agent': 'Mozilla/5.0 (Wi原创 2020-09-16 15:38:35 · 803 阅读 · 0 评论