爬取数据
小主早安
这个作者很懒,什么都没留下…
展开
-
XPath 语法网址:https://www.w3school.com.cn/xpath/xpath_syntax.asp
原创 2020-12-03 09:45:49 · 754 阅读 · 0 评论 -
数据爬取selenium模块
问题:selenium模块和爬虫之间具有怎样的关联? –便捷的获取网站中动态加载的数据 –便捷的实现模拟登陆 什么是selenium模块? –环境安装pip install selenium –下载一个浏览器驱动程序 http://chromedriver.storage.googleapis.com/index.html 一定要安装你电脑上安装的谷歌浏览器的版本去下载 查看驱动和浏览器版本的映射关系: http://blog.csdn.net/huilan_same/article/details/51原创 2020-12-02 10:52:22 · 136 阅读 · 0 评论 -
python 爬取简历模板的下载地址
#!/usr/bin/env python # -*- coding:utf-8 -*- #需求:解析下载页面的链接地址http://pic.netbian.com/4kmeinv/ # 对模板的首页进行解析 # 每个简历模板的详情页拿到 # 解析下载地址的链接 import requests from lxml import etree if __name__ == '__main__': headers = { 'User-Agent': 'Mozilla/5.0 (Wi原创 2020-09-16 15:38:35 · 816 阅读 · 0 评论