python
狗炜别叫我打游戏
这个作者很懒,什么都没留下…
展开
-
实战篇之二:使用class_name定位多页信息
经过上一篇介绍,我们已经基本完成了我们的目标,但其中还存在很多问题: 1、页面时动态的,更新了当前Xpath路径就不再指向刚才的目标了 2、如何爬取整一页,爬取多页操作 通过本篇文章将进行一一解答上述存在的问题 首先来分析页面Xpath路径的特点,想要知道内在关系,只好一层一层剥开 先以两个利好的Xpath为例子进行比较Xpath路径:/html/body/d...原创 2018-06-21 15:30:51 · 1096 阅读 · 0 评论 -
Python + Selenium 入门爬虫——环境介绍及搭建
为何突然间要写博客呢?答:为了完成期末Python作业,被逼的。哈哈哈哈!博客之旅从此开始1.1 为什么要学爬虫 举个例子:有一天你老板叫你去股市找出哪些股票会涨,what??? 我要是能够预测,我tm...... 作为员工,我们唯一的办法就是服从,可能这就是变相炒鱿鱼的理由吧,哈哈哈哈! 废话不多说,开始我们的搜索,首先打开选股宝网站(不是广告,捂脸) http...原创 2018-06-18 16:44:31 · 615 阅读 · 0 评论 -
实战篇之一:使用Xpath定位相关信息
上一篇我们已经配置好环境了,验证通过模拟浏览器访问选股宝网站并关闭浏览器,当然我们想要的是要得到选股宝相关的股票信息,比如抓取以下的股票信息:我想得到利好股票有哪一些 问题:怎么抓? 回答:先定位 问题:怎么定位? 回答:采用Xpath方式定位...原创 2018-06-20 09:11:31 · 311 阅读 · 0 评论