1. 背景介绍
- 我们在使用selenium爬取数据时,有时会需要选择日期,来获取某个时间段的数据。但是网上的日期控件还真是五花八门,有正常一点的:
- 淘宝联盟上的
![](https://i-blog.csdnimg.cn/blog_migrate/4886fd28a1121f1e97285842be2c7f39.png)
- 有这样的:
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/fd0496b68cf985a3a8ae54b5da9a55fc.png)
- 当然还有这样的:
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/78f201bc0120406a62ef77468eb1ae06.png)
- 简单点的,我们还可以模拟鼠标点击,拖动的方式。但是复杂点的,那就完蛋了,该怎么办呢?
- 其实很简单,不管我们是通过什么方式选的,最终往服务器上发送的都是我们选定的日期数据,那么我们就不用去搞什么时间日期控件了,好好研究一下,我们手动选择的日期数据,是存储在页面的哪个位置,又是如何发送给服务器的,那就简单了。
- 可喜的是,大部分的日期控件,我们都可以把它当成一个普通的input框处理,对value进行赋值操作。
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/4e8dfd94941d12d0c5dd508422b461b7.png)
- 也有一些类型的input框都是禁止手动输入的,那就用js代码把禁止输入的readonly属性去掉就好。
2. 代码示例
from selenium import webdriver
from time import sleep
driver = webdriver.Firefox()
driver.get('http://www.sucaijiayuan.com/api/demo.php?url=/demo/20141108-1/')
driver.switch_to.frame('iframe')
js = "$('input[id=txtBeginDate]').attr('readonly','')"
driver.execute_script(js)
driver.find_element_by_id('txtBeginDate').send_keys('2016-08-24')
sleep(2)
print(driver.find_element_by_id('txtBeginDate').get_attribute('value'))
driver.quit()
- 如同验证码一样,有点击位置等各种奇怪的验证码,你去选的话很麻烦,想办法绕过去才是真理。