好多天没有按部就班地学习,而是进行了高强度地探究实践:
周天下午接了一个单子,客户目前重复做着一项工作,没有技术含量但特别消耗人力资源:
每天从固定网站上下载200多份文件,操作只是“查询点另存为修改文件名保存”。不描述客户感受,大家脑补吧。
虽然我的主战场应该是用python做数据分析,但我遇到类似工作时,写过一些脚本,完美地解决过问题,所以答应客户试试。
详情不述,说说过程中遇到的问题和解决方案吧:
问题1:“另存为”弹窗不出来
我在使用python+selenium+Chrome模拟下载数据时,我的机器居然不弹出任何“另存为”的窗口,而是以默认名称和默认路径直接下载。这就无法按客户要求修改文件名和路径了。
此后发现,我每次打开的Chrome浏览器,和我日常用的浏览器设置不同,“下载前询问每个文件的保存位置”的开关每次打开都是关闭的。查了资料,原因是:为提升速度selenium每次打开的浏览器都是初始的开净浏览器,想要修改,需要设置webdriver.ChromeOptions()的参数。
【难度级别】:高。
原因:网上没有对python如何修改“下载前询问每个文件的保存位置”的现成答案。(环境:python+selenium+Chrome)
【解决方案】:
直接上脚本了:
options = webdriver.ChromeOptions()
pref = {‘profile.default_content_settings.popups’: 1, ‘download.default_