ChatGPT炒股:自动批量下载萝卜投研网站上的股票研报

文章讲述了如何利用Python的Selenium库接管已打开的Chrome浏览器,通过查找特定URL的标签页和含有PDF下载链接的元素,实现批量下载萝卜投研网站上的股票研究报告。下载的文件保存在本地的‘研报’文件夹中,并提供了开启Chrome远程调试的方法以及创建批处理脚本的建议。
摘要由CSDN通过智能技术生成

萝卜投研网站有很多的股票研究报告。

如果我们在chrome浏览器中打开了很多研报,该如何批量下载呢?

查看网页源代码,研报是pdf格式,下载链接也在源代码中,很好找。

下载方法是,用Selenium来接管已经运行的Chrome浏览器,然后通过Selenium来下载。要使用Selenium,首先要去下载chrome浏览器对应的Chromedriver.exe

然后在ChatGPT中输入提示词如下:

你是一个Python编程专家,现在要完成一个下载网页PDF文件的任务。一个chrome浏览器已经打开,需要使用Selenium来已经打开的接管已经运行的Chrome,然后从chrome浏览器中tab页里面下载PDF文件。

下面是具体步骤:

设置好Chromedriver,Chromedriver.exe的文件地址是 C:\Users\dell\.cache\selenium\chromedriver\win32;

打开Selenium,接管已经运行的Chrome浏览器;

定位chrome浏览器中所有包含“https://robo.datayes.com”这样URL的tab标签页,比如:https://robo.datayes.com/v1.5/information/externalReport/5167973、

https://robo.datayes.com/v1.5/information/externalReport/5129987

定位页面中所有href值中包括“https://bigdata-s3.wmcloud.com/researchreport”的元素,

如:href="https://bigdata-s3.wmcloud.com/researchreport/2023-03/06e9292ef4b4523b2368a077dc34205b.pdf?download=true"

提取其href值作为PDF文件下载地址;

下载PDF文件,保存到电脑d盘的名为“研报”的文件夹;

关闭chrome浏览器上的这个标签页;

先关闭当前的chrome浏览器,然后在cmd中输入指令:

chrome.exe --remote-debugging-port=9222,打开chrome的远程调试

然后,在Python编译器中运行代码,就可以看到所有研报已经下载好了。

如果要经常打开chrome的远程调试,还可以写一个简单的bat脚本,以后双击运行就可以了:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值