北上资金 python_股票数据抓取——北上基金持股数据(selenium抓取数据),爬取,之,北向,资金,通过...

使用Python的selenium库模拟网页浏览以规避爬虫限制,抓取北上资金持股数据。通过设置日期,点击搜索按钮并解析页面源码来获取所需信息。
摘要由CSDN通过智能技术生成

目前很多网站对爬虫都有防范措施,传统的爬数据方法不一定有效。我们只能曲线救国,通过模拟网页浏览方式爬取数据,虽然速度慢,既能达到目标又不会网站服务器增加压力,双赢吧。

Python环境要先下载selenium模块,在工作目录下要下载相应浏览器的驱动,我这里用firefox,下载geckodriver。

具体代码如下:

from selenium import webdriver

import tushare as ts

#批量爬取北向资金数据函数

def getNorthFundDateData(brow,url,dates): #本函数金更新持有数量,另一函数刷新个股股价

tryTimes = 3

#brow.refresh()

#time.sleep(1)

brow.get(url)

time.sleep(1)

errorDate = []

for date in dates:

try:

inputDate = brow.find_element_by_id('txtShareholdingDate')

brow.execute_script("arguments[0].value = '" + date.replace('-','/') + "';", inputDate) # 直接用js修改input的值

brow.find_element_by_id('btnSearch').click()

brow.implicitly_wait(10)

#baseData =

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值