firefox浏览器查看请求头、响应头_python伪造多个浏览器请求头,对同花顺的股票数据进行爬取...

本文介绍了如何通过Python模拟Firefox浏览器发送请求头来爬取同花顺网站上的股票代码数据。代码示例展示了具体实现过程,并提供了运行结果,包括一系列股票代码。
摘要由CSDN通过智能技术生成

代码如下:

#本段代码作用:找出2019年10月15日同花顺网站当天资金流入流出较大的个股代码#下面是导入相应的模块import requestsfrom bs4 import BeautifulSoupimport random#1、对网站进行get请求,并构造多个浏览器请求头url="http://data.10jqka.com.cn/funds/ggzjl/" #设置同花顺资金流向网站为urlagent1="Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:69.0) Gecko/20100101 Firefox/69.0" #设置agent1请求头agent2="Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36" #设置agent2请求头agent3="Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36" #设置agent2请求头list1=[agent1,agent2,agent3] #设置agent1,agent2,agent3为列表list1里的元素agent=random.choice(list1) #随机获取list里的元素并赋值给agentheaders={"User-Agent":agent} #设置请求头,参数为agentresponse=requests.get(url,headers=headers) #对网站进行get请求,并伪装成浏览器进行请求response.encoding="GBK" #设置网页编码html=response.text #将网页的源代码赋值给html#2、解析网站soup=BeautifulSoup(html,'lxml')content=soup.findAll('a') #遍历网页的a标签内容并赋值给contentfor stock in content: #遍历a标签内的内容 if stock.get("class")==["stockCode"]: #假如a标签内的class属性的值为["stockCode"] print(stock.text) #打印出a标签里的内容

运行结果如下:

603786

600568

000659

600393

300167

300319

300169

002351

000987

601886

002625

000677

002515

300119

002045

002524

300792

603041

002930

000533

002655

300304

300359

300598

300613

300192

300246

002101

002243

002868

300280

603477

002181

600212

000532

002161

300273

002209

300242

002492

002141

000507

600809

002325

300454

300593

300525

300777

300306

000025

图片示例如下:

4c8acd5b7a8802298487adbe2d49e373.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值