python导入dat数据_python爬虫-持仓排名数据爬取!

摘要:笔记记录爬取上期所持仓数据的过程,本次爬取使用的工具是python,使用的IDE是pycharm

efb5e9d132bd6ef47e127c9d75b04c23.png

进群:864573496 获取源码!

一、查看网页属性,分析数据结构

在浏览器中打开上期所网页,按F12或者选择表格文字-右键-审查元素,调出控制台:

71ecc6a9d01425ab1af20b8f49b52c46.png

在Network中可以看到目标数据:http://www.shfe.com.cn/data/dailydata/kx/pm20190110.dat,其中 20190110 是数据代表的日期:

35b3b155617f877ef3d6af6c77184979.png

二、将数据下载到本地文件夹

1.在pycharm中新建一个python文档,将目标dat文件下载到本地文件夹,需要用到的包可以在CMD控制台中通过 ‘pip install [包名]’ 安装:

import xlwtimport requestsimport osmydate = "20190111" #指定需要的数据日期url = "http://www.shfe.com.cn/data/dailydata/kx/pm" + mydate + ".dat"root = "F://py//SQ//"path = root + url.split('/')[-1] + ".txt" #指定下载的目录,保存为txt文件r = requests.get(url)with open(path, 'wb') as f: f.write(r.content) f.close() print("文件保存成功")

2.运行代码后,可以看到文件夹中多了个pm20190111.dat.txt文件,用记事本打开文件,可以看到文件是Json格式的表格,接下来用json包将其解析成python的dataframe格式:

738b1a2754b13826bbe7ebb6a43a6573.png

代码:

import jsonfile = open("F://py//SQ//pm" + mydate + ".dat.txt
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值