用python爬取股票网

最新推荐文章于 2024-08-09 22:54:05 发布

嘿，小胖墩

最新推荐文章于 2024-08-09 22:54:05 发布

阅读量1.6k

点赞数 6

分类专栏： Python爬虫文章标签： python json csv

本文链接：https://blog.csdn.net/zql200008/article/details/103717979

版权

本文介绍了如何使用Python爬取东方股票网站上的沪深个股信息。通过分析网页源代码，找到对应的JSON数据，并处理异常，去除多余内容，最终利用循环获取所有页面的数据，将其存储为CSV文件。

摘要由CSDN通过智能技术生成

东方股票网址：http://quote.eastmoney.com/center/gridlist.html#hs_a_board
找到沪深个股 在这里插入图片描述
F12刷新网页留意刷新出现的内容****找到对应的文件

复制URL查看是不是我们想要的内容

查看网址我们发现 pn=1 是第一页page=1 所以列一个循环就可以找到其他页面所有的信息

for i in range(1,193):
    url = 'http://50.push2.eastmoney.com/api/qt/clist/get?cb=jQuery1124002312725213714928_1577232380831&pn='+str(i)+'&pz=20&po=1&np=1&ut=bd1d9ddb04089700cf9c27f6f7426281&fltt=2&invt=2&fid=f3&fs=m:0+t:6,m:0+t:13,m:0+t:80,m:1+t:2,m:1+t:23&fields=f1,f2,f3,f4,f5,f6,f7,f8,f9,f10,f12,f13,f14,f15,f16,f17,f18,f20,f21,f23,f24,f25,f22,f11,f62,f128,f136,f115,f152&_=1577232380832'

导入相关文件包

import requests
import re
import json
import pandas as pd
import csv

当我们像平常那样调用json时发现这次无法取到内容然后查看它的text文件时发现前面多了这个
在这里插入图片描述
此时我们就需要将前面多余的去掉

for i in range(1,193):
    url = 'http://50.push2.eastmoney.com/api/qt/clist/get?cb=jQuery1124002312725213714928_1577232380831&pn='+str(i)+'&pz=20&po=1&np=1&ut=bd1d9ddb04089700cf9c27f6f7426281&fltt=2&am