akshare库 | A股股票价格指数数据获取

最新推荐文章于 2025-04-05 10:00:00 发布

邓旭东HIT

最新推荐文章于 2025-04-05 10:00:00 发布

阅读量1w

点赞数 4

文章标签： python 人工智能数据挖掘编程语言数据分析

本文链接：https://blog.csdn.net/weixin_38008864/article/details/111026804

版权

本文介绍如何使用Python的akshare库抓取A股市场数据，包括股票数据总貌、实时行情、历史行情等，并探讨了股票数据复权的重要性及方法。此外，还提供了次新股和股票指数的实时数据抓取示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

腾讯课堂 | Python网络爬虫与文本分析(戳一戳)~~

A股

函数	类型	功能
ak.stock_sse_summary()	数据总貌	当日上海证券交易所-股票数据总貌
ak.stock_szse_summary()	数据总貌	当日深圳证券交易所-股票数据总貌
ak.stock_zh_a_spot()	实时行情	单次返回所有 A 股上市公司的实时行情数据
ak.stock_zh_a_daily(symbol, start_date, end_date, adjust)	历史行情数据	某股票的历史行情数据

数据总貌

数据源

上交所: http://www.sse.com.cn/market/stockdata/statistic/
深交所: http://www.szse.cn/market/overview/index.html

代码

ak.stock_sse_summary() 当前交易日(周六周日以周五收盘为准)上海证券交易所-股票数据总貌
ak.stock_szse_summary() 当前交易日(周六周日以周五收盘为准)深圳证券交易所-股票数据总貌

import akshare as ak

#当前上交所交易日
ak.stock_sse_summary()

	type	item	number
0	总貌	上市公司/家	1774
1	总貌	总股本/亿股（份）	42333.54
2	总貌	总市值/亿元	449338
3	总貌	平均市盈率/倍	16.53
0	总貌	上市股票/只	1817
1	总貌	流通股本/亿股（份）	37055.18
2	总貌	流通市值/亿元	372768.37
0	主板	上市公司/家	1575
1	主板	总股本/亿股	41719.30
2	主板	总市值/亿元	417542.76
3	主板	平均市盈率/倍	15.70
0	主板	上市股票/只	1618
1	主板	流通股本/亿股	36894.08
2	主板	流通市值/亿元	363550.23
0	科创板	上市公司/家	199
1	科创板	总股本/亿股（份）	614.24
2	科创板	总市值/亿元	31795.24
3	科创板	平均市盈率/倍	93.84
0	科创板	上市股票/只	199
1	科创板	流通股本/亿股（份）	161.10
2	科创板	流通市值/亿元	9218.14

#当前上交所交易日
ak.stock_szse_summary()

	证券类别	数量(只)	成交金额(元)	成交量	总股本	总市值	流通股本	流通市值
0	股票	2284	464774868848.30	36234796444	2221596655427	27065137543076.86	1815555842156	21045462688142.41
1	主板A股	460	97759499936.17	9928147626	815786337216	7864786582883.69	715360951728	6943989894131.95
2	主板B股	46	86268155.78	25628042	12626767818	47596578540.85	12496639543	47063848276.06
3	中小板	960	201352604926.08	16183241554	959049045001	11307409526445.99	751639655163	8669554702599.64
4	创业板A股	818	165576495830.27	10097779222	434134505392	7845344855206.33	336058595722	5384854243134.76
5	基金	551	13625235438.85	8488174062	178495219217	241727724562.97	178495219217	241727724562.97
6	ETF	100	11654359536.03	6298875097	97160183202	162829410392.12	97160183202	162829410392.12
7	LOF	250	733576824.21	905627751	41299172130	40431564774.31	41299172130	40431564774.31
8	封闭式基金	1	552757.10	5900	811761500	762244048.50	811761500	762244048.50
9	分级基金	200	1236746321.50	1283665314	39224102385	37704505348.03	39224102385	37704505348.03
10	债券	7175	137138889356.15	1267097444
11	债券现券	6600	29113574087.95	184874494	0	36839310540657.21	1773035501300	1823573039491.96
12	债券回购	13	105459181000.00	1055429160
13	ABS	562	2566134268.20	26793790	488157240326	484463227241.83	488157240326	484463227241.83
14	期权	108	244155964.00	374868

股市实时行情

ak.stock_zh_a_spot() 单次返回所有 A 股上市公司的实时行情数据

注意: 重复运行本函数会被新浪暂时封 IP, 建议增加时间间隔

new_df = ak.stock_zh_a_spot()

new_df.to_csv('data/沪深实时行情数据.csv')
new_df.head()

Please wait for a moment: 100%|██████████| 52/52 [00:29<00:00,  1.75it/s]

	symbol	code	name	trade	pricechange	changepercent	buy	sell	settlement	open	high	low	volume	amount	ticktime	per	pb	mktcap	nmc	turnoverratio
0	sh600000	600000	浦发银行	10.17	-0.07	-0.684	10.16	10.17	10.24	10.24	10.25	10.05	47336450.0	479183315.0	15:00:00	5.215	0.582	2.985112e+07	2.985112e+07	0.16127
1	sh600004	600004	白云机场	14.99	-0.12	-0.794	14.99	15.00	15.11	15.15	15.28	14.95	8879917.0	133815978.0	15:00:18	31.229	1.935	3.547711e+06	3.101911e+06	0.42912
2	sh600006	600006	东风汽车	6.35	0.01	0.158	6.34	6.35	6.34	6.25	6.66	6.14	77593723.0	501942922.0	15:00:00	28.707	1.636	1.270000e+06	1.270000e+06	3.87969
3	sh600007	600007	中国国贸	12.92	-0.10	-0.768	12.92	12.93	13.02	12.99	13.05	12.88	1529840.0	19789398.0	15:00:00	13.320	1.668	1.301409e+06	1.301409e+06	0.15188
4	sh600008	600008	首创股份	3.04	-0.01	-0.328	3.03	3.04	3.05	3.05	3.05	3.02	32314837.0	98099591.0	15:00:18	18.031	1.447	2.231540e+06	2.231540e+06	0.44022

股票历史行情数据

ak.stock_zh_a_daily(symbol, start_date, end_date, adjust) 某股票的历史行情数据（考虑复权）
ak.stock_zh_a_cdr_daily(symbol, start_date, end_date) 某股票的历史行情数据（不考虑复权）

symbol 股票代码，symbol='sh600000'; 股票代码可以在 ak.stock_zh_a_spot() 中获取
start_date 开始查询的日期;start_date='20201103';
end_date 结束查询的日期;start_date='20201106';
adjust 默认返回不复权的数据; qfq: 返回前复权后的数据; hfq: 返回后复权后的数据; hfq-factor: 返回后复权因子; hfq-factor: 返回前复权因子

#万科A 后复权
sz000002 = ak.stock_zh_a_daily(symbol = 'sz000002', 
                               start_date = '20201103', 
                               end_date = '20201116', 
                               adjust = 'hfq')
sz000002

	open	high	low	close	volume	outstanding_share	turnover
date
2020-11-03	4010.19	4031.67	3982.98	4014.48	61766600.0	9.714315e+09	0.006358
2020-11-04	4017.35	4045.99	3995.87	4033.10	45499180.0	9.714315e+09	0.004684
2020-11-05	4074.64	4204.97	4054.59	4189.21	120119594.0	9.714315e+09	0.012365
2020-11-06	4202.10	4235.04	4157.70	4219.29	85288066.0	9.714315e+09	0.008780
2020-11-09	4256.53	4276.58	4180.62	4235.04	81118542.0	9.714315e+09	0.008350
2020-11-10	4253.66	4312.38	4182.05	4200.67	61377060.0	9.714315e+09	0.006318
2020-11-11	4206.40	4332.43	4189.21	4263.69	88521186.0	9.714315e+09	0.009112
2020-11-12	4262.26	4269.42	4207.83	4262.26	45905719.0	9.714315e+09	0.004726
2020-11-13	4233.61	4252.23	4129.06	4160.57	66013466.0	9.714315e+09	0.006795
2020-11-16	4209.26	4225.02	4153.41	4182.05	51657638.0	9.714315e+09	0.005318

#九号公司 后复权
sh689009 = ak.stock_zh_a_cdr_daily(symbol='sh689009', 
                                   start_date='20201103', 
                                   end_date='20201116')

sh689009

	open	high	low	close	volume
date
2020-11-03	56.50	59.55	53.36	57.39	25121445.0
2020-11-04	57.45	57.80	51.90	54.40	20846450.0
2020-11-05	55.95	65.28	54.60	61.00	28843507.0
2020-11-06	59.80	68.60	59.48	68.60	23162768.0
2020-11-09	70.50	71.68	63.50	68.04	22494134.0
2020-11-10	68.00	70.70	65.11	67.93	15952778.0
2020-11-11	65.80	65.91	55.70	56.00	23125126.0
2020-11-12	56.00	61.66	55.04	58.89	18607788.0
2020-11-13	58.08	63.88	55.50	61.18	14904776.0
2020-11-16	62.18	73.42	62.18	73.42	17134827.0

股票数据复权

为何要复权？

由于股票存在配股、分拆、合并和发放股息等事件，会导致股价出现较大的缺口。若使用不复权的价格处理数据、计算各种指标，将会导致它们失去连续性，且使用不复权价格计算收益也会出现错误。为了保证数据连贯性，常通过前复权和后复权对价格序列进行调整。

前/后复权

前复权：保持当前价格不变，将历史价格进行增减，从而使股价连续。前复权用来看盘非常方便，能一眼看出股价的历史走势，叠加各种技术指标也比较顺畅，是各种行情软件默认的复权方式。这种方法虽然很常见，但也有两个缺陷需要注意。

为了保证当前价格不变，每次股票除权除息，均需要重新调整历史价格，因此其历史价格是时变的。这会导致在不同时点看到的历史前复权价可能出现差异。
对于有持续分红的公司来说，前复权价可能出现负值。

后复权：保证历史价格不变，在每次股票权益事件发生后，调整当前的股票价格。后复权价格和真实股票价格可能差别较大，不适合用来看盘。其优点在于，可以被看作投资者的长期财富增长曲线，反映投资者的真实收益率情况。

在量化投资研究中普遍采用后复权数据。

次新股

次新股的内涵是伴随着时间的推移而相应变化的。一般来说一个上市公司在上市后的一年之内如果还没有分红送股，或者股价未被市场主力明显炒作的话，基本上就可以归纳为次新股板块。

在临近年末的时候，次新股由于上市的时间较短，业绩方面一般不会出现异常的变化，这样年报的业绩风险就基本不存在，可以说从规避年报地雷的角度来说，次新股是年报公布阶段相对最为安全的板块。

ak.stock_zh_a_new() 单次返回所有次新股行情数据

stock_zh_a_new = ak.stock_zh_a_new()
stock_zh_a_new

	symbol	code	name	open	high	low	volume	amount	mktcap	turnoverratio
0	sh601187	601187	厦门银行	12.570	13.170	12.350	74632241	945261894	3.409753e+06	28.27913
1	sh601568	601568	北元集团	10.680	10.690	10.600	9001838	95636552	3.831389e+06	2.49282
2	sh601686	601686	友发集团	18.520	18.530	16.670	51503291	894388433	2.409527e+06	36.26992
3	sh601995	601995	中金公司	63.120	64.500	63.120	20614330	1316269163	3.074480e+07	7.92010
4	sh605007	605007	五洲特纸	26.500	27.740	26.250	8811473	236972185	1.094027e+06	22.02318
...	...	...	...	...	...	...	...	...	...	...
56	sz300912	300912	N凯龙	52.110	62.000	52.110	18688767	1057407739	6.723678e+05	70.35515
57	sz300913	300913	N兆龙	46.000	49.000	42.610	18983847	846349678	5.243000e+05	65.35439
58	sz300915	300915	C海融	114.500	119.900	112.020	3061254	354136685	6.882000e+05	20.40836
59	sz300916	300916	C朗特	131.310	132.450	128.000	1860798	241749029	5.488562e+05	17.47228
60	sz300999	300999	金龙鱼	70.680	73.500	70.350	38273116	2759133209	3.891618e+07	10.72862

61 rows × 10 columns

实时股票指数

股票指数数据是从新浪财经获取的数据, 单次返回所有指数的实时行情数据

ak.stock_zh_index_spot()

stock_zh_index_spot = ak.stock_zh_index_spot()
stock_zh_index_spot

	symbol	name	trade	pricechange	changepercent	buy	sell	settlement	open	high	low	volume	amount	code	ticktime
0	sh000001	上证指数	3418.1683	-26.413	-0.767	0	0	3444.5814	3446.6478	3449.5782	3414.5157	226637068	302027699336	000001	14:35:44
1	sh000002	Ａ股指数	3582.8628	-27.724	-0.768	0	0	3610.5867	3612.7568	3615.8247	3579.0180	226381147	301317674983	000002	14:35:44
2	sh000003	Ｂ股指数	241.8948	-0.266	-0.110	0	0	242.1604	242.1342	243.1541	241.8584	163763	85839534	000003	14:35:44
3	sh000004	工业指数	2947.2927	-9.719	-0.329	0	0	2957.0117	2961.3935	2968.1859	2944.6006	137180458	205555767576	000004	14:35:44
4	sh000005	商业指数	3301.6900	-29.175	-0.876	0	0	3330.8647	3331.3814	3338.8347	3298.9413	19724411	25950366660	000005	14:35:44
...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...
574	sz399998	中证煤炭	1321.328	-12.350	-0.926	0.000	0.000	1333.678	1337.886	1353.352	1320.545	958502075	6118036849	399998	14:35:48
575	sz980001		1651.641	-17.535	-1.051	0.000	0.000	1669.176	1672.031	1672.031	1645.795	2025251235	62688545758	980001	14:35:46
576	sz980017		9298.405	38.813	0.419	0.000	0.000	9259.592	9449.973	9503.928	9292.864	645687353	26628573265	980017	14:35:46
577	sz980023		2909.856	-12.650	-0.433	0.000	0.000	2922.506	2925.469	2929.047	2898.435	735892399	15645491947	980023	14:35:46
578	sz980068		2067.003	-5.000	-0.241	0.000	0.000	2072.003	2069.611	2075.733	2063.185	1085307561	8359514808	980068	14:35:46

579 rows × 15 columns

近期文章Python网络爬虫与文本数据分析
bsite库 | 采集B站视频信息、评论数据

爬虫实战 | 采集&可视化知乎问题的回答
pdf2docx库 | 转文件格式，支持抽取文件中的表格数据
rpy2库 | 在jupyter中调用R语言代码
tidytext | 耳目一新的R-style文本分析库
reticulate包 | 在Rmarkdown中调用Python代码
plydata库 | 数据操作管道操作符>>
plotnine: Python版的ggplot2作图库

七夕礼物 | 全网最火的钉子绕线图制作教程

读完本文你就了解什么是文本分析

文本分析在经管领域中的应用概述  
综述:文本分析在市场营销研究中的应用

plotnine: Python版的ggplot2作图库
小案例: Pandas的apply方法  
stylecloud:简洁易用的词云库 
用Python绘制近20年地方财政收入变迁史视频  
Wow~70G上市公司定期报告数据集

漂亮~pandas可以无缝衔接Bokeh  
YelpDaset: 酒店管理类数据集10+G  


“分享”和“在看”是更好的支持！

代码链接:https://pan.baidu.com/s/12peR3mrLAG5wHwdk-vcWSA 密码:41d4