系列文章持续更新中…
文章目录
前言
通过几篇学习笔记我们学习了Python数据分析必备的NumPy模块和pandas模块,这篇我们就来实战演练各种数据分析问题。
需要写的东西比较多,所以我们分为上下两篇来学习。
—————————————————————————————————
一、相关性分析
相关性分析的定义:
对多个可能具备相关关系的变量进行分析,得到衡量变量间的相关程度或密切程度。
A.获取股票价格
列表数据的含义:
a.获取日K线的股票价格
Tushare模块中的get_hist_data()函数可以获取日K线级别的股票价格。
eg:
import tushare as ts
import pandas as pd
pd.set_option(‘display.max_columns’,None)#强制显示所有列
data = ts.get_hist_data(‘000001’,start=‘2022-01-01’,end=‘2022-02-8’)#股票代码、起止实时间
print(data.head(10))#输出前10行数据
运行结果:
open high close low volume price_change p_change
date
2022-02-08 16.30 16.97 16.83 16.26 1754695.38 0.44 2.69
2022-02-07 16.02 16.41 16.39 15.89 1515476.38 0.56 3.54
2022-01-28 16.39 16.45 15.83 15.82 1675563.62 -0.47 -2.88
2022-01-27 16.50 16.54 16.30 16.25 1024643.12 -0.35 -2.10
2022-01-26 16.95 17.10 16.65 16.54 984975.19 -0.20 -1.19
2022-01-25 17.08 17.08 16.85 16.81 1093284.00 -0.35 -2.04
2022-01-24 17.34 17.38 17.20 16.98 874770.88 -0.15 -0.86
2022-01-21 17.45 17.56 17.35 17.21 1481682.88 0.02 0.12
2022-01-20 16.47 17.46 17.33 16.42 3031194.00 0.83 5.03
2022-01-19 16.54 16.69 16.50 16.36 988391.81 -0.02 -0.12
ma5 ma10 ma20 v_ma5 v_ma10 v_ma20
date
2022-02-08 16.400 16.723 16.818 1391070.74 1442467.73 1396215.49
2022-02-07 16.404 16.692 16.809 1258788.46 1382295.63 1366943.69
2022-01-28 16.566 16.675 16.814 1130647.36 1345116.94 1378707.93
2022-01-27 16.870 16.725 16.863 1091871.21 1387870.08 1334762.93
2022-01-26 17.076 16.793 16.886 1493181.39 1376348.03 1356999.46
2022-01-25 17.046 16.828 16.912 1493864.71 1428066.86 1364082.65
2022-01-24 16.980 16.884 16.930 1505802.79 1476938.40 1345974.40
2022-01-21 16.784 16.883 16.936 1559586.51 1480438.71 1326648.42
2022-01-20 16.580 16.868 16.934 1683868.94 1444933.49 1305543.07
2022-01-19 16.510 16.847 16.937 1259514.66 1252602.62 1202829.76
turnover
date
2022-02-08 0.90
2022-02-07 0.78
2022-01-28 0.86
2022-01-27 0.53
2022-01-26 0.51
2022-01-25 0.56
2022-01-24 0.45
2022-01-21 0.76
2022-01-20 1.56
2022-01-19 0.51
b.获取每分钟的股票价格
Tushare模块中的get_hist_data()函数可以获取每分钟的股票价格。
eg:
import tushare as ts
import pandas as pd
pd.set_option(‘display.max_columns’,None)#强制显示所有列
data = ts.get_hist_data(‘000001’,ktype=‘5’)#股票代码、,参数ktype表示获取数据类型
print(data.head(10))#输出前10行数据
运行结果:
open high close low volume price_change
date
2022-02-08 15:00:00 16.85 16.85 16.83 16.82 13038.70 -0.02
2022-02-08 14:55:00 16.84 16.85 16.85 16.83 25472.80 0.01
2022-02-08 14:50:00 16.85 16.85 16.85 16.83 24344.30 0.00
2022-02-08 14:45:00 16.84 16.85 16.85 16.83 22600.00 0.01
2022-02-08 1