1.dataframe对象,是我们常用的一个变量类型
2.我们读取股市数据的时候,数据经常以csv文件格式进行存放。csv是一个纯数据的格式,csv的意思是:comma seperate value。使用逗号分割的数据。
3.我们获取一下贵州茅台的日线行情,从2020-01-01~2020-12-01期间的数据,用来进行分析。这里使用tushare接口获取股票数据。获取内容如下:
4.我们获取的是一个dataframe类型的数据。假如我想获取返回的数据集中,第10~20行的数据,该如何操作呢?
5.获取返回股票数据集中的特定行的数据,就使用到了dataframe的数据切片功能。例如上面说的“获取返回的数据集中第10~20行的数据”。操作方式为df[10:21],返回结果如下:
6.绘制贵州茅台收盘价格的曲线图。
代码如下:
import pandas as pd
import matplotlib.pyplot as plt
def test_run():
df = pd.read_csv('data/600159.SH.csv')
print(df['close'])
df['close'].plot()
if __name__ == '__main__':
test_run()
图片输出如下:
注意一个问题哈,现在这个收盘价的顺序,是按照时间的逆序进行绘制的,因此熟悉茅台股价的朋友可能会感觉比较奇怪。
可以看到pandas的功能足够强大,不需要太多的代码就可以绘制折线图了。
7.绘制贵州茅台,开盘价和收盘价的两条曲线图。
输出的效果图如下:
这里只不过在上面的例子上做一个小小的修改,即使用了df[['close','open']].plot() ,进行了图片的绘制。
好的,本次就到这里了,这里学习了python数据分析中的基本的数据类型dataframe,以及如何读取股票数据,并使用dataframe类型进行操作和绘图等可视化操作。