结合金融时间序列演示Pandas模块的操作(五)
由于 Pandas 是 Python 的外部第三方模块,在使用前需要导入,并查询 Pandas 的版本号信息。
>>>import pandas as pd
>>>pd.__version__ #查询Pandas的版本号
'1.0.1'
一、数据框的主要统计函数
(一)静态的统计函数
例1:从外部导入沪深300指数在2018年每日交易价格的数据并且生成一个新的数据框,具体代码如下:
-----------------------------------代 码----------------------------------------
>>>HS300_excel1 = pd.read_excel('C:/Desktop/配套彩图和数据/沪深300指数(2018年).xlsx',sheet_name="Sheet1",header=0,index_col=0) #导入外部数据
>>>HS300_excel1.head() #运用head函数查看数据框的头部(最前面5行)数据
----------------------------------输出结果-------------------------------------
开盘点位 最高点位 最低点位 收盘点位
日期
2018-01-02 4045.2086 4087.7789 4045.2086 4087.4012
2018-01-03 4091.4607 4140.0543 4088.7302 4111.3925
2018-01-04 4114.1213 4137.6420 4105.8858 4128.8119
2018-01-05 4133.3439 4151.2818 4123.2817 4138.7505
2018-01-08 4140.8545 4166.3182 4127.3081 4160.1595
-----------------------------------代 码---------------------------------------
>>>HS300_excel1.tail() #运用tail函数查看数据框的尾部(最末尾5行)数据
----------------------------------输出结果--------------------------------------
开盘点位 最高点位 最低点位 收盘点位
日期
2018-12-24 3015.4974 3040.3524 3007.3292 3038.1981
2018-12-25 3006.8787 3030.1418 2964.8750 3017.2815
2018-12-26 3012.8690 3029.0608 2996.4829 3002.0327
2018-12-27 3042.9491 3047.2348 2990.5057 2990.5057
2018-12-28 2994.7950 3024.3525 2984.8177 3010.6536
1. diff 函数
diff 函数主要用于计算一阶差分,注:diff 是差分英文 difference 的缩写。以例1中的数据框HS300_excel1为对象,具体示例如下:
-----------------------------------代 码---------------------------------------
>>>HS300_diff = HS300_excel1.diff()
>>>HS300_diff.head()
----------------------------------输出结果--------------------------------------
开盘点位 最高点位 最低点位 收盘点位
日期
2018-01-02 NaN NaN NaN NaN
2018-01-03 46.2521 52.2754 43.5216 23.9913
2018-01-04 22.6606 -2.4123 17.1556 17.4194
2018-01-05 19.2226 13.6398 17.3959 9.9386
2018-01-08 7.5106 15.0364 4.0264 21.4090
-----------------------------------代 码---------------------------------------
>>>HS300_diff.tail()
----------------------------------输出结果--------------------------------------
开盘点位 最高点位 最低点位 收盘点位
日期
2018-12-24 -39.8284 -17.0483 -0.2804 8.8030
2018-12-25 -8.6187 -10.2106 -42.4542 -20.9166
2018-12-26 5.9903 -1.0810 31.6079 -15.2488
2018-12-27 30.0801 18.1740 -5.9772 -11.5270
2018-12-28 -48.1541 -22.8823 -5.6880 20.1479
2.idxmax 和 idxmin 函数
idxmax 函数用于求最大值的行索引值,idxmin 函数用于求最小值的行索引值。注:idxmax 是英文 index maximum 的缩写,idxmin 是英文 index minimum 的缩写。具体示例如下:
-----------------------------------代 码----------------------------<