近日需要对excel的csv文件进行处理,求取某银行历年股价的均值方差等一系列数据
文件的构成很简单,部分如下所示
总共有接近七千行数据,主要的工作就是将其中的股价数据提取出来,放入一个数组之中,然后利用numpy模块即可求出需要的数据。
这里利用了csv模块来对文件进行处理,最终实现的代码如下:
importcsvimportnumpy as np
with open('pingan_stock.csv') as csv_file:
row= csv.reader(csv_file, delimiter=',')
next(row)#读取首行
price = [] #建立一个数组来存储股价数据
#读取除首行之后每一行的第二列数据,并将其加入到数组price之中
for r inrow:
price.append(float(r[1])) #将字符串数据转化为浮点型加入到数组之中
print(np.var(price)) #输出均值
print(np.mean(price)) #输出方差
首先利用csv的reader方法,其中delimiter可有可无,它是一个分隔符,原本的值就是逗号,所以加不加无所谓
reader返回的是一个可以迭代的对象,需要使用for循环遍历,row的部分输出值如下: