1.#读入数据集的文件
#注意文件的路径问题,在wi ndows下2种路径表达都是可以的:
#"C:\\Users\\lun\\Documents\\教学\\程序设计与数据分析python\\数据集\\stock.csvn 或者 #”C:/users/lun/Documents/教学/程序设计与数据分析 python/数据集/stock, csv”
c,v = np.loadtxt(” C:/users/un/Documents/教学/程序设计与数据分析 python/数据
集/stock . csv",delimiter=',',usecols=(3,6),skiprows=l,unpack=True,comments='#')
#参数usecols=(3,6)表示取数据集的第3和第6列。索引从0开始;
#skiprows=l«示跳过第1行,因为第一行是列名;
#unpack=True表示会把每一列当成一个向量输出,而不是合并在一起
# comments=,#'表示,如果数据的某一行的开头是#,就跳过这行,不读取这行数据;
2.#算术平均值函数 np. mean (c)==np. ave rage (c)
mean = np.mean(c)
3.#VWAP :成交量加权平均价格。
#被统计的数据就是C和V;
vwap = np.average(c,weights=v)
4.最大值和最小值统计
#high取第4列,是某只股票的最高价,low取第5列是最低价;每行代表1天的数据;
high, low = np.loadtxt("C: /Users/ un/Documents/教学/程序设计与数据分析 python/数据 集/stock. csv" ,delimiter=',', usecol s=(4,5) ,ski prows=l, unpack=True, comments=' #')
#统计最高价的最大值和最低价的最小值
highest = np.max(h)
lowest = np.min(l)
#ptp函数可以计算数组的取值范围,返回数组元素的最大值和最小值之间的差值
spread_high_price = np.ptp(high)
spread_low_price = np.ptp(low)
5.
#计算中位数
median = np.median(c)
#计算方差
variance = np.var(c)
6.
#标准差
np.std()
#对数
np.log()