python语言中numpy和pandas模块是处理数据的利器,除此之外,继续向大家介绍Scipy模块,这个模块专门运用于统计和优化技术,本文主要讲述Scipy模块在统计中的运用。
第二篇:运用Scipy模块实现统计技术
导语:python语言中numpy和pandas模块是处理数据的利器,除此之外,继续向大家介绍Scipy模块,这个模块专门运用于统计和优化技术,本文主要讲述Scipy模块在统计中的运用。
统计学基础知识
开始之前,我们先导入Scipy模块
In [1]:
import numpy as np
import pandas as pd
import scipy.stats as stats
1.理解平均数和变异性
平均数也叫做集中趋势量数,一般有三种形式:均值、中位数和众数。
平均数 | 公式 |
---|---|
均值(mean) | 数据组中所有数值的总和除以该组数值的个数 |
中位数(median) | 数据组中数据的中点。中位数对极值不敏感,均值对极值敏感。 |
众数(mode) | 数据组中出现数据最多的数值 |
python实现:
In [2]:
#获取平安银行过去20个交易日的收盘价数据,形成一个列表。
x_list=list(get_price('000001.SZ', None, '20180125', '1d', ['close'], True, None, 20, is_panel=1)['close'].values)
print('平安银行过去20日收盘价均值:{}'.format(np.mean(x_list)))
print('平安银行过去20日收盘价中位数:{}'.format(np.median(x_list)))
print('平安银行过去20日收盘价众数:{}'.format(np.argmax(np.bincount(x_list))))
平安银行过去20日收盘价均值: