python_数据分析
forest_sz
这个作者很懒,什么都没留下…
展开
-
蜡烛图、美国图绘图及标记
来源:https://www.joinquant.com/view/community/detail/92d2ccab2d412dbfa7df366369e6373b?type=1import numpy as npimport pandas as pdimport empyrical as epimport statsmodels.api as smimport alphalens as alfrom alphalens import plottingimport alphalens.pe转载 2021-03-08 09:28:50 · 536 阅读 · 0 评论 -
alphalens_python_数据分析_14
alphalens学习,测试的过程中发现一个超强单因子factor_data = alphalens.utils.get_clean_factor_and_forward_returns(my_factor, pricing, quantil原创 2020-07-15 17:06:34 · 601 阅读 · 1 评论 -
BarraFactor_python_数据分析_13
用alphalens跑了一遍Barra风格因子,NLSize和resid(特异收益率)都有未来所以没有参考意义,其他的风格因子表现倒是不错,尤其是价值因子BP和EY的表现比较出乎意料。原创 2020-07-15 09:56:19 · 1388 阅读 · 2 评论 -
因子去极值和标准化_Barra_python_数据分析_12
#因子去极值及标准化def normal(a): Func = lambda a:(a-a.mean())/a.std() norm = a.apply(Func) return normdef winsorize(a,limit=3): def func(a): a[a<a.mean()-a.std()*limit] = a.mean() - a.std()*limit a[a>a.mean()+a.std()*limit]原创 2020-06-30 13:47:53 · 2226 阅读 · 1 评论 -
最大回撤相关_python_数据分析_11
你知道茴字的三种写法吗?import pandas as pdimport numpy as np#最大回撤a=[1,3,6,8,9,9,13,15,20,25,24,20,24,23,26]hcv=[]for i in range(len(a)): maxa=max(a[:i+1]) hc=1-a[i]/maxa hcv.append(hc)#print(hcv)print('最大回撤率:%s' % max(hcv))def maxdrawdown(arr):原创 2020-06-29 08:46:26 · 522 阅读 · 0 评论 -
lambda_apply函数应用_python_数据分析_10
向量运算_python_数据分析_10最近在学习Barra多因子模型,发现计算beta的时候速度特别慢:数据长成这样子,是全市场个股收益率矩阵def halflife(half_life = 63, length = 252): #半衰期为63个交易日的指数加权移动平均 t = np.arange(length) w = 2**(t/half_life) / sum(2 ** (t/half_life)) return wW = halflife()W 这样计原创 2020-06-28 14:34:28 · 318 阅读 · 0 评论 -
均值-方差模型实现及应用_python_数据分析_9
用的是米筐的研究模块,从结果来看,均值方差模型对参数的敏感性很高,很多参数都不如随机权重,很难应用到实战。import pandas as pdimport numpy as npfrom scipy import linalgimport matplotlib.pyplot as pltstockslist = ['000001.XSHE','000002.XSHE','600004...原创 2020-04-22 10:00:43 · 8251 阅读 · 7 评论 -
线性回归_python_数据分析_8
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom scipy import statsimport statsmodels.api as smimport warningswarnings.filterwarnings("ignore")plt.rcParams['font.sans-se...原创 2020-04-16 20:24:25 · 253 阅读 · 0 评论 -
概率密度及累积分布函数作图_python_数据分析_2
概率密度及累积分布函数作图_python_数据分析_2import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom scipy import statsdef get_data(): #获取沪深300收益率数列 HS300 = pd.read_excel('HS300.xlsx', in...原创 2020-04-15 12:25:56 · 3242 阅读 · 2 评论 -
单样本t检验、独立样本t检验、配对样本t检验_python_数据分析_7
单样本t检验:检验单个变量的均值与目标值之间是否存在差异,如果总体均值已知,样本均值与总体均值之间差异显著性检验属于单样本t检验。金融应用:原假设为沪深300收益率均值为0,而p值为0.27>0.05(t值为1.1),所以在5%显著性水平下,不能拒绝原假设,推断沪深300的收益率均值为0。独立样本t检验:用于检验两组服从正态分布的总体均值是否一样,前提是两个样本方差相等。如果两组样本彼...原创 2020-04-16 10:56:32 · 14825 阅读 · 0 评论 -
沪深300与中证500收益率相关性分析_python_数据分析_6
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom scipy import statsplt.rcParams['font.sans-serif'] = ['KaiTi'] # 指定默认字体plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是...原创 2020-04-15 17:43:46 · 2092 阅读 · 0 评论 -
卡方分布-t分布-F分布_python_数据分析_5
若n个相互独立的随机变量ξ₁,ξ₂,…,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom scipy ...原创 2020-04-15 14:52:01 · 816 阅读 · 0 评论 -
正态分布及金融应用_python_数据分析_4
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom scipy import statsNorm = np.random.normal(size = 5)print(Norm)print(stats.norm.pdf(Norm))#正态分布随机数密度值print(stats.norm.cd...原创 2020-04-15 13:26:18 · 1021 阅读 · 0 评论 -
numpy处理二项分布随机数_python_数据分析_3
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom scipy import statsbino = np.random.binomial(100,0.5,20)#投掷100次硬币,向上概率是0.5,即硬币向上的次数服从二项分布b(100,0.5),生成20个来源于该分布的随机数print(b...原创 2020-04-15 12:47:00 · 675 阅读 · 0 评论 -
使用choice生成随机数_python_数据分析_1
使用choice生成随机数#参数1:指明随机变量所有可能取值#参数2:我们要生成的随机数数组大小#参数3:生成随机数是否有放回#参数4:与参数1等长向量,指定每种结果出现的可能性RandomNumber = np.random.choice([1,2,3,4,5],size=100,replace=True,p=[0.1,0.2,0.3,0.1,0.3])pd.Series(Rando...原创 2020-04-15 12:11:13 · 343 阅读 · 0 评论