ks检验python代码_如何使用适当的标准化方法从KolmogorovSmirnov测试（ks测试）中获得正确的p_值和ks_值？...

最新推荐文章于 2024-03-30 17:24:39 发布

浩彬老撕

最新推荐文章于 2024-03-30 17:24:39 发布

阅读量1k

点赞数

文章标签： ks检验python代码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_33356544/article/details/113899851

版权

该博客探讨了在金融数据分析中使用Python进行Kolmogorov-Smirnov检验（KS测试）的问题。作者在实现一个函数来检查股票信号回报率是否符合正态分布时遇到困难。通过scipy.stats.kstest对DataFrame进行分组并应用KS测试，但得到的ks和p值与预期不符。问题可能在于数据标准化，作者寻求帮助以理解如何正确标准化数据以获取准确的测试结果。

摘要由CSDN通过智能技术生成

我正在研究一个财务问题，我要实现一个函数，在每只股票的信号回报率的正态分布之间使用Kolmogorov-Smirnov检验(KS-test)。我将对每个股票的信号回报率在正态分布上运行KS测试，对于这个测试，我将使用scipy.stats.kstest来执行KS测试。在建议我迭代groupby函数

我被要求只使用熊猫，纽比和希比。在

我的职能如下：def calculate_kstest(long_short_signal_returns):

"""

Calculate the KS-Test against the signal returns with a long or short signal.

Parameters

----------

long_short_signal_returns : DataFrame

The signal returns which have a signal.

This DataFrame contains two columns, "ticker" and "signal_return"

Returns

-------

ks_values : Pandas Series

KS static for all the tickers

p_values : Pandas Series

P value for all the tickers

"""

#TODO: Implement function

ks_v = []

p_v = []

#print(long_short_signal_returns)

column = []

df = long_short_signal_returns.copy()

print(df)

#df['signal_return'] = (df['signal_return'] - df['signal_return'].mean()) / (df['signal_return'].max() - df['signal_return'].min())

for name, group in df.groupby('ticker'):

sub_group = group['signal_return'].values

ks,p = kstest(sub_group,'norm')

ks_v.append(ks)

p_v.append(p)

column.append(name)

ks_values = pd.Series(ks_v,column)

p_values = pd.Series(p_v, column)

return ks_values, p_values

然而，我的回答与预期的产出不符。在

输入是：

^{pr2}$

我的输出是：OUTPUT ks_values:

DNTM 0.20326939

EHX 0.34826827

VWER 0.60256811

dtype: float64

OUTPUT p_values:

DNTM 0.98593727

EHX 0.48009144

VWER 0.02898631

dtype: float64

预期产出为：EXPECTED OUTPUT FOR ks_values:

DNTM 0.28999582

EHX 0.34484969

VWER 0.63466098

dtype: float64

EXPECTED OUTPUT FOR p_values:

DNTM 0.73186935

EHX 0.49345487

VWER 0.01775987

dtype: float64

我被告知在获得正确的p_值和ks_值之前使用适当的规范化，但我不明白这种正确的规范化意味着什么以及如何解决这个问题。有人能帮忙吗？？在

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。