python 分位数_python – pandas数据帧上的分位数规范化

最新推荐文章于 2024-03-19 22:05:40 发布

weixin_39577052

最新推荐文章于 2024-03-19 22:05:40 发布

阅读量342

点赞数

文章标签： python 分位数

简单来说,如何在Python中对大型Pandas数据帧(可能是2,000,000行)应用分位数归一化？

PS.我知道有一个名为rpy2的包可以在子进程中运行R,在R中使用分位数标准化.但事实是当我使用如下数据集时,R无法计算正确的结果：

5.690386092696389541e-05,2.051450375415418849e-05,1.963190184049079707e-05,1.258362869906251862e-04,1.503352476021528139e-04,6.881341586355676286e-06

8.535579139044583634e-05,5.128625938538547123e-06,1.635991820040899643e-05,6.291814349531259308e-05,3.006704952043056075e-05,6.881341586355676286e-06

5.690386092696389541e-05,2.051450375415418849e-05,1.963190184049079707e-05,1.258362869906251862e-04,1.503352476021528139e-04,6.881341586355676286e-06

2.845193046348194770e-05,1.538587781561563968e-05,2.944785276073619561e-05,4.194542899687506431e-05,6.013409904086112150e-05,1.032201237953351358e-05

编辑：

我想要的是：

我在Python中发现了一段代码,声明它可以计算分位数标准化：

import rpy2.robjects as robjects

import numpy as np

from rpy2.robjects.packages import importr

preprocessCore = importr('preprocessCore')

matrix = [ [1,2,3,4,5], [1,3,5,7,9], [2,4,6,8,10] ]

v = robjects.FloatVector([ element for col in matrix for element in col ])

m = robjects.r['matrix'](v, ncol = len(matrix), byrow=False)

Rnormalized_matrix = preprocessCore.normalize_quantiles(m)

normalized_matrix = np.array( Rnormalized_matrix)

代码与代码中使用的示例数据一起工作正常,但是当我使用上面给出的数据对其进行测试时结果出错了.

由于ryp2提供了在python子进程中运行R的接口,我直接在R中测试它,结果仍然是错误的.结果我认为原因是R中的方法是错误的.

weixin_39577052

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。