python dataframe 分位数_关于python:对熊猫数据框的分位数归一化

这篇博客探讨了如何在Python的大型Pandas DataFrame上应用分位数归一化,特别是在处理大约2,000,000行的数据时。文章中提到了使用rpy2包通过R进行分位数归一化的问题,以及在Python中找到的一种实现分位数归一化的代码示例。同时,博主分享了一个GitHub链接,提供了一个效率较高的分位数归一化实现方法,该方法适用于包含数值和非数值数据的DataFrame。" 87803574,5621586,理解makefile的override指示符与gcc -ldl选项,"['makefile', '编译', '链接选项', '动态库']
摘要由CSDN通过智能技术生成

简而言之,如何在Python中的大型Pandas数据帧(大约2,000,000行)上应用分位数归一化?

PS。 我知道有一个名为rpy2的程序包,可以在R中使用分位数归一化在子进程中运行R。但是事实是,当我使用如下数据集时,R无法计算正确的结果:

5.690386092696389541e-05,2.051450375415418849e-05,1.963190184049079707e-05,1.258362869906251862e-04,1.503352476021528139e-04,6.881341586355676286e-06

8.535579139044583634e-05,5.128625938538547123e-06,1.635991820040899643e-05,6.291814349531259308e-05,3.006704952043056075e-05,6.881341586355676286e-06

5.690386092696389541e-05,2.051450375415418849e-05,1.963190184049079707e-05,1.258362869906251862e-04,1.503352476021528139e-04,6.881341586355676286e-06

2.845193046348194770e-05,1.538587781561563968e-05,2.944785276073619561e-05,4.194542899687506431e-05,6.013409904086112150e-05,1.032201237953351358e-05

编辑:

我想要的是:

给定上面显示的数据,如何按照https://en.wikipedia.org/wiki/Quantile_normalization中的步骤应用分位数归一化。

我在Python中找到了一段代码,声明它可以计算分位数归一化:

import rpy2.robjects as robjects

import numpy as np

from rpy2.robjects.packages import importr

preprocessCore = importr('preprocessCore')

matrix = [ [1,2,3,4,5], [1,3,5,7,9], [2,4,6,8,10] ]

v = robjects.FloatVector([ element for col in matrix for element in col ])

m = robjects.r['matrix'](v, ncol = len(matrix), byrow=False)

Rnormal

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值