问 题
问题:
读入一个excel表后,想要正则化(标准化)其中的某一列数据,还试过单独正则化后,再把两个DataFrame拼接的,用过insert和cancat,append这些,但是因为索引对不上号,不能直接拼到后面,顺序会改变,出现很多NAN
代码:
zscore = lambda x: (x-x.mean())/x.std()
transformerd = selectPE.groupby('流通市值').transform(zscore)
rr1_normalized = preprocessing.normalize(selectPE['利润同比%%']).T
rr2_normalized = pd.DataFrame(rr1_normalized)
selectPE.insert(5, 'norm利润同比%%', rr2_normalized)
单独正则化得到一列后,不会连接到一起,要是能在DataFrame中直接正则化那一列多好啊,下面是正则化后的利润同比那一列
rr2_normalized
解决方案
不知道你说的单独正则化是什么意思,我猜你是想对某列进行处理
import pandas as pd
data = [
[1, 2, 3],
[5, 4, 1],
[3, 3, 2]
]
df = pd.DataFrame(data, columns=['A', 'B', 'C'])
df['D'] = df.apply(lambda x: x.mean(), axis=1)
print df
扫一扫关注IT屋
微信公众号搜索 “ IT屋 ” ,选择关注与百万开发者在一起