python和r的不同_为什么Python和R有两种不同的标准化结果

任何人都可以在幕后解释数学吗?为什么

Python和R会给我不同的结果?我应该将哪一个用于实际业务场景?

原始数据

id cost sales item

1 300 50 pen

2 3 88 wf

3 1 70 gher

4 5 80 dger

5 2 999 ww

Python代码:

import pandas as pd

from sklearn.preprocessing import StandardScaler

df = pd.read_csv('Scale.csv')

df[['cost', 'sales']] = StandardScaler().fit_transform(df[['cost', 'sales']])

df

Python规范化结果

id cost sales item

0 1 1.999876 -0.559003 pen

1 2 -0.497867 -0.456582 wf

2 3 -0.514686 -0.505097 gher

3 4 -0.481047 -0.478144 dger

4 5 -0.506276 1.998826 ww

和R代码

library(readr)

library(dplyr)

df

df % mutate_each_(funs(scale(.) %>% as.vector),

vars=c("cost","sales"))

R归一化结果

id cost sales item

1 1 1.7887437 -0.4999873 pen

2 2 -0.4453054 -0.4083792 wf

3 3 -0.4603495 -0.4517725 gher

4 4 -0.4302613 -0.4276651 dger

5 5 -0.4528275 1.7878041 ww

谢谢@Wen

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值