皮尔逊相关系数php,科学网—[严肃内容] 鲁索(Rousseau)教授对皮尔逊相关系数实质认识的图示 - 杨正瓴的博文...

[严肃内容]鲁索(Rousseau)教授对皮尔逊相关系数实质认识的图示

一、鲁索(Rousseau)教授简介

比利时情报学家、国际科学计量学与信息计量学学会前会长罗纳尔德·鲁索(Ronald Rousseau)教授,国际著名信息计量学专家,被誉为信息计量学之父。

1979年获比利时科学院奖,2001年获国际科学计量学领域最高奖普赖斯(Price)奖。

ef339c9f0afae831afee69e431bd5f73.png

鲁索和刘玉仙博士,2012,北京

鲁索教授是本网刘玉仙博士、研究员的博士导师。刘玉仙博主是信息科学类杰出博士研究奖(The 2011 Emerald/EFMD Outstanding Doctoral Research Award in the Information Science category)得主。

二、鲁索(Rousseau)与皮尔逊相关系数(Pearson product-moment correlation coefficient)的实质

Ronald Rousseau 等人在2003年发现:“Pearson’s r is probably not an

optimal choice of a similarity measure in ACA”,这里的 Author cocitation analysis (ACA) 是“作者共引分析”。

“皮尔逊相关系数可能不是定量计算‘作者共引分析’相关性的好指标”,真是吓死人了!

皮尔逊相关系数的定义是:

3e4e7d7e4ef7c5bf1845986515bf451c.png

72279f7ea8c28a8e0d6df2adb77b64dd.png

由于rXY计算时减去了“均值”,该系数反映的是两个随机变量X和Y之间波动性之间的“相关性”,而不是“均值”之间的相关性。

下面用几幅图片直观示意一下皮尔逊相关系数的意义。

不难发现,对于两个“均值”不为 0 的时间序列X和Y,

14a9afe0250ee262999e95998bc56330.png

皮尔逊相关系数反映的是其中波动成分之间的“相关性”,即下图:

6d6c92ac57faf3d312ba25647772d883.png

而不是其“稳定成分/均值”(虚点线)之间的相关性!请参见下图:

de7f9b6b31fa7bcef6a623f0c25dd642.png

所以,分析作者们之间的“共引”情况时,皮尔逊相关系数反映的是“作者们之间共引变化”之间的“相关性”,而不是真正的“共引/稳定成分/均值”之间相关性的强度!

三、鲁索(Rousseau)教授该发现的价值预估

罗纳德·鲁索(Ronald Rousseau)等人2003年的这个发现,真是吓死人了!俺可不敢说出该发现的广泛影响。它绝对是人类21世纪的“重要”科技发现之一。傻以为:在22世纪,鲁索的这个发现应该被评为“人类 21 世纪一百项重要科技成就”之一!

(1)如果认为【牛顿力学】是“第 1 流”是,【麦克斯韦电磁场方程】是“第1.3流”的,

(2)那么,Ronald Rousseau 等人2003年可能首创并将引发一个“第4.5流”上下的重大科技发现。

也许是比“激光和光纤 Laser and Fiber Optics”更重大的发现(发明);很有可能在“高速公路 Highways”水平上下。

06829a36df49429a0f146013f17811d9.png

d6924f0980501d33ac146aabbdca7efb.png

最有可能的前途或许是:数据分析不大可能发展成一门符合现今数学分支严格性标准的那种“硬”科学分支,而会以一个其领域没有明确界定的实体而存在,……

上面截图和引用的文字,请看:陈希孺院士,1998,《数理统计学简史》第276页。

四、什么是“相关性”?怎样量化度量“相关性”?都是目前未解难题

就是阿Q,一时也没有办法。

俺找了又找,还没有找到“科学”地计算“相关性”的单一量化指标。

五、俺能提出定量计算“相关性”的新指标吗?

就是阿Q“眼里的阿Q”(简写为“QQ”,不是网站qq),一时也不敢夸下海口。

参考资料:

[1] 武夷山,2015-01-23,“大概近似正确”的评价bde56e7e105e31235099c2550e48923e.gif精选

[2] Per Ahlgren, Bo Jarneving, Ronald Rousseau. Requirements for a co-citation similarity measure, with special reference to Pearson's correlation coefficient, Journal of the Association for Information Science & Technology, 54(6): 550–560, 2003.

[3] 罗纳德·鲁索_百度百科

[4] Ronald Rousseau: Homepage

[5] Derek de Solla Price Memorial Medal

2001 - Ronald Rousseau (Belgium) - Leo Egghe (Belgium)

[6] 美国国家工程院. Greatest Engineering Achievements of the Twentieth Century [EB/OL].

[7] 中国科学院,院士,陈希孺

相关链接:

[1] 2020-7-14,破除论文“SCI至上”:给定量化科技评价研究的一些建议

[2] 2020-06-17,敬请慎重使用和看待“数据统计与分析”的结果

[3] 2020-06-07,[求证] 二十世纪最伟大的工程成就:关键时间与起因

感谢您的指教!

感谢您指正以上任何错误!

感谢您提供更多的相关资料!

转载本文请联系原作者获取授权,同时请注明本文来自杨正瓴科学网博客。

链接地址:http://blog.sciencenet.cn/blog-107667-1242781.html

上一篇:[随感] 未来的人类教育模式

下一篇:[讨论] 住监狱是否能做出更好的科技成果?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值