《变量关系大揭秘㈡:性别与爱的告白》告诉我们,克莱姆相关系数的数值在0到1之间,可以用来衡量两个类别变量的相关性。今天我们来看看如何计算它(别怕,还是小学算术)。
基本原理非常非常简单,就是比较期望次数和观测次数之间的差异。
What is Expected Frequency?
期望次数
回忆之前的例子。如果“性别”与“告白方式”完全不相关,或者说,男女生喜欢的告白方式无差异,下面的六个问号应该是多少?
某个小学生会告诉你是:
也就是:
因为这种情况下,女生选择“打电话”、“发短信”、“当面说”的比例,与男生一样,都是44 : 54 : 82。上面六个问号对应的数