接着前面的写,首先补充一个计算公式,即Fisher’s z变换Z= (ln (1+r) - ln (1-r)) / 2。用于相关系数r不服从正态分布时,将r转换成正态分布的z,然后就可以用常用的t检验进行比较检验。

上次提到关于r和p的作用,用一句话总结一下上次的观点是:r是对样本的描述,p是对该r能推广到总体的程度的描述。r越大固然越好,但是样本量不能太小,否者就不能代表总体,即不显著;同样地,显著性越大固然也越好,因为这说明你的相关系数更可能表示了总体的相关,于是在相关系数很小的情况下,我们可以通过增加样本量以达到显著。这里就存在一个让人纠结的地方:因为只要样本量足够大,研究者总可以得到一个显著的结果。

一般情况下,总体的两个变量的相关很难达到零。根据1中提到的公式,只要被试量增加到一定程度,我们总可以得到一个显著,甚至相当显著的p。但是这里就需要思考两个概念:一是significance;另一个就是the significance of significance[jialiu]。即我们是得到了一个显著的结果,但是这个显著的重要性到底有多大。比如我们用几万人的样本得到一个很显著的相关系数r=0.01,甚至更小的相关(也就是说一个变量能解释另一个变量的0.01%的变异),这又能说明什么呢?显然在传统的心理学研究中,如此小的share的变异是“没有意义的”。(当然,在特定的研究中如此小的变异可能是很重要的,比如基因研究中单个SNP对行为的影响)。

综上,在相关研究以及其他比较的研究中,significance和the significance of significance都是要重点关注的。前者指的是显著性,即是否能在一定程度代表总体;后者则和effect size有关系,只有effect size足够大时我们才有必要去关注这个结果,至少在传统的心理学研究中是这样的[JiaLiu]。同时,这也警示研究者在报告结果时,需要在显著性检验p的后面跟上effect size(因为相关本身就是一种effect size,所以就不用跟了)。类似的写作要求在一些杂志上已经开始推广,也许是人们慢慢意识到在‘大被试量’成为一件触手可及的事情的时候,我们真的很有必要去关注一下比较的effect size,也就是the significance of significance。

参考:
Fisher_transformation