从相关到因果 | 小孔成像

接着前面的写，首先补充一个计算公式，即Fisher’s z变换Z= (ln (1+r) - ln (1-r)) / 2。用于相关系数r不服从正态分布时，将r转换成正态分布的z，然后就可以用常用的t检验进行比较检验。

上次提到关于r和p的作用，用一句话总结一下上次的观点是：r是对样本的描述，p是对该r能推广到总体的程度的描述。r越大固然越好，但是样本量不能太小，否者就不能代表总体，即不显著；同样地，显著性越大固然也越好，因为这说明你的相关系数更可能表示了总体的相关，于是在相关系数很小的情况下，我们可以通过增加样本量以达到显著。这里就存在一个让人纠结的地方：因为只要样本量足够大，研究者总可以得到一个显著的结果。

一般情况下，总体的两个变量的相关很难达到零。根据1中提到的公式，只要被试量增加到一定程度，我们总可以得到一个显著，甚至相当显著的p。但是这里就需要思考两个概念：一是significance；另一个就是the significance of significance[jialiu]。即我们是得到了一个显著的结果，但是这个显著的重要性到底有多大。比如我们用几万人的样本得到一个很显著的相关系数r=0.01，甚至更小的相关（也就是说一个变量能解释另一个变量的0.01%的变异），这又能说明什么呢？显然在传统的心理学研究中，如此小的share的变异是“没有意义的”。（当然，在特定的研究中如此小的变异可能是很重要的，比如基因研究中单个SNP对行为的影响）。

综上，在相关研究以及其他比较的研究中，significance和the significance of significance都是要重点关注的。前者指的是显著性，即是否能在一定程度代表总体；后者则和effect size有关系，只有effect size足够大时我们才有必要去关注这个结果，至少在传统的心理学研究中是这样的[JiaLiu]。同时，这也警示研究者在报告结果时，需要在显著性检验p的后面跟上effect size（因为相关本身就是一种effect size，所以就不用跟了）。类似的写作要求在一些杂志上已经开始推广，也许是人们慢慢意识到在‘大被试量’成为一件触手可及的事情的时候，我们真的很有必要去关注一下比较的effect size，也就是the significance of significance。

参考：
Fisher_transformation