行业新闻

P 值用处何在？学术界争论再起

2017年09月29日 1.4万次浏览

P 值广泛用来指示研究的两群组间的差异、关系等几率或变数，传统上，如果 P 值小于 0.05，研究结果结算具有统计“显著”。几个月前，几位学者发声认为应该要限制 P 值小于 0.005，预防假阳性结果。这个说法激起了科研界的讨论和争辩，有些学者针对这个提议发表回应，认为要处理 P 值滥用的问题，需要要求科研人员说明他们如何使用 P 值。

最广泛被讨论的问题是可接受的 P 值底线有很大的误用和错误解读空间。2017 年 7 月，72 位著名的研究人员在 PsyArXiv 预印本伺服器上发表了一篇论文，文中争论社会科学和生物医学科学的 P 值是否该将阈值设在 0.005 以下，论文的 lead author 之一同时也是美国南加利福尼亚大学经济学家的 Daniel Benjamin 说道：「介于 0.05 和 0.005 间的 P 值只能看作是“提示性证据”(suggestive evidence) 而不算既定知识。」

9 月 18 日，另一群学者针对这个想法发表回应。这份立场相反的回应报告第一作者、荷兰埃因霍芬理工大学 (Eindhoven University of Technology) 实验心理学家 Daniel Lakens 认为，强行设定 P 值阈值可能会造成更多新问题，例如增加假阴性的数字，如此一来，一个问题的解决办法又变成另一个新问题的源头，Laken 还指出另一个可能的“文件抽屉”(file drawer) 问题，很多研究可能会因为阴性结果不被期刊接受而永远无法发表，他说：「在施行任何政策之前，需要肯定新政策不会造成无意的负面结果。」他提议科研人员应该在收集数据之前，就该选定注册报告中的 P 值阈值，并解释如此设定的原因。对 Daniel Lakens 来说，这个做法能让 P 值的使用更加负责，还能让使用分析更加简单。

另一个科研人员面临的大挑战是无法重复结果，这也让 P 值的使用显得更加重要。有些期刊甚至因为无法复制而做出禁用 P 值这样极端的决定。目前科研界对 P 值的使用明显分成两派，但究竟这个议题最后会达成何种决议，目前还不清楚。

你的研究也有使用 P 值吗？你对降低阈值有何看法？这会影响你的研究吗？欢迎评论分享。

意得辑专家视点相关推荐阅读：

参考资料：