P 值用处何在?学术界争论再起

P 值用处何在?学术界争论再起

P 值广泛用来指示研究的两群组间的差异、关系等几率或变数,传统上,如果 P 值小于 0.05,研究结果结算具有统计“显著”。几个月前,几位学者发声认为应该要限制 P 值小于 0.005,预防假阳性结果。这个说法激起了科研界的讨论和争辩,有些学者针对这个提议发表回应,认为要处理 P 值滥用的问题,需要要求科研人员说明他们如何使用 P 值。

最广泛被讨论的问题是可接受的 P 值底线有很大的误用和错误解读空间。2017 年 7 月,72 位著名的研究人员在 PsyArXiv 预印本伺服器上发表了一篇论文,文中争论社会科学和生物医学科学的 P 值是否该将阈值设在 0.005 以下,论文的 lead author 之一同时也是美国南加利福尼亚大学经济学家的 Daniel Benjamin 说道:「介于 0.05 和 0.005 间的 P 值只能看作是“提示性证据”(suggestive evidence) 而不算既定知识。

9 月 18 日,另一群学者针对这个想法发表回应。这份立场相反的回应报告第一作者、荷兰埃因霍芬理工大学 (Eindhoven University of Technology) 实验心理学家 Daniel Lakens 认为,强行设定 P 值阈值可能会造成更多新问题,例如增加假阴性的数字,如此一来,一个问题的解决办法又变成另一个新问题的源头,Laken 还指出另一个可能的“文件抽屉”(file drawer) 问题,很多研究可能会因为阴性结果不被期刊接受而永远无法发表,他说:「在施行任何政策之前,需要肯定新政策不会造成无意的负面结果。」他提议科研人员应该在收集数据之前,就该选定注册报告中的 P 值阈值,并解释如此设定的原因。对 Daniel Lakens 来说,这个做法能让 P 值的使用更加负责,还能让使用分析更加简单。

另一个科研人员面临的大挑战是无法重复结果,这也让 P 值的使用显得更加重要。有些期刊甚至因为无法复制而做出禁用 P 值这样极端的决定。目前科研界对 P 值的使用明显分成两派,但究竟这个议题最后会达成何种决议,目前还不清楚。

你的研究也有使用 P 值吗?你对降低阈值有何看法?这会影响你的研究吗?欢迎评论分享。

 

意得辑专家视点相关推荐阅读:

参考资料:

期待学术生涯高歌猛进,发表过程一帆风顺?

来加入我们活力洋溢的在线社区吧。免费注册,无限阅览。

社交账号一键登入

已有54300名科研人员在此注册。

觉得有用?

如果是的话,和你的同事分享吧