010-84476011
环球医学>> 医学新闻>> 政策法规>>正文内容
政策法规

JAMA建议将P值降至0.005 会心一击

来源:环球医学编写    时间:2018年04月13日    点击数:    5星

4月10日,斯坦福大学的Ioannidis JPA在《JAMA》发表了题为《The Proposal to Lower P Value Thresholds to .005.》的文章,建议将P值的阈值降至0.005。写论文的各位亲们表示心碎一地。

P值和伴随的统计学显著性检验方法正在为生物医学和其他学科带来挑战。绝大多数在摘要、全文或二者中报告P值的文章(96%)都包含≤0.05的值。然而,这些报告强调的很多观点可能是假的。认识到统计显著性这一难题的重要性,美国统计协会(ASA)于2016年发表了一篇关于P值的声明。普遍认为现状存在问题,但究竟该如何解决这个问题更具争议性。ASA声明的撰稿人还撰写了20份独立的评论,着重讨论了不同方面并按优先次序排列了不同的解决方案。另一个由72名方法学家组成的大型联盟最近提出了一个具体的简单举措:将新研究的统计学显著性的常规P值值域从0.05降至0.005。该提案在一些圈子中得到了强有力的支持,并在其他领域受到关注。

假如上述提议成真,P值的阈值从0.05降至0.005,估计一半以上的研究都要废了……

大家对统计学意义(P值)很熟悉。结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,P值为结果可信程度的一个递减指标,P值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。P值是将观察结果认为有效即具有总体代表性的犯错概率。如P=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,0.05的P值通常被认为是可接受错误的边界水平。

关于P值的槽点也不少。通常,许多的科学领域中产生P值的结果≤0.05被认为是统计学意义的边界线,但是这显著性水平还包含了相当高的犯错可能性。结果0.05≥P>0.01被认为是具有统计学意义,而0.01≥p≥0.001被认为具有高度统计学意义。但要注意这种分类仅仅是研究基础上非正规的判断常规。

上文所说,ASA发表了使用和解释P值的“六原则”:1、P值可以指示数据与一个给定模型的不相容程度。2、P值不能衡量某假设为真的概率,也不能衡量数据仅由随机因素造成的概率。3、科学结论、商业决策或政策制定,不应只取决于P值是否达到了一个给定标准。4、研究者需对研究进行完整的报告、保证透明度,才能做出合理的推论。5、P值或统计显著性并不能衡量效应的大小和结果的重要性。6、P值本身并不能衡量模型或假设的可信度。

P值误用问题应引发重视,特别是研究者把统计显著性作为科学价值的评价标准。这种误用是糟糕的决策和不能重复的研究的始作俑者之一,最终不仅会危害科学的进步,还会摧毁公众对科学的信任。

统计学研究方法并不只有一个P值。希望越来越多的研究能给科学本身带来益处。

 


未经授权,不得转载!

评价此内容
 我要打分

现在注册

联系我们

最新会议

    [err:标签'新首页会议列表标签'查询数据库时出现异常。有关错误的完整说明,请到后台日志管理中查看“异常记录”]