R数据分析:净重新分类(NRI)和综合判别改善(IDI)指数的理解
chanong
|评估分类预测模型性能的最常见指标是ROC 曲线,它报告AUC。例如,如果您有两个模型,请尝试比较两个模型的AUC 以确定这两个模型的表现如何。如果您的研究重点是向原始模型引入新的预测变量是否可以提高模型的有效性,那么此时ROC 通常显得不足。变量AUC 还不够。太多的变量使AUC 难以解释。
当评估纳入新标志物后预测模型的预测性能的改进时,新标志物可能无法显着改进C-Statistic/AUC,因为C-Statistic/AUC 的改进总是很小。
这个时候就需要用到我们今天要讲解的综合歧视改善指数IDI和净重分类指数NRI指标。
两个新指标正在迅速被采用来量化生物标志物相对于现有测试的附加值:综合辨别改进(IDI)和净重分类改进(NRI)。
净重分类指数(NRI):一个新的指标或者一个新的模型是否提高了分类效果并最终体现在人数上?从这个角度来看,我们可以比较两个模型或者不同模型对调查对象的正确分类情况指标。我就是这样得出结论的。即旧模型将研究对象分为患者和非患者,新模型也将研究对象分为患者和非患者。这时,如果我们比较新旧模型对研究目标人群分类的变化,就会发现一些研究对象最初在旧模型下被错误分类,但在新模型下却被正确分类。这是旧模型中的分类。模型中的分类是正确的,但模型的分类是错误的。因此,研究对象的分类在新旧模型之间发生了变化。利用此重分类变化,得出净重分类指数NRI。为了更好地理解这一变化,我们来看一下下表。
表3中的c1表示原始模型没有正确预测,但新模型预测正确。同样,b1表示原模型预测正确,但新模型没有预测。因此,(c1 b1)/N1 是疾病组或事件组增加的重新分类的正确比例。类似地,非疾病组中增加的重分类准确率(表4)可以通过(b2 c2)/N2 获得。
NRIevents 是发生事件的患者被重新分配到高风险类别的净比例,NROnevents 是没有事件的患者被重新分配到低风险类别的数量。
NRI=(c1 b1)/N1 + (b2 c2)/N2 由于NRI 代表重新分类的正确案例比例的增加,因此NRI0 是一个积极的改进,意味着新模型优于下一个预测。如果旧模型的能力有所提升,NRI=0,则为负向提升;如果新模型的预测能力有所下降,NRI=0,则认为新模型没有提升。
综合判别改进指数IDI 正如我前面介绍的NRI,NRI是从新旧模型之间正确预测数量的增加的角度来评估模型的,其思想是可以反映质量。根据递增概率建立模型。换句话说,希望模型对疾病组做出阳性预测的概率尽可能高,而对非疾病组模型做出阳性预测的概率尽可能小。该指标可以通过模型预测概率的差异来获得。如果新模型比原模型更好:在正组中,预测为正的概率高于旧模型的概率,在负组中,预测为正的概率高于旧模型的概率旧型号,会更小。那么我们可以说新模型比旧模型更好。该索引为IDIIDI=(Pnew,events Pold,events) (Pnew,non-events Pold,non-events)。这里,Pnew,events代表新模型在疾病组中预测的阳性概率,Pold,non-events代表旧模型在非疾病组中预测的阳性概率。即IDI等于疾病组新模型与旧模型预测阳性概率之差减去非疾病组新模型与旧模型预测阳性概率之差(概率是中间的负号,因为模型对非疾病组预测的阳性比例应该尽可能小)因此,IDI越大,新模型比旧模型预测越准确。模型。如果IDI>0,则说明新模型的预测能力较旧模型有正向提升,且IDI
总结今天,我们介绍了NRI和IDI在临床预测模型中的理解和实际操作。比较模型时考虑使用这两个指标。请注意,这两个指标只能用于比较模型。替代指标该模型无法计算这两个指标,有学者认为这两个指标没什么用处。感谢您的耐心阅读。我的文章很详细,重要的代码都在原文中。我希望你自己尝试一下。请将这篇文章转发给你的朋友,并回复“数据链接”私信。获取我收藏的所有数据和学**资料。如果您觉得对您有帮助,请先收藏,然后点赞、分享。
我们欢迎您提出意见和建议。如果您想了解统计方法,请在文章下方留言。如果我看到了,我可能会写一篇教程。如果您有任何疑问,请给我们发送私人信息。如果您有兴趣帮助我们,请直接联系滴滴我。如果您是一名本科生或研究生,对自己的统计作业、数据分析、模型构建、科学研究统计设计等感到担忧,或者在使用SPSS、R或Mplus时遇到困难,请与我联系。因为我可以提供最好最详细的患者数据分析服务。对z 检验、t 检验、方差分析、多元方差分析、回归、卡方检验、相关性、多水平模型、结构方程模型、中介、量表信度和效度等统计方法有疑问吗?如果您需要详细耐心的指导等等,请私信我。如果您或您的团队需要专门的科研数据清理、建模服务、教育培训需求等。请联系我。
如果您是一名学生,并且担心统计#作业、#数据、#分析、#论文、#报告、#essays、#quizzes、考试,并面临#SPSS、#R-Programming 中的问题。如果您使用# Excel、Mplus,请联系我,我可以为您提供最好的数据分析服务。
您是否对数据分析的统计方法感到困惑,例如z 检验、t 检验、方差分析、多元方差分析、回归、逻辑回归、卡方、相关性、相关性、SEM、多级模型、中介、调节等?
那么请联系我。解决这个问题.
如果您或您的研究团队需要专业的科学数据清理、模型构建服务或统计咨询.请联系我们。
上期:伟大的R数据分析:反事实框架和因果中介的理论理解R数据分析:解决科学研究中的再现性危机,理解Rmarkdown R数据分析:多项式回归和响应面分析理解和实践R数据分析:如何构建预测模型并评估生存数据(二)R数据分析:如何建立预测模型并评估生存数据R数据分析:理解和绘制生存分析列线图的详细教程R数据分析:结合APA格式讲座绘制大法关于ggplot2 和ggsci。请添加书签。 R 数据分析:变量、多项式、样条回归、加性模型之间的非线性关系Mplus 数据分析:如何进行性别差异和性别差距的相关研究R 机器学**:分类算法原理与实现Logistic 回归分类器R 数据分析:介绍PLS结构方程模型、论文报告方法和实际操作R数据分析:根据顶级期刊逐步学**如何做创建临床预测模型R数据分析:通过Lasso回归选择变量构建Cox模型并绘制列线图R 数据分析:如何使用层次聚类分析创建“症状聚类”,实例R 数据分析:工具变量回归和孟德尔随机化,分析实例R 数据分析:潜在类别轨迹模型如何使用LCTM,分析实例R 文本挖掘:以2021年新年祝福为例的中文词云生成R 机器学**:分类算法LDA、QDA的判别分析R 可视化原理与实现:绘图函数的基本操作,初学者教程R 机器学**:重复采样在中的作用构建机器学**模型的过程了解R 数据分析:使用lme4 包拟合线性和非线性混合效应模型R 数据分析:使用鼠标进行多种插值方法、分析示例R 数据分析:孟德尔随机中介的原理和实际操作R 数据分析:关于理解和绘制生存分析列线图的详细教程R 数据分析:如何使用COX 模型进行预测,评分论文中高重现R 数据分析:广义估计方程GEE R 数据分析实践与讲解:潜在类轨迹模型练**LCTM,分析实例R 数据分析: 潜变量与降维(主成分) R 数据分析:结构如何画方程的路径图,tidySEM 包R 数据分析详解:搜索自变量中的异常值报告的身高数据R 数据分析:生存分析和生存实践与讲解使用竞争事件进行分析R 机器学**:朴素贝叶斯和支持向量机原理与实现R 数据分析:混合效应模型的可视化解释如果你不明白,你永远不会这么做。数据分析: 如何理解模型的“控制”,图解R 数据分析:详细介绍使用tableone 包R 数据分析:如何使用lavaan 包创建结构方程模型、分析示例R 机器学**:原理与分析分类算法的实现K-最近邻算法(KNN) R 数据分析: 潜在增长模型LGM 的实践和描述以及与混合模型的比较R 数据分析:论文中的轨迹、潜在实践增长模型和增长混合模型R 数据分析:分析纵向分类结果的分析——马尔可夫多态性的理解和实践R 数据分析:临床预测模型、校准曲线、DCA 曲线的实例R 数据分析:分享统计实践国内新型冠状病毒感染: 口服药优于辉瑞的文章原则与实现K 最近邻算法(KNN) R 数据分析:绘制和解释R 数据分析的简单斜率图: 变量交互的连续性








