目的 构建决策树风险预测模型,为早期发现结直肠癌高危人群提供依据。方法 2020年10—12月采用序贯抽样方法抽取四川省5家医院结直肠癌患者为病例组,体检或就诊人群为对照组。采用自制问卷,收集调查对象的一般人口学特征、家族史、LEE011疾病史、用药史、生活方式及饮食习惯等内容。利用χ2检验、非参数检验和logistic回归分析筛选变量,基于决策树C5.0算法构建结直肠癌风险预测模型,并绘制受试者工作特征曲线、校准曲线和决策曲线,评估模此网站型的区分度、校准度和临床适用性。2023年2—3月抽取结直肠癌患者和体检人群进行外部验证。结果 建模共纳入病例组325例,对照组322例。外部验证共纳入病例组43例,对照组58例。模型最终筛选出肠镜检查、工作中的体力强度、运动的持续时间、高血脂、是否吃辣及个人年收入为结直肠癌发病medical group chat风险的预测指标。模型准确率为78.34%,AUC为0.845,最佳截断值及坐标为0.696(0.230,0.797),特异度为79.69%,灵敏度为76.95%。模型内部验证准确率为73.85%,AUC为0.789,最佳截断值及坐标为0.696(0.242,0.719),特异度为71.88%,灵敏度为75.76%。模型外部验证准确率为72.28%,AUC为0.807,最佳截断值为0.706(0.207,0.767),特异度为79.07%,灵敏度为67.24%。结论 决策树构建的结直肠癌风险预测模型,基于收集个人的易获得信息进行发病风险判别,具备较好的预测能力,有利于提高人群筛查效率。