验证结果
研究队列
MyoPath 在两个独立队列的 478 张 H&E 全切片图像上进行了验证:
| 队列 | n | 来源 | 组成 |
|---|---|---|---|
| GTEx | 399 | 基因型-组织表达计划 | 尸检骨骼肌;健康对照和亚临床消耗性疾病谱系 |
| 华山队列 | 79 | 复旦大学附属华山医院 | 临床肌肉活检;DM1、LGMD、炎性肌病和健康对照 |
GTEx 队列作为训练集;华山队列作为独立外部验证集。未在华山队列数据上重新训练。
分割性能
分割精度通过 Dice 系数和交并比 (IoU) 对照人工专家标注进行评估:
| 组织层 | 方法 | Dice | IoU |
|---|---|---|---|
| 肌纤维 | Cellpose-SAM | 0.92 ± 0.03 | 0.85 ± 0.06 |
| 脂肪 | 像素分类器 | 0.95 ± 0.02 | 0.91 ± 0.03 |
| 细胞核 | Watershed | 0.87 ± 0.04 | 0.78 ± 0.06 |
| 结缔组织 | 布尔减法 | 0.88 ± 0.04 | 0.78 ± 0.06 |
可重复性
所有七项病理指标的组内相关系数 (ICC) 均超过 0.88,表明自动化流水线具有高度的评估者间和评估者内可重复性。
MyoPath Score 性能
区分能力
| 数据集 | AUC | 指标 |
|---|---|---|
| GTEx(LOO-CV) | 0.735 | 留一法交叉验证 |
| GTEx(完整模型) | 0.788 | 训练集 AUC |
| 华山队列 | 0.873 | 外部验证(无重新训练) |
外部验证集上更高的 AUC 表明,临床确诊的肌病(华山队列)比亚临床消耗性疾病(GTEx)产生更可分离的形态学变化。
主要生物标志物
两项指标作为最强的单独区分因子脱颖而出:
| 生物标志物 | p 值 | 效应量(秩二列相关 r) |
|---|---|---|
| NCI | 0.69 | |
| Fiber CV | 0.58 |
两者在 MyoPath Score 模型中的标准化回归系数最大(
临床相关性
疾病特异性发现
强直性肌营养不良 1 型 (DM1):
- NCI 在 DM1 中最高(中位数 0.121),与中央核病理一致
- NCI 与 CTG 重复数相关:Spearman
, - Fiber CV 与握力负相关:
,
肢带型肌营养不良 (LGMD):
- Fiber CV 与突变严重度呈剂量-反应关系:
- 2× 错义突变:CV = 0.44
- LoF + 错义:CV = 0.49
- 2× LoF:CV = 0.65
GTEx 消耗性疾病谱系:
- NCI 在消耗严重度等级间呈显著剂量-反应趋势(Jonckheere-Terpstra
)
与 MyoScore 的跨模态验证
MyoPath 病理指标与 MyoScore 转录组维度相关,展现跨模态一致性:
| MyoScore 维度 | MyoPath 指标 | 方向 |
|---|---|---|
| LeanMuscle | 脂肪浸润 | 负相关 |
| Youth | 纤维化程度 | 负相关 |
| GMHS 综合评分 | Fiber CV | 负相关 |
转录组和形态学评估之间的一致性支持了两个工具的生物学有效性。
局限性
- ROI 依赖性:组织成分指标(脂肪、纤维化)随 ROI 放置位置变化。NCI 和 Fiber CV 更为稳健。
- 仅限 H&E:流水线针对 H&E 染色优化。不支持特殊染色(ATPase、NADH)和免疫组织化学。
- 单一 ROI:当前验证每张切片使用一个 ROI。多 ROI 策略可能提高异质性活检的代表性。
- 结缔组织估计:布尔减法继承了肌纤维和脂肪分割层的误差。
- 人群范围:训练在 GTEx(以欧洲血统为主)上进行。在其他人群中的性能需要进一步验证。