方法
分割流水线架构
MyoPath 在 H&E 染色骨骼肌全切片图像(WSI)上实现四层组织分割流水线,每层使用适合其生物目标的方法。
WSI (H&E) → ROI 选择 (1500 µm²)
│
├─→ 第 1 层:Cellpose-SAM → 肌纤维实例
├─→ 第 2 层:像素分类器 → 脂肪区域
├─→ 第 3 层:Watershed → 细胞核
└─→ 第 4 层:布尔减法 → 结缔组织
│
▼
37 个形态学特征 → 7 项病理指标 → MyoPath Score第 1 层:肌纤维实例分割
方法: Cellpose-SAM(Cellpose 结合 Segment Anything Model)
Cellpose 是一个通用型深度学习细胞分割模型,采用梯度流追踪方法。在 MyoPath 中,Cellpose 将每根肌纤维分割为独立的多边形实例而非语义掩膜,从而实现单纤维级别的形态学分析。
关键参数:
downsample: 10.0— 控制 tile 大小以防止内存溢出cellprobThreshold: 0— 细胞检测概率阈值- 推荐使用 GPU 加速(每个 ROI 约 30–60 秒)
输出: 单根肌纤维多边形,计算每根纤维的横截面积、周长、形状因子和长宽比。
第 2 层:脂肪浸润检测
方法: 像素分类器(在 QuPath 中训练)
名为 "fat in muscle" 的随机森林像素分类器在代表性 H&E 切片上训练,区分脂肪组织与背景及其他组织类型。该分类器在像素级别运行,生成平滑的脂肪区域边界。
训练:
- 在 10–20 张代表性切片上标注脂肪 vs. 非脂肪区域
- 通过 QuPath 中
Classify → Pixel classifiers → Train pixel classifier训练 - 保存分类器为
"fat in muscle"以兼容流水线
输出: 脂肪区域多边形及面积测量。排除脂肪-肌纤维重叠区域。
第 3 层:细胞核检测
方法: Watershed 分割
Watershed 算法检测 ROI 内的单个细胞核。检测到的核根据其质心相对于肌纤维和脂肪多边形的空间位置,分配至不同组织区室(肌纤维、结缔组织或未分配)。
核分类:
- 肌纤维核 — 质心落在肌纤维多边形内
- 结缔组织核 — 质心落在结缔组织区域内
- 未分配核 — 质心落在脂肪内或注释边界上
核定位: 对每个肌纤维核,计算归一化径向位置
第 4 层:结缔组织估计
方法: 布尔减法
结缔组织不直接分割,而是通过从 ROI 中减去肌纤维和脂肪面积估计得出:
这种方法避免了在 H&E 染色上训练专用结缔组织分类器的困难(内膜和束膜胶原外观多变)。代价是肌纤维或脂肪的分割误差会传播到结缔组织估计中。
特征提取
从四层组织中,MyoPath 计算 37 个形态学特征,分为五个类别:
| 类别 | 特征数 | 关键指标 |
|---|---|---|
| 组织成分 | 10 | 肌纤维、脂肪、结缔组织、细胞核的面积和百分比 |
| 纤维大小 | 7 | 纤维横截面积的均值、中位数、标准差、最小值、最大值、Q1、Q3 |
| 纤维形状 | 3 | 形状因子(圆度)、长宽比及其变异度 |
| 核分布 | 7 | 各区室核计数、每纤维核数统计 |
| 核定位 | 3 | 外周比、中央比、多核纤维计数 |
完整特征目录请参阅形态学特征。
MyoPath Score
从 37 个特征中推导出七项临床可解释的病理指标,通过 logistic 回归合成为综合 MyoPath Score:
模型在 GTEx 队列(n = 399)上训练并进行留一法交叉验证,随后在独立的华山队列(n = 79)上验证,未进行重新训练。
INFO
NCI 和 Fiber CV 的标准化回归系数最大(
ROI 选择策略
MyoPath 使用标准化的 1500 µm × 1500 µm ROI 以确保:
- 充分采样:每个 ROI 约 200–600 根肌纤维(中位数约 400)
- 计算可行性:单 ROI 处理 < 2 分钟
- 跨研究可比性:固定面积消除缩放混杂
ROI 由操作者手动定位于感兴趣区域。临床验证建议每个活检切片至少分析一个 ROI,定位于最具代表性(或最严重病变)的区域。
WARNING
组织成分指标(脂肪浸润、纤维化)固有地依赖 ROI 位置。NCI 和 Fiber CV 对 ROI 放置更为稳健,因为它们按纤维计算并进行归一化。