近年来,随着标准化扫描协议和人工智能的不断发展,从图像中获取更多定量信息以实现自动化和可重复性分析成为了一种可能,因此影像组学应运而生。影像组学是一个新兴的医工交叉研究领域,其概念最早由荷兰学者Lambin等[1]于年提出,即从医学图像中提取高通量特征,采用计算机算法将影像学数据转化为具有高分辨率的可挖掘数据空间的学科。
原发性肝癌是我国目前第4位常见恶性肿瘤及第2位肿瘤致死病因。其中肝细胞癌(hepatocellularcarcinoma,HCC)占75%~85%[2]。肝癌在空间和时间上是异质性的,侵入性检查不能提供全面信息,肝细胞癌的诊断特别是早期诊断在较大程度上依靠无创影像[3,4],新兴的影像组学尤其是基于影像组学的肝细胞癌多中心研究逐步开展并取得了较大成绩。
本文基于影像组学的肝细胞癌多中心研究最新进展进行综述。
1影像组学的多中心研究
1.1影像组学的发展
从计算机辅助诊断系统到影像组学,是一个图像可转换量化数据不断增多,医学成像数据信息整合程度不断加深的过程。影像组学的本质是对拥有高通量特征的医学图像进行定量化分析[5]。由于恶性肿瘤在空间和时间上的异质性[6],穿刺活检等有创检查不能体现肿瘤的预后及预测治疗反应等信息。目前临床上需要精确分层,对常规影像学数据量化分析主要是恶性肿瘤。从图像中提取影像组学特征,设置算法对数据进行分类,根据数据之间潜在的关系生成复杂的推断,学习数据中的模式,利用学习的模式进行决策,总结出诊断性实验模型。这个过程被定义为机器学习[7]。随着算法的改进,深度学习作为机器学习的分支逐步应用于医学领域[8]。卷积神经网络(convolutionalneuralnetwork,CNN)是深度算法的一种,其结构类似于生物神经系统,可以自动从数据中学习区分特征,模仿人进行决策,推进了组学模型临床应用的进程[9]。
1.2多中心研究
影像组学是图像分析,图像是基础,标准化高质量影像图像的获取与重建是影像组学研究的先决条件[10],绝大多数影像组学研究是在单一医疗科研机构中进行,这固然可以降低因扫描机型及参数不一致等因素造成的图像所携带组学特征信息误差,却也降低了研究的可重复性与泛化能力[11]。确定影像组学模型潜在临床价值,开展大型多中心研究成为热点,它是实现影像组学方法向临床环境更快转移的重要途径和目标。
多中心研究指由多个单位的研究者合作,按同一个方案同时进行的研究。它的主要优点是具有更大的数据集和从不同样本中获得的结果具有更高的统计相关性。然而从几个中心收集数据是复杂的,无论图像是本地存储还是利用分布式学习[12]存储和分析在一个中央数据库、扫描器模型、采集协议和重建设置的可变性在目前的临床实践中是不可避免的。大多数组学特征已被证明对这些因素的变化敏感[13]。将它们集中起来进行统计分析并建立的模型要么隐藏现有的相关性,要么产生错误发现[14]。因此不同成像方案之间不能立即进行比较,需要协调策略对各独立数据进行整合,这类协调策略简称为标准化,它的实现形式可以分为两个思路,一种旨在消除或减少在组学特征提取之前图像之间的差异,方法是图像标准化;另一种旨在消除或减少提取特征和提取特征后特征之间的差异,方法是修改算法或后验处理。前者对应了图像域协调策略,包括标准化成像,特定条件下的规范化合并,以及图像预处理。后者对应了特征域协调策略,可分为根据可靠性选择组学特征和去除无关因素校正方法。上述协调策略各有其优势与不足,可根据临床实践单独或联合应用于影像组学多中心研究。
2影像组学多中心研究的应用方向思考
2.1鉴别诊断
影像组学在肝细胞癌诊断和与其他肝脏疾病鉴别上显示出了较大潜力[15]。王禹博等[16]用扩散加权成像建立的影像组学特征模型对肝细胞癌和肝血管瘤进行鉴别。Gu等[17]使用支持向量机建立MRI组学列线图模型识别肝细胞癌潜在标志物。上述模型实现临床应用还需要验证,但它们提供了一个思路,即通过MRI影像组学多中心研究训练一种精准诊断肝细胞癌的无创手段[18]。
2.2病理分级
术前的病理分级预测是对肿瘤治疗方式进行评估选择的有效手段。许露露等[19]、Hui等[20]用纹理分析比较术前MRI纹理与肝细胞癌的相关性,推测肝细胞癌的早期复发。基于影像组学评估肝癌病理特征[21],可指导临床作出合理的治疗选择。微血管浸润(microvascularinvasion,MVI)是手术切除后复发因素之一,目前只能通过术后病理切片诊断。段亚阳等[22]、Jiang等[23]使用机器学习和深度学习算法,建立多组结合模型预测MVI状态。两组研究均验证了瘤周特征对预测MVI的重要影响,也提及当前MVI组学研究的局限,为开展多中心研究拓展了思考方向。
2.3术后复发预测
借鉴影像组学研究临床意义,结合多中心研究改进验证,是开展多中心研究的重要方式。具有潜在临床应用意义的肝细胞癌术后预测分为两个方向,一是预测肝癌早期复发和术后生存期。李琳等[24]用支持向量机、随机森林[25]等机器学习方法对影响患者生存和复发的因素做了分析解释,Zhang等[26]、Huang等[27]开发钆塞酸增强MRI组学特征模型,对肝癌术后发展进行预测。另一个是探究经导管肝动脉化疗栓塞术(transcatheterarterialchemoembolization,TACE)后肝癌患者预后情况。Sun等[28]基于术前多参数MRI提取组学特征,建立影像组学模型提示TACE治疗的预后情况。Song等[29]建立增强MRI影像组学-临床联合模型(clinicalradiomics