應用方向:
本文將顯微高光譜成像技術應用于黑色素瘤與色素痣組織切片的區分與早期診斷。該技術可在顯微鏡下采集組織切片的高光譜圖像,融合空間結構信息與光譜反射特征,在無需額外染色或標記的情況下,有效識別肉眼難以分辨的生化差異,從而克服傳統診斷對經驗依賴性強、誤判風險高等問題。通過構建智能輔助診斷模型,顯微高光譜技術實現了對病理切片中良性與惡性組織的自動化分類。研究表明,該技術不僅顯著提升了診斷的準確性,還可與深度學習模型高效融合,推動病理診斷從經驗主導向數據驅動的智能化轉變。因此,顯微高光譜成像在數字病理、早期癌癥篩查及輔助診斷系統開發等領域展現出廣闊的應用前景。
背景:
黑色素瘤是一種極*侵襲性的皮膚癌,其發病率和死亡率在皮膚惡性腫瘤中均居首*。由于早期黑色素瘤與良性色素痣在組織形態上極為相似,傳統病理診斷方法常面臨判別困難,導致誤診和漏診風險加大。當前常用的HE染色技術只能提供組織形態信息,尚缺乏對病理切片中細微光譜差異的定量分析手段。而免疫組化等手段盡管可輔助診斷,但其周期長、成本高,不利于快速篩查。因此,亟需一種能夠在HE染色基礎上提供更多定量、客觀信息的技術手段,以輔助醫生提高早期診斷的準確性與效率。
高光譜成像(HSI)作為一種非接觸、非侵入、無需染料標記的成像技術,可同時獲取組織在空間與光譜維度上的信息,已被證實在醫學成像中具備巨大潛力。每個像素點包含數十至上百個波段的反射光譜特征,可用于區分不同生理和病理狀態下組織的光譜差異,尤其在500–700 nm范圍內的差異最為顯著。結合深度學習方法(如遷移學習與殘差網絡)的自動特征提取與分類能力,有望實現對病理切片中黑色素瘤與色素痣的快速、精確、智能輔助診斷,為臨床提供全新的病理影像分析工具。
作者信息: 李瑋,山東大學控制科學與工程學院。
期刊來源:Photodiagnosis and Photodynamic Therapy
研究內容
本研究旨在探索將高光譜成像技術(HSI)與深度學習算法相結合,用于提升黑色素瘤與色素痣之間的早期病理診斷準確性。本研究構建一種高效、非侵入、無染料標記的病理圖像智能識別方法,解決傳統HE染色切片診斷中“特征相似難區分、主觀性強、效率低”等突出問題。為此,作者采集了100例病理樣本(包括50例黑色素瘤和50例色素痣),通過顯微高光譜成像系統獲取400–1000 nm范圍內的組織光譜圖像,并分別構建一維和二維數據集,提取其光譜與空間特征。在方法上,采用隨機森林算法對一維光譜數據進行分類,并進一步構建基于遷移學習的50層深度殘差神經網絡模型(ResNet-50)以處理包含光譜與空間結構的二維高光譜圖像,實現更精確的腫瘤識別與分類。
實驗設計
實驗數據是通過一臺江蘇雙利合譜科技有限公司顯微高光譜成像系統(GaiaMicro-G-V10E-AZ4, Dualix Spectral Imaging)采集的。該系統分為兩部分,如圖1(a)所示:一臺推掃式高光譜相機和一套顯微鏡系統。推掃式高光譜相機將分光元件和面陣相機進行組合。分光元件將光分成多個特定波長的光線,面陣相機則以線推掃的方式旋轉采集每一條線像素的波長信息。整個圖像的采集過程就是通過旋轉掃描逐行獲取數據,并將圖像拼接成完整的高光譜圖像。同時,計算機配備了圖像采集軟件,這不僅提供了高效的圖像采集功能,還提供了良好的用戶界面。良好的軟硬件條件為微觀高光譜熒光數據的采集和分析奠定了堅實的基礎。圖1展示了良性黑色素瘤和惡性黑色素瘤圖像的示例。
研究的大致流程如下:首先,由病理專家對切片樣本進行觀察與標注;其次,確定激發波長和采集參數后,利用顯微高光譜成像系統對樣本切片進行掃描成像;第三,將獲得的高光譜圖像根據模型所需的不同輸入結構進行數據轉換;第四,將處理后的數據輸入深度學習模型中,輸出最終的準確率、ROC曲線和混淆矩陣;最后,對一維與二維數據結果進行比較,以確定哪種數據更能有效表征兩類組織的狀態與特征。
圖1. (a) 用于獲取高光譜圖像的設備。(b) 一些黑色素瘤和色素痣樣本。(c) 在高光譜相機上的掃描模式。(d) 從黑色素瘤(CMM)患者處獲取的不同波長的高光譜圖像。(e) 高光譜圖像數據立方體。(f) 腫瘤組織樣本(CMM)和色素痣樣本的組織病理學圖像。(g) 病理高光譜圖像。
研究方法
本研究所使用的數據來源于山東大學齊魯醫院確診的50例惡性黑色素瘤患者的常規病理與臨床資料,同時選取同期50例色素痣患者作為對照組。共納入樣本100份,所有切片均為組織冷凍病理切片,切片選擇與取樣過程中所選區域均為隨機,以確保模型訓練的準確性與泛化能力。為盡可能包含更多的病變信息,每張切片選取4–5個具有代表性的區域進行采集。
在建模過程中,研究分別使用了隨機森林算法與殘差網絡算法。隨機森林基于一維光譜數據構建模型,而殘差網絡則處理二維圖像數據。一維數據通過每8個采樣點計算平均光譜以降低噪聲與冗余;二維數據則選取感興趣區域的125個像素,重組為二維圖像,用于深度神經網絡訓練。
隨機森林屬于一種Bagging方法。圖2展示了其訓練流程。如圖所示,對于給定的訓練樣本集 S,每一輪迭代采用自助采樣從 S中隨機抽取M個樣本,重復進行n輪,從而獲得n個彼此獨立的訓練子集。隨后,針對每一個訓練子集分別建立一個預測模型,最終得到n個獨立的模型。在分類任務中,通過對這n個模型的預測結果進行投票表決,得到最終的分類結果。
圖2. Bagging 方法的訓練過程。
遷移學習(Transfer Learning, TL)是指將已訓練好的網絡的低層結構和參數遷移到一個新的分類模型中,并通過調整高層模型的參數來完成特定的分類任務。殘差網絡(ResNet-50)基于深度卷積神經網絡框架,引入殘差模塊以緩解深層網絡的梯度消失問題,并通過遷移學習策略提升模型對小樣本數據的泛化能力。圖3展示了遷移學習的方法。
圖3. 卷積神經網絡(CNN)的遷移學習。
為了全面衡量所提出分類模型的性能,研究采用了準確率、ROC曲線、混淆矩陣來全面衡量所提分類模型的性能。準確率用于反映模型對整體樣本的分類正確程度;ROC曲線通過繪制不同閾值下的真陽性率(TPR)與假陽性率(FPR)關系,評估模型的分類能力與魯棒性;混淆矩陣則具體展示了模型對不同類別(黑色素瘤與色素痣)樣本的識別情況,包括真正例、假正例、真負例和假負例的數量,從而進一步分析模型在哪些類別上存在誤判或漏判現象。
結果
隨機森林模型在黑色素瘤和痣的分類中,訓練集的準確率為0.96,測試集的準確率為0.89。圖4描繪了隨機森林模型的ROC曲線和混淆矩陣結果。隨機森林模型的ROC曲線下面積(AUC)為0.89;圖4結果表明用于區分良性黑色素瘤和惡性黑色素瘤的隨機森林模型雖然能夠產生一定的分類效果,但其分類準確率并不理想。根據混淆矩陣,該模型在惡性樣本的一維數據分類上存在較高的錯誤率,整體分類準確率較低,且分類結果的可靠性欠佳。
圖4. 隨機森林分類結果:(a) ROC曲線和AUC曲線;(b) 混淆矩陣。
對比使用了深度殘差網絡來進行黑色素瘤和色素痣的分類。50層網絡的訓練集準確率為0.99,測試集準確率為0.98。圖5展示了殘差模型的ROC曲線、AUC面積以及混淆矩陣。殘差網絡模型的訓練準確率相對較高,在測試集上的分類準確率達到了0.98。圖5表明,深度模型的AUC面積大于隨機森林模型。50層殘差網絡模型表現更佳,其AUC值達到了0.98。根據混淆矩陣,殘差網絡模型在黑色素瘤惡性樣本的分類上更為準確。總體而言,兩種模型的分類性能均在可接受的誤差范圍內,而50層殘差網絡模型的分類結果相對更為可靠。
圖5. 深度殘差網絡的分類結果:(a) ROC曲線和AUC曲線;(b) 混淆矩陣。
如圖6所示,我們在不同維度的數據上對比了多種模型的表現,結果發現:隨機森林模型在一維數據上表現更優。這可能是由于隨機森林屬于Bagging類型的集成學習方法,通過多棵弱分類樹的投票或平均操作,可以獲得較高的準確性與較強的泛化能力。而深度神經網絡能夠從二維數據中提取更豐富的特征,因此其結果優于基于一維數據的模型。在各模型性能對比中,結合遷移學習的殘差網絡表現最佳。盡管用于二維建模的訓練數據量較少,但遷移學習在此過程中發揮了顯著作用,有效提升了模型的分類能力。
圖6. 不同模型的比較結果:(a) 一維數據上不同模型結果的比較;(b) 二維數據上不同模型結果的比較。
結論
本文旨在探究利用高光譜熒光數據,通過深度學習方法對黑色素瘤和痣進行分類的可能性。研究結果顯示,采用遷移學習的50層殘差網絡的整體性能優于隨機森林模型。隨機森林和殘差網絡模型的性能表明,高光譜熒光數據能夠更好地展現黑色素瘤與色素痣之間的特征差異,這種差異在一定程度上提高了分類模型的準確率。殘差網絡模型的分類準確率較為理想,其可靠的分類表現可助力醫生的臨床診斷。高光譜技術簡化了樣本處理流程,消除了因醫生水平差異導致的診斷錯誤,提升了診斷的及時性與普及度,并為其他皮膚色素性疾病診斷與鑒別診斷提供了良好的思路。
相關產品
免責聲明
- 凡本網注明“來源:化工儀器網”的所有作品,均為浙江興旺寶明通網絡有限公司-化工儀器網合法擁有版權或有權使用的作品,未經本網授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:化工儀器網”。違反上述聲明者,本網將追究其相關法律責任。
- 本網轉載并注明自其他來源(非化工儀器網)的作品,目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網注明的作品第一來源,并自負版權等法律責任。
- 如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。