本發(fā)明涉及醫(yī)療人工智能,尤其涉及一種使用深度學(xué)習(xí)的高分辨率食管測壓圖像分析方法。
背景技術(shù):
1、隨著芝加哥分類4.0(chicago?classification?version?4.0,ccv4.0)成為國際標(biāo)準(zhǔn),急需借助深度學(xué)習(xí)和大模型技術(shù)實(shí)現(xiàn)hrm圖像(高分辨率食管測壓圖像)的標(biāo)準(zhǔn)化、自動化解讀,從而提升診斷效率,減少臨床醫(yī)生負(fù)擔(dān)。
2、具體的,現(xiàn)有高分辨率測壓設(shè)備包括manoscan?360、manoscan?3.0、solar?gi?hrm系統(tǒng)及消化道動力檢測系統(tǒng)(型號:gap-24a)等,所能夠?qū)崿F(xiàn)自動化分析技術(shù),存在部分局限性,如ai模型的邏輯不透明,醫(yī)生無法直接查看算法判斷依據(jù),降低臨床信任度等缺陷。
3、此外,國內(nèi)多數(shù)測壓設(shè)備由分析軟件生成的測量相關(guān)參數(shù)仍依賴于手動標(biāo)記解剖和生理位置(如食管上括約肌、食管下括約肌等),并依照ccv4.0診斷流程判斷病理類型。這一過程不僅耗時(shí)長、依賴經(jīng)驗(yàn),還存在主觀誤差。部分傳統(tǒng)ai方法采用基于lstm的時(shí)序模型或單指標(biāo)閾值分類器進(jìn)行部分自動化判斷,但通常僅覆蓋ccv3.0階段的簡化分類規(guī)則,無法適應(yīng)ccv4.0對復(fù)雜病理模式和多指標(biāo)協(xié)同分析的要求。此外,現(xiàn)有模型普遍缺乏對hrm圖像空間-時(shí)序全局依賴的建模能力,也無法響應(yīng)自然語言形式的醫(yī)生查詢。因此,hrm的解讀會受到評估者之間的差異和評估者相關(guān)的不準(zhǔn)確性,這受到評估者經(jīng)驗(yàn)和專業(yè)知識的影響。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明公開了一種使用深度學(xué)習(xí)的高分辨率食管測壓圖像分析方法,以克服上述技術(shù)問題。
2、為了實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案是:
3、一種使用深度學(xué)習(xí)的高分辨率食管測壓圖像分析方法,包括如下步驟:
4、s1:獲取患者的食管測壓圖像序列;并根據(jù)臨床醫(yī)生針對食管測壓圖像序列所做出的初步的對食管動力異常的推斷結(jié)果,采用食管動力診斷大模型,獲取自然語言查詢文本;所述自然語言查詢文本用于描述患者所表現(xiàn)出的食管動力類型和動力異常的疾病類型;
5、s2:根據(jù)所述食管測壓圖像序列和自然語言查詢文本,采用基于大語言模型的多模態(tài)診斷模型,獲取融合了診斷請求與結(jié)構(gòu)化分割提示的文本;
6、s3:根據(jù)所述食管測壓圖像序列,采用多模態(tài)診斷模型,獲取用于定位食管測壓圖像中的食管動力異常區(qū)域的分割掩碼;
7、s4:采用基于大語言模型構(gòu)建的多模態(tài)診斷模型的總損失函數(shù),對多模態(tài)診斷模型進(jìn)行訓(xùn)練,以根據(jù)訓(xùn)練后的多模態(tài)診斷模型、融合了診斷請求與結(jié)構(gòu)化分割提示的文本和用于定位食管測壓圖像中的食管動力異常區(qū)域的分割掩碼,獲取待進(jìn)行分析的食管測壓圖像的預(yù)測的診斷推理流程及解釋文本,為臨床醫(yī)生提供診斷建議。
8、進(jìn)一步的,獲取用于定位食管測壓圖像中的食管動力異常區(qū)域的分割掩碼方法如下:
9、s31:采用多模態(tài)診斷模型,獲取指示在食管測壓圖像序列中的第i張食管測壓圖像上進(jìn)行分割操作的token,以確定在第i張食管測壓圖像上進(jìn)行分割操作的token對應(yīng)的隱藏層;
10、s32:采用在第i張食管測壓圖像上進(jìn)行分割操作的token對應(yīng)的隱藏層,獲取分割嵌入向量,所采用公式如下;
11、h_segi=γ(h~_segi)
12、式中:h_segi表示第i張食管測壓圖像的分割嵌入向量;γ為可訓(xùn)練的投影模塊;h~_segi表示第i張食管測壓圖像上進(jìn)行分割操作的token對應(yīng)的隱藏層;
13、s33:根據(jù)所述食管測壓圖像序列,獲取高維視覺特征表示f_i,所采用公式如下;
14、f_i=f_enc(xi)
15、式中:f_i表示第i張食管測壓圖像的高維視覺特征表示;f_enc(·)表示視覺骨干網(wǎng)絡(luò);xi表示第i張食管測壓圖像;
16、s33:根據(jù)所述高維視覺特征表示和分割嵌入向量,獲取用于定位食管測壓圖像中的食管動力異常區(qū)域的分割掩碼,所采用公式如下;
17、m~_i=f_dec(h_segi,f_i)
18、式中:m~_i表示用于定位第i張食管測壓圖像中的食管動力異常區(qū)域的分割掩碼;f_dec(·)表示解碼器。
19、進(jìn)一步的,所述基于大語言模型構(gòu)建的多模態(tài)診斷模型的總損失函數(shù)表示如下:
20、l=λ_txt×l_txt+λ_mask×l_mask
21、式中:l表示基于大語言模型構(gòu)建的多模態(tài)診斷模型的總損失函數(shù);λ_txt表示文本生成損失的權(quán)重系數(shù);l_txt表示文本生成損失;λ_mask表示分割損失的權(quán)重系數(shù);l_mask表示生成的分割掩碼損失;
22、其中,l_txt=ce(y_hat_txt,y_txt)
23、式中:ce(·)表示交叉熵?fù)p失;y_hat_txt表示融合了診斷請求與結(jié)構(gòu)化分割提示的文本;y_txt表示實(shí)際的文本標(biāo)注;
24、l_mask=λ_bce×bce(m~_i,m)+λ_dice×dice(m~_i,m)
25、其中,λ_bce表示二值交叉熵?fù)p失的權(quán)重系數(shù);bce(·)表示二值交叉熵?fù)p失;m~_i是用于定位第i張食管測壓圖像中的食管動力異常區(qū)域的分割掩碼,m是第i張食管測壓圖像的真實(shí)標(biāo)注掩碼;λ_dice表示表示dice損失的權(quán)重系數(shù);dice(·)表示基于預(yù)測掩碼與真實(shí)掩碼之間的dice系數(shù)構(gòu)建的損失函數(shù)。
26、進(jìn)一步的,所述食管動力類型包括蠕動失敗、弱收縮、正常蠕動、片段收縮、早熟型收縮、高收縮、全食管增壓;
27、所述動力異常的疾病類型包括:遠(yuǎn)端食管痙攣、賁門失弛緩癥、高收縮食管、失蠕動、無效食管動力。
28、進(jìn)一步的,所述解釋文本中描述了出現(xiàn)動力異常的食管測壓圖像,同時(shí)描述了所述食管測壓圖像中的動力異常的類別。
29、有益效果:本發(fā)明的一種使用深度學(xué)習(xí)的高分辨率食管測壓圖像分析方法,首先采用食管動力診斷大模型,根據(jù)臨床醫(yī)生針對食管測壓圖像序列所做出的初步的對食管動力異常的推斷結(jié)果,獲取自然語言查詢文本,然后采用基于大語言模型的多模態(tài)診斷模型,獲取融合了診斷請求與結(jié)構(gòu)化分割提示的文本和用于定位食管測壓圖像中的食管動力異常區(qū)域的分割掩碼,采用損失函數(shù)訓(xùn)練多模態(tài)診斷模型,獲得預(yù)測的診斷推理流程及解釋文本。本發(fā)明支持自然語言診斷請求與圖文聯(lián)合推理,自動為圖像中相關(guān)區(qū)域生成用于定位食管測壓圖像中的食管動力異常區(qū)域的分割掩碼,結(jié)合大語言模型的推理路徑,輸出對應(yīng)解釋性文本,幫助醫(yī)生追蹤診斷依據(jù),增強(qiáng)系統(tǒng)的透明性與信賴度。能夠適配ccv4.0標(biāo)準(zhǔn)的多分類結(jié)構(gòu),所預(yù)測的解釋文本中所描述的動力學(xué)異常的類別,涵蓋ccv4.0標(biāo)準(zhǔn)的多個(gè)類別,具備高度可擴(kuò)展性。
1.一種使用深度學(xué)習(xí)的高分辨率食管測壓圖像分析方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的一種使用深度學(xué)習(xí)的高分辨率食管測壓圖像分析方法,其特征在于,獲取用于定位食管測壓圖像中的食管動力異常區(qū)域的分割掩碼方法如下:
3.根據(jù)權(quán)利要求2所述的一種使用深度學(xué)習(xí)的高分辨率食管測壓圖像分析方法,其特征在于,所述基于大語言模型構(gòu)建的多模態(tài)診斷模型的總損失函數(shù)表示如下:
4.根據(jù)權(quán)利要求1所述的一種使用深度學(xué)習(xí)的高分辨率食管測壓圖像分析方法,其特征在于,所述食管動力類型包括蠕動失敗、弱收縮、正常蠕動、片段收縮、早熟型收縮、高收縮、全食管增壓;
5.根據(jù)權(quán)利要求1所述的一種使用深度學(xué)習(xí)的高分辨率食管測壓圖像分析方法,其特征在于,所述解釋文本中描述了出現(xiàn)動力異常的食管測壓圖像,同時(shí)描述了所述食管測壓圖像中的動力異常的類別。