亚洲综合日韩精品欧美综合区,日韩国产在线一区,久久久精品一二三区,午夜精品久久久久久中宇69,国产做爰一区二区三区视频,aa天堂,三级在线视频

一種基于多跳檢索和推理的復(fù)雜聲明事實核查方法及系統(tǒng)

文檔序號:42299478發(fā)布日期:2025-06-27 18:40閱讀:10來源:國知局

本發(fā)明涉及事實核查,尤其涉及一種基于多跳檢索和推理的復(fù)雜聲明事實核查方法及系統(tǒng)。


背景技術(shù):

1、隨著社交網(wǎng)絡(luò)的迅速發(fā)展,信息傳播的速度與廣度顯著提升,但同時也催生了虛假信息的大量擴散。事實核查系統(tǒng)旨在通過精準(zhǔn)檢索相關(guān)證據(jù)并對聲明的真實性進(jìn)行系統(tǒng)性驗證,從而有效遏制虛假信息的傳播,為信息環(huán)境的可信度與透明性提供保障。其主要目標(biāo)是通過自動化手段輔助人類判別信息的真實性,進(jìn)而提高社交媒體內(nèi)容的可靠性。傳統(tǒng)的事實核查方法通常采用兩階段的范式:首先從大規(guī)模語料庫中檢索與聲明相關(guān)的證據(jù),然后通過分析聲明與證據(jù)之間的語義關(guān)系來判斷聲明的真?zhèn)巍?/p>

2、然而,傳統(tǒng)方法大多依賴一對一的聲明和證據(jù)的相關(guān)性,在現(xiàn)有方法中,單跳檢索通常僅關(guān)注聲明與單條證據(jù)的語義相似性,難以有效捕捉多條證據(jù)之間的交互信息;多跳檢索雖然嘗試通過迭代方式整合證據(jù),但卻面臨意圖漂移、噪聲累積以及對超鏈接的依賴問題。同時,推理階段的挑戰(zhàn)在于難以同時捕獲局部語義特征和多條證據(jù)間的全局結(jié)構(gòu)關(guān)系,導(dǎo)致復(fù)雜聲明驗證的準(zhǔn)確性受限。


技術(shù)實現(xiàn)思路

1、鑒于此,本發(fā)明實施例提供了一種基于多跳檢索和推理的復(fù)雜聲明事實核查方法,以消除或改善現(xiàn)有技術(shù)中存在的一個或更多個缺陷。

2、本發(fā)明的一個方面提供了一種基于多跳檢索和推理的復(fù)雜聲明事實核查方法,該方法的步驟包括:

3、獲取待核查的聲明語句,通過多個檢索輪次構(gòu)建對應(yīng)聲明語句的證據(jù)集合;

4、在每個檢索輪次中,將所述聲明語句和當(dāng)前證據(jù)集合中的證據(jù)語句進(jìn)行組合,并通過約束生成式檢索器從數(shù)據(jù)庫中進(jìn)行檢索,得到檢索出的證據(jù)語句,并將該證據(jù)語句加入證據(jù)集合中;

5、將聲明語句與證據(jù)集合中的每個證據(jù)語句組合為一個聲明證據(jù)對,將每個所述聲明證據(jù)對輸入到遞歸記憶模型中進(jìn)行句內(nèi)推理,得到對應(yīng)的聲明證據(jù)對向量;

6、基于所述聲明證據(jù)對向量構(gòu)建對應(yīng)每個證據(jù)語句的多跳推理子圖,基于全部的多跳推理子圖得到句間推理向量;

7、將所述句間推理向量輸入到預(yù)設(shè)置的mlp模型中,得到聲明語句的核查結(jié)果。

8、采用上述方案,本方案聚焦于解決多跳檢索中的意圖偏移和多跳推理中的復(fù)雜關(guān)聯(lián)建模問題,這些問題是導(dǎo)致現(xiàn)有模型在處理復(fù)雜聲明時檢索效率低下和推理能力受限的核心挑戰(zhàn),具體的,本方案通過設(shè)計句內(nèi)推理和句間推理的分層式結(jié)構(gòu),在句內(nèi)推理中利用循環(huán)記憶捕捉長距離語義依賴,在句間推理中基于潛在連邊學(xué)習(xí)和圖神經(jīng)網(wǎng)絡(luò),構(gòu)建多跳證據(jù)子圖以建模復(fù)雜的跨證據(jù)語義關(guān)聯(lián),捕獲局部語義特征和多條證據(jù)間的全局結(jié)構(gòu)關(guān)系。

9、在本發(fā)明的一些實施方式中,在將所述聲明語句和當(dāng)前證據(jù)集合中的證據(jù)語句進(jìn)行組合,并通過約束生成式檢索器從數(shù)據(jù)庫中進(jìn)行檢索,得到檢索出的證據(jù)語句的步驟中:

10、將所述聲明語句和當(dāng)前證據(jù)集合中的證據(jù)語句進(jìn)行組合,并將組合語句輸入到預(yù)設(shè)置的查詢壓縮器中,得到壓縮后的組合語句;

11、將壓縮后的組合語句輸入到約束生成式檢索器中,得到檢索出的證據(jù)語句。

12、在本發(fā)明的一些實施方式中,在將聲明語句與證據(jù)集合中的每個證據(jù)語句組合為一個聲明證據(jù)對,將每個所述聲明證據(jù)對輸入到遞歸記憶模型中進(jìn)行句內(nèi)推理,得到對應(yīng)的聲明證據(jù)對向量的步驟中,每個所述聲明證據(jù)對輸入到包括多個transformer層的遞歸記憶模型中,得到對應(yīng)的聲明證據(jù)對向量。

13、在本發(fā)明的一些實施方式中,在證據(jù)集合中基于證據(jù)語句的加入順序,對所述證據(jù)語句進(jìn)行順序編號,在基于所述聲明證據(jù)對向量構(gòu)建對應(yīng)每個證據(jù)語句的多跳推理子圖的步驟中:

14、在證據(jù)語句對應(yīng)的多跳推理子圖中包括該證據(jù)語句的編號的前序編號的任一個證據(jù)語句的對應(yīng)節(jié)點,在多跳推理子圖中基于證據(jù)語句的編號對各個節(jié)點順序連接構(gòu)建多條路徑邊;

15、基于各個節(jié)點對應(yīng)的聲明證據(jù)對向量的相似度構(gòu)建節(jié)點之間的潛在連邊,得到最終的多跳推理子圖。

16、在本發(fā)明的一些實施方式中,在基于各個節(jié)點對應(yīng)的聲明證據(jù)對向量的相似度構(gòu)建節(jié)點之間的潛在連邊,得到最終的多跳推理子圖的步驟中,基于節(jié)點對應(yīng)的聲明證據(jù)對向量計算相似度,并與預(yù)設(shè)置的相似度閾值比較,判定是否構(gòu)建兩個節(jié)點之間的潛在連邊。

17、在本發(fā)明的一些實施方式中,在基于全部的多跳推理子圖得到句間推理向量的步驟中,將每個多跳推理子圖通過圖注意力層進(jìn)行處理,并對全部的多跳推理子圖進(jìn)行聚合,得到句間推理向量。

18、在本發(fā)明的一些實施方式中,所述方法的步驟還包括對查詢壓縮器進(jìn)行預(yù)訓(xùn)練,對查詢壓縮器進(jìn)行預(yù)訓(xùn)練的步驟包括蒸餾和對齊處理;

19、在蒸餾處理的過程中,采用預(yù)設(shè)置的大語言模型處理聲明語句和證據(jù)語句的組合語句,生成壓縮文本,作為查詢壓縮器的學(xué)習(xí)目標(biāo);

20、使用預(yù)設(shè)置的大語言模型來計算壓縮文本與原始的聲明語句的語義匹配度,將得分最高的壓縮文本作為正樣本,將其余的壓縮文本作為負(fù)樣本;

21、基于所述正樣本和負(fù)樣本訓(xùn)練所述查詢壓縮器。

22、在本發(fā)明的一些實施方式中,在基于所述正樣本和負(fù)樣本訓(xùn)練所述查詢壓縮器的步驟中,將所述正樣本和負(fù)樣本對應(yīng)的組合語句輸入到查詢壓縮器,得到壓縮后的組合語句,基于壓縮后的組合語句與所述正樣本和負(fù)樣本計算損失函數(shù),基于損失函數(shù)值對查詢壓縮器進(jìn)行訓(xùn)練。

23、在本發(fā)明的一些實施方式中,在基于壓縮后的組合語句與所述正樣本和負(fù)樣本計算損失函數(shù)的步驟中,基于如下公式計算損失函數(shù):

24、

25、其中,la表示損失函數(shù)的值,n表示組合語句的數(shù)量,n表示負(fù)樣本的數(shù)量,qi表示第i個壓縮后的組合語句,q+表示正樣本,表示第j個負(fù)樣本,f(·)表示編碼器,τ表示溫度系數(shù)。

26、本發(fā)明的第二方面還提供一種基于多跳檢索和推理的復(fù)雜聲明事實核查系統(tǒng),該系統(tǒng)包括計算機設(shè)備,所述計算機設(shè)備包括處理器和存儲器,所述存儲器中存儲有計算機指令,所述處理器用于執(zhí)行所述存儲器中存儲的計算機指令,當(dāng)所述計算機指令被處理器執(zhí)行時該系統(tǒng)實現(xiàn)如前所述方法所實現(xiàn)的步驟。

27、本發(fā)明的第三方面還提供一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,該計算機程序被處理器執(zhí)行時以實現(xiàn)前述基于多跳檢索和推理的復(fù)雜聲明事實核查方法所實現(xiàn)的步驟。

28、本發(fā)明的附加優(yōu)點、目的,以及特征將在下面的描述中將部分地加以闡述,且將對于本領(lǐng)域普通技術(shù)人員在研究下文后部分地變得明顯,或者可以根據(jù)本發(fā)明的實踐而獲知。本發(fā)明的目的和其它優(yōu)點可以通過在說明書以及附圖中具體指出并獲得。

29、本領(lǐng)域技術(shù)人員將會理解的是,能夠用本發(fā)明實現(xiàn)的目的和優(yōu)點不限于以上具體所述,并且根據(jù)以下詳細(xì)說明將更清楚地理解本發(fā)明能夠?qū)崿F(xiàn)的上述和其他目的。



技術(shù)特征:

1.一種基于多跳檢索和推理的復(fù)雜聲明事實核查方法,其特征在于,該方法的步驟包括:

2.根據(jù)權(quán)利要求1所述的基于多跳檢索和推理的復(fù)雜聲明事實核查方法,其特征在于,在將所述聲明語句和當(dāng)前證據(jù)集合中的證據(jù)語句進(jìn)行組合,并通過約束生成式檢索器從數(shù)據(jù)庫中進(jìn)行檢索,得到檢索出的證據(jù)語句的步驟中:

3.根據(jù)權(quán)利要求1所述的基于多跳檢索和推理的復(fù)雜聲明事實核查方法,其特征在于,在將聲明語句與證據(jù)集合中的每個證據(jù)語句組合為一個聲明證據(jù)對,將每個所述聲明證據(jù)對輸入到遞歸記憶模型中進(jìn)行句內(nèi)推理,得到對應(yīng)的聲明證據(jù)對向量的步驟中,每個所述聲明證據(jù)對輸入到包括多個transformer層的遞歸記憶模型中,得到對應(yīng)的聲明證據(jù)對向量。

4.根據(jù)權(quán)利要求1所述的基于多跳檢索和推理的復(fù)雜聲明事實核查方法,其特征在于,在證據(jù)集合中基于證據(jù)語句的加入順序,對所述證據(jù)語句進(jìn)行順序編號,在基于所述聲明證據(jù)對向量構(gòu)建對應(yīng)每個證據(jù)語句的多跳推理子圖的步驟中:

5.根據(jù)權(quán)利要求4所述的基于多跳檢索和推理的復(fù)雜聲明事實核查方法,其特征在于,在基于各個節(jié)點對應(yīng)的聲明證據(jù)對向量的相似度構(gòu)建節(jié)點之間的潛在連邊,得到最終的多跳推理子圖的步驟中,基于節(jié)點對應(yīng)的聲明證據(jù)對向量計算相似度,并與預(yù)設(shè)置的相似度閾值比較,判定是否構(gòu)建兩個節(jié)點之間的潛在連邊。

6.根據(jù)權(quán)利要求1所述的基于多跳檢索和推理的復(fù)雜聲明事實核查方法,其特征在于,在基于全部的多跳推理子圖得到句間推理向量的步驟中,

7.根據(jù)權(quán)利要求2所述的基于多跳檢索和推理的復(fù)雜聲明事實核查方法,其特征在于,所述方法的步驟還包括對查詢壓縮器進(jìn)行預(yù)訓(xùn)練,對查詢壓縮器進(jìn)行預(yù)訓(xùn)練的步驟包括蒸餾和對齊處理;

8.根據(jù)權(quán)利要求7所述的基于多跳檢索和推理的復(fù)雜聲明事實核查方法,其特征在于,在基于所述正樣本和負(fù)樣本訓(xùn)練所述查詢壓縮器的步驟中,將所述正樣本和負(fù)樣本對應(yīng)的組合語句輸入到查詢壓縮器,得到壓縮后的組合語句,基于壓縮后的組合語句與所述正樣本和負(fù)樣本計算損失函數(shù),基于損失函數(shù)值對查詢壓縮器進(jìn)行訓(xùn)練。

9.根據(jù)權(quán)利要求8所述的基于多跳檢索和推理的復(fù)雜聲明事實核查方法,其特征在于,在基于壓縮后的組合語句與所述正樣本和負(fù)樣本計算損失函數(shù)的步驟中,基于如下公式計算損失函數(shù):

10.一種基于多跳檢索和推理的復(fù)雜聲明事實核查系統(tǒng),其特征在于,該系統(tǒng)包括計算機設(shè)備,所述計算機設(shè)備包括處理器和存儲器,所述存儲器中存儲有計算機指令,所述處理器用于執(zhí)行所述存儲器中存儲的計算機指令,當(dāng)所述計算機指令被處理器執(zhí)行時該系統(tǒng)實現(xiàn)如權(quán)利要求1~9任一項所述方法所實現(xiàn)的步驟。


技術(shù)總結(jié)
本發(fā)明提供一種基于多跳檢索和推理的復(fù)雜聲明事實核查方法及系統(tǒng),該方法的步驟包括:獲取待核查的聲明語句,通過多個檢索輪次構(gòu)建對應(yīng)聲明語句的證據(jù)集合;在每個檢索輪次中,將所述聲明語句和當(dāng)前證據(jù)集合中的證據(jù)語句進(jìn)行組合,并通過約束生成式檢索器從數(shù)據(jù)庫中進(jìn)行檢索,得到檢索出的證據(jù)語句,并將該證據(jù)語句加入證據(jù)集合中;將聲明語句與證據(jù)集合中的每個證據(jù)語句組合為一個聲明證據(jù)對輸入到遞歸記憶模型中進(jìn)行句內(nèi)推理,得到對應(yīng)的聲明證據(jù)對向量;基于所述聲明證據(jù)對向量構(gòu)建對應(yīng)每個證據(jù)語句的多跳推理子圖,基于全部的多跳推理子圖得到句間推理向量;將所述句間推理向量輸入到預(yù)設(shè)置的MLP模型中,得到聲明語句的核查結(jié)果。

技術(shù)研發(fā)人員:李朝卓,鄭莉雯,賈浩苒,張力天,張熙
受保護(hù)的技術(shù)使用者:北京郵電大學(xué)
技術(shù)研發(fā)日:
技術(shù)公布日:2025/6/26
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1