背景技術(shù):
1、性能劣化是機器學習技術(shù)中常見的關(guān)注話題。應(yīng)對這種劣化的一種方法是利用更新的、更相關(guān)的訓練數(shù)據(jù)來更新對機器學習模型的訓練。然而,當機器學習模型在大量數(shù)據(jù)上進行訓練時,每次遇到新數(shù)據(jù)時都重新訓練模型是不切實際的。
技術(shù)實現(xiàn)思路
1、在一些方面中,本公開描述的技術(shù)涉及一種重新訓練目標機器學習模型的方法,該目標機器學習模型由來自第一輸入數(shù)據(jù)的第一數(shù)據(jù)樣本訓練,第一數(shù)據(jù)樣本被分類為第一一致性類的成員,該方法包括:基于來自替代成員資格分類模型的預測來從第二輸入數(shù)據(jù)中選擇第二數(shù)據(jù)樣本,其中由替代成員資格分類模型基于第二輸入數(shù)據(jù)的每個數(shù)據(jù)樣本的特征內(nèi)容,將第二數(shù)據(jù)樣本預測為不同于第一一致性類的第二一致性類的成員;以及基于選擇操作,使用第二數(shù)據(jù)樣本來重新訓練目標機器學習模型。
2、在一些方面中,本公開描述的技術(shù)涉及一種用于重新訓練目標機器學習模型的計算系統(tǒng),該目標機器學習模型由來自第一輸入數(shù)據(jù)的第一數(shù)據(jù)樣本訓練,第一數(shù)據(jù)樣本被分類為第一一致性類的成員,該計算系統(tǒng)包括:一個或多個硬件處理器;重新訓練數(shù)據(jù)選擇器,其由一個或多個硬件處理器可執(zhí)行并且被配置為基于來自替代成員資格分類模型的預測來從第二輸入數(shù)據(jù)中選擇第二數(shù)據(jù)樣本,其中重新訓練數(shù)據(jù)選擇器包括替代成員資格分類模型,該替代成員資格分類模型被配置為基于第二輸入數(shù)據(jù)的每個數(shù)據(jù)樣本的特征內(nèi)容,將來自第二輸入數(shù)據(jù)的第二數(shù)據(jù)樣本預測為不同于第一一致性類的第二一致性類的成員;以及機器學習模型重新訓練器,其由一個或多個硬件處理器可執(zhí)行并且被配置為使用第二數(shù)據(jù)樣本來重新訓練目標機器學習模型。
3、在一些方面中,本公開描述的技術(shù)涉及一種或多種有形處理器可讀存儲介質(zhì),其利用指令來體現(xiàn),該指令用于在計算設(shè)備的一個或多個處理器和電路上執(zhí)行重新訓練目標機器學習模型的過程,該目標機器學習模型由來自第一輸入數(shù)據(jù)的第一數(shù)據(jù)樣本訓練,第一數(shù)據(jù)樣本被分類為第一一致性類的成員,該過程包括:基于來自替代成員資格分類模型的預測來從第二輸入數(shù)據(jù)中選擇第二數(shù)據(jù)樣本,其中由替代成員資格分類模型基于第二輸入數(shù)據(jù)的每個數(shù)據(jù)樣本的特征內(nèi)容,將第二數(shù)據(jù)樣本預測為不同于第一一致性類的第二一致性類的成員;基于相對于第一數(shù)據(jù)樣本的一致性得分對第二數(shù)據(jù)樣本的每個數(shù)據(jù)樣本進行加權(quán);以及基于選擇操作和加權(quán)操作,使用第二數(shù)據(jù)樣本來重新訓練目標機器學習模型。
4、提供本
技術(shù)實現(xiàn)要素:
來以簡化形式介紹一系列概念。下面在具體實施方式中進一步描述這些概念。本發(fā)明內(nèi)容不旨在標識所要求保護的主題的關(guān)鍵特征或必要特征,其也不旨在用于限制所要求保護的主題的范圍。
5、本公開中還描述和記載了其他實現(xiàn)方式。
1.一種重新訓練目標機器學習模型(102)的方法(300),所述目標機器學習模型由來自第一輸入數(shù)據(jù)(104)的第一數(shù)據(jù)樣本訓練,所述第一數(shù)據(jù)樣本被分類為第一一致性類的成員,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其中所述選擇操作包括:
3.根據(jù)權(quán)利要求1所述的方法,其中所述選擇操作包括:
4.根據(jù)權(quán)利要求3所述的方法,其中所述選擇操作包括:
5.根據(jù)權(quán)利要求1所述的方法,其中所述第一輸入數(shù)據(jù)在所述第二輸入數(shù)據(jù)之前被輸入到所述目標機器學習模型。
6.根據(jù)權(quán)利要求1所述的方法,其中所述選擇操作包括:
7.根據(jù)權(quán)利要求1所述的方法,其中所述第一一致性類和所述第二一致性類是互斥的。
8.一種用于重新訓練目標機器學習模型(102)的計算系統(tǒng)(100),所述目標機器學習模型由來自第一輸入數(shù)據(jù)(104)的第一數(shù)據(jù)樣本訓練,所述第一數(shù)據(jù)樣本被分類為第一一致性類的成員,所述計算系統(tǒng)(100)包括:
9.根據(jù)權(quán)利要求8所述的計算系統(tǒng),其中所述替代成員資格分類模型使用從所述第一輸入數(shù)據(jù)和所述第二輸入數(shù)據(jù)中選擇的焦點訓練數(shù)據(jù)集被訓練。
10.根據(jù)權(quán)利要求8所述的計算系統(tǒng),還包括:
11.根據(jù)權(quán)利要求10所述的計算系統(tǒng),還包括:
12.根據(jù)權(quán)利要求8所述的計算系統(tǒng),其中在所述目標機器學習模型的重新訓練之前,所述第二數(shù)據(jù)樣本基于相對于所述第一數(shù)據(jù)樣本的一致性得分被加權(quán)。
13.根據(jù)權(quán)利要求8所述的計算系統(tǒng),其中所述重新訓練數(shù)據(jù)選擇器還被配置為由所述替代成員資格分類模型針對所述第二輸入數(shù)據(jù)的每個數(shù)據(jù)樣本生成一致性得分,并且基于所述第二輸入數(shù)據(jù)的每個數(shù)據(jù)樣本的所述一致性得分是否滿足成員資格條件來標識所述第二數(shù)據(jù)樣本。
14.根據(jù)權(quán)利要求8所述的計算系統(tǒng),其中所述重新訓練數(shù)據(jù)選擇器還被配置為基于所述第二一致性類的數(shù)據(jù)樣本滿足重新訓練條件來觸發(fā)重新訓練。
15.一種或多種有形處理器可讀存儲(420)介質(zhì),所述一種或多種有形處理器可讀存儲介質(zhì)利用指令被體現(xiàn),所述指令用于在計算設(shè)備(400)的一個或多個處理器(402)和電路上執(zhí)行重新訓練目標機器學習模型(102)的過程(300),所述目標機器學習模型由來自第一輸入數(shù)據(jù)(104)的第一數(shù)據(jù)樣本訓練,所述第一數(shù)據(jù)樣本被分類為第一一致性類的成員,所述過程(300)包括:
16.根據(jù)權(quán)利要求15所述的一種或多種有形處理器可讀存儲介質(zhì),其中所述選擇操作包括:
17.根據(jù)權(quán)利要求15所述的一種或多種有形處理器可讀存儲介質(zhì),其中所述選擇操作包括:
18.根據(jù)權(quán)利要求17所述的一種或多種有形處理器可讀存儲介質(zhì),其中所述選擇操作包括:
19.根據(jù)權(quán)利要求15所述的一種或多種有形處理器可讀存儲介質(zhì),其中所述選擇操作包括:
20.根據(jù)權(quán)利要求15所述的一種或多種有形處理器可讀存儲介質(zhì),其中所述第一一致性類和所述第二一致性類是互斥的。