本技術(shù)涉及設(shè)備識別的,尤其是涉及一種基于深度學(xué)習(xí)的電力設(shè)備智能識別方法及系統(tǒng)。
背景技術(shù):
1、在電力系統(tǒng)的日常運(yùn)維管理中,電力設(shè)備的準(zhǔn)確識別是保障電網(wǎng)安全穩(wěn)定運(yùn)行的關(guān)鍵環(huán)節(jié)。隨著電力網(wǎng)絡(luò)的不斷擴(kuò)張和復(fù)雜化,電力設(shè)備的種類和數(shù)量日益增多,分布范圍也愈發(fā)廣泛。傳統(tǒng)的人工巡檢方式不僅效率低下,需要耗費(fèi)大量的人力、物力和時間,而且由于人工判斷存在主觀性和局限性,容易出現(xiàn)漏檢、誤檢等問題,難以滿足現(xiàn)代電力系統(tǒng)對設(shè)備識別準(zhǔn)確性和及時性的高要求。因此,實(shí)現(xiàn)電力設(shè)備的高效、精準(zhǔn)智能識別成為電力行業(yè)亟待解決的重要問題,對于提升電力系統(tǒng)的運(yùn)維管理水平、保障電力供應(yīng)的可靠性具有至關(guān)重要的意義。
2、為解決電力設(shè)備識別問題,目前已有多種技術(shù)手段被提出和應(yīng)用。其中,基于圖像處理的傳統(tǒng)方法是一類常見的技術(shù)。這類方法主要通過對電力設(shè)備圖像進(jìn)行特征提取,如顏色、形狀、紋理等特征,然后利用模式識別算法對提取的特征進(jìn)行分析和分類,從而實(shí)現(xiàn)對電力設(shè)備的識別。此外,隨著人工智能技術(shù)的快速發(fā)展,基于機(jī)器學(xué)習(xí)的方法也逐漸應(yīng)用于電力設(shè)備識別領(lǐng)域。一些研究采用傳統(tǒng)的機(jī)器學(xué)習(xí)算法,如支持向量機(jī)(svm)、決策樹等,構(gòu)建分類模型對電力設(shè)備圖像進(jìn)行分類識別。
3、近年來,深度學(xué)習(xí)技術(shù)的興起為電力設(shè)備識別帶來了新的思路和方法。深度學(xué)習(xí)算法具有強(qiáng)大的特征學(xué)習(xí)和表達(dá)能力,能夠自動從大量圖像數(shù)據(jù)中學(xué)習(xí)到有效的特征表示,但在訓(xùn)練數(shù)據(jù)獲取和處理上存在不足,而獲取大量高質(zhì)量且標(biāo)注準(zhǔn)確的電力設(shè)備圖像數(shù)據(jù)較為困難,增加了數(shù)據(jù)收集的成本和時間。
技術(shù)實(shí)現(xiàn)思路
1、為了能夠在訓(xùn)練樣本有限的情況下,提高對電力設(shè)備識別結(jié)果的準(zhǔn)確性,本技術(shù)提供了一種基于深度學(xué)習(xí)的電力設(shè)備智能識別方法及系統(tǒng)。
2、第一方面,本技術(shù)提供了一種基于深度學(xué)習(xí)的電力設(shè)備智能識別方法,采用如下的技術(shù)方案:
3、一種基于深度學(xué)習(xí)的電力設(shè)備智能識別方法,包括以下步驟:
4、采集電力設(shè)備的實(shí)時圖像和歷史圖像,對歷史圖像進(jìn)行拼接處理,獲得拼接圖像,在拼接圖像中隨機(jī)截取與歷史圖像大小相同的子圖,為歷史圖像和子圖添加訓(xùn)練標(biāo)簽,獲得訓(xùn)練數(shù)據(jù);
5、利用深度學(xué)習(xí)算法構(gòu)建分類模型,采用訓(xùn)練數(shù)據(jù)對分類模型進(jìn)行訓(xùn)練,獲得訓(xùn)練后的分類模型,將實(shí)時圖像輸入訓(xùn)練后的分類模型,輸出分類結(jié)果。
6、本技術(shù)通過對歷史圖像進(jìn)行拼接,獲取拼接圖像,以及在拼接圖像中截取子圖等操作,有效擴(kuò)充了訓(xùn)練數(shù)據(jù)集,增加了數(shù)據(jù)的多樣性和豐富度,有助于分類模型學(xué)習(xí)到更全面的圖像特征,提高分類模型的分類準(zhǔn)確率和泛化能力,使其在面對不同場景、不同狀態(tài)的電力設(shè)備圖像時都能做到準(zhǔn)確分類。本技術(shù)構(gòu)建的分類模型能夠?qū)Σ杉碾娏υO(shè)備的實(shí)時圖像進(jìn)行快速分類,實(shí)現(xiàn)了對電力設(shè)備狀態(tài)的實(shí)時監(jiān)測。通過及時輸出分類結(jié)果,本技術(shù)可以幫助運(yùn)維人員迅速了解電力設(shè)備的運(yùn)行狀況,及時發(fā)現(xiàn)潛在問題,為電力設(shè)備的維護(hù)和管理提供有力支持,有助于提高電力系統(tǒng)的穩(wěn)定性和可靠性。
7、可選地,電力設(shè)備包含有多個設(shè)備部件,在拼接圖像中隨機(jī)截取與歷史圖像大小相同的子圖之后,所述方法還包括:
8、采用預(yù)先構(gòu)建的yolov8s模型標(biāo)注拼接圖像中電力設(shè)備的整體邊界框,獲得標(biāo)注有整體邊界框的拼接圖像,對標(biāo)注有整體邊界框的拼接圖像進(jìn)行語義分割處理,獲得設(shè)備部件的分割掩碼,在分割掩碼中提取部件輪廓,根據(jù)部件輪廓計(jì)算最小外接矩形;
9、構(gòu)建坐標(biāo)系,確定最小外接矩形的坐標(biāo)范圍和子圖的坐標(biāo)范圍,基于最小外接矩形的坐標(biāo)范圍和子圖的坐標(biāo)范圍,刪除包含有不完整的最小外接矩形的子圖。
10、本技術(shù)通過保留包含完整設(shè)備部件的子圖,使得訓(xùn)練數(shù)據(jù)更加聚焦于有效的設(shè)備部件,有助于分類模型更好地學(xué)習(xí)設(shè)備部件的特征模式,提高分類模型的訓(xùn)練效率和分類準(zhǔn)確性。在刪除部分子圖后,減少了分類模型的訓(xùn)練過程中需要處理的數(shù)據(jù)量,減少了對計(jì)算資源的消耗,提高了訓(xùn)練速度。
11、可選地,yolov8s模型包括用于特征提取的主干網(wǎng)絡(luò)、用于特征融合的頸部網(wǎng)絡(luò)和用于預(yù)測整體邊界框的檢測頭,采用預(yù)先構(gòu)建的yolov8s模型標(biāo)注拼接圖像中所包含電力設(shè)備的整體邊界框之前,所述方法還包括:
12、生成標(biāo)簽:獲取imagenet-x數(shù)據(jù)集所包含的電力設(shè)備的圖像,記為目標(biāo)圖像,使用標(biāo)注工具標(biāo)注目標(biāo)圖像所包含電力設(shè)備的整體邊界框,生成yolo格式標(biāo)簽;
13、預(yù)訓(xùn)練:采用帶有yolo格式標(biāo)簽的目標(biāo)圖像對預(yù)先構(gòu)建的yolov8s模型進(jìn)行預(yù)訓(xùn)練,獲得預(yù)訓(xùn)練后的yolov8s模型;
14、微調(diào):凍結(jié)預(yù)訓(xùn)練后的yolov8s模型中主干網(wǎng)絡(luò)的前m層的參數(shù)以及頸部網(wǎng)絡(luò)的下采樣路徑的參數(shù),獲取n張標(biāo)注有整體邊界框的拼接圖像作為訓(xùn)練集,采用訓(xùn)練集微調(diào)預(yù)訓(xùn)練后的yolov8s模型中未凍結(jié)部分的參數(shù),獲得遷移訓(xùn)練后的yolov8s模型;
15、模型更新:將遷移訓(xùn)練后的yolov8s模型更新為預(yù)先構(gòu)建的yolov8s模型。
16、本技術(shù)使用標(biāo)注工具對imagenet?-?x數(shù)據(jù)集中的電力設(shè)備圖像標(biāo)注整體邊界框并生成yolo格式標(biāo)簽,為模型訓(xùn)練提供了明確的目標(biāo)信息,yolo格式標(biāo)簽簡潔且便于yolov8s模型分析,能使yolov8s模型快速理解圖像中電力設(shè)備的位置,從而有針對性地學(xué)習(xí)特征與邊界框位置之間的映射關(guān)系,有助于yolov8s模型在訓(xùn)練初期快速收斂。imagenet-?x數(shù)據(jù)集包含大量不同場景、不同角度、不同光照條件下的電力設(shè)備圖像。本技術(shù)通過利用該數(shù)據(jù)集生成yolo格式標(biāo)簽,能夠使yolov8s模型接觸到多樣化的電力設(shè)備圖像樣本,學(xué)習(xí)到更廣泛的特征表示,增強(qiáng)yolov8s模型對各種復(fù)雜情況的適應(yīng)能力,提高yolov8s模型的泛化性。
17、本技術(shù)采用帶有yolo格式標(biāo)簽的目標(biāo)圖像對預(yù)先構(gòu)建的yolov8s模型進(jìn)行預(yù)訓(xùn)練,使yolov8s模型在正式訓(xùn)練前已經(jīng)學(xué)習(xí)到了一些關(guān)于電力設(shè)備的基本特征和模式。在后續(xù)的訓(xùn)練過程中,yolov8s模型可以基于這些已有的知識進(jìn)行更高效的學(xué)習(xí),減少訓(xùn)練迭代次數(shù),加速收斂速度,節(jié)省訓(xùn)練時間和計(jì)算資源。在微調(diào)的步驟中,本技術(shù)通過使用標(biāo)注有整體邊界框的拼接圖像作為訓(xùn)練集,yolov8s模型可以學(xué)習(xí)到拼接圖像中電力設(shè)備的獨(dú)特特征和邊界框分布規(guī)律,提高模型在拼接圖像上的標(biāo)注準(zhǔn)確性。
18、可選地,在執(zhí)行生成標(biāo)簽的步驟之后,執(zhí)行預(yù)訓(xùn)練的步驟之前,所述方法還包括:
19、對每個目標(biāo)圖像進(jìn)行simclr風(fēng)格的增強(qiáng)處理,獲得每個目標(biāo)圖像的增強(qiáng)圖像對;
20、構(gòu)建對比學(xué)習(xí)模型,所述對比學(xué)習(xí)模型包括編碼器和投影頭,所述編碼器為yolov8s模型的主干網(wǎng)絡(luò),所述投影頭包括2層mlp,采用增強(qiáng)圖像對迭代訓(xùn)練對比學(xué)習(xí)模型,直至滿足預(yù)設(shè)停止條件后,停止訓(xùn)練,輸出主干網(wǎng)絡(luò)的參數(shù),將主干網(wǎng)絡(luò)參數(shù)更新至預(yù)先構(gòu)建的yolov8s模型中,執(zhí)行預(yù)訓(xùn)練的步驟。
21、本技術(shù)對每個目標(biāo)圖像進(jìn)行simclr風(fēng)格的增強(qiáng)處理,生成增強(qiáng)圖像對,從而能夠創(chuàng)造出與原始圖像相似但又具有差異的新圖像。在實(shí)際應(yīng)用中,電力設(shè)備的圖像可能會受到各種因素的影響,如光照變化、拍攝角度不同、設(shè)備表面污漬等。simclr風(fēng)格的增強(qiáng)處理可以模擬這些真實(shí)場景中的變化,讓yolov8s模型在訓(xùn)練過程中接觸到更多類似實(shí)際情況的圖像樣本。本技術(shù)通過生成增強(qiáng)圖像對,增加了數(shù)據(jù)的多樣性,有助于yolov8s模型學(xué)習(xí)到更具泛化性的特征,盡量避免yolov8s模型過擬合于特定的圖像特征,使yolov8s模型能夠更好地適應(yīng)不同場景和條件下的電力設(shè)備圖像。
22、本技術(shù)構(gòu)建的對比學(xué)習(xí)模型以yolov8s模型的主干網(wǎng)絡(luò)作為編碼器,通過訓(xùn)練對比學(xué)習(xí)模型,能夠使主干網(wǎng)絡(luò)學(xué)習(xí)到更具區(qū)分性的特征表示,對比學(xué)習(xí)是一種無監(jiān)督學(xué)習(xí)方法,不需要人工標(biāo)注額外的信息,只需要利用增強(qiáng)圖像對之間的相似性和不相似性進(jìn)行訓(xùn)練,在一定程度上減少了人工標(biāo)注的工作量和成本,本技術(shù)利用大量未標(biāo)注的電力設(shè)備的圖像數(shù)據(jù)進(jìn)行訓(xùn)練,進(jìn)一步豐富對比學(xué)習(xí)模型的學(xué)習(xí)樣本,提高對比學(xué)習(xí)模型的性能。
23、本技術(shù)通過對比學(xué)習(xí)提升了主干網(wǎng)絡(luò)的特征提取能力,進(jìn)而為整個yolov8s模型的邊界框標(biāo)注任務(wù)提供了更優(yōu)質(zhì)的特征輸入。在后續(xù)的預(yù)訓(xùn)練和微調(diào)過程中,yolov8s模型可以更好地利用這些特征進(jìn)行邊界框預(yù)測,從而提高yolov8s模型在標(biāo)注拼接圖像中電力設(shè)備整體邊界框任務(wù)上的準(zhǔn)確性和魯棒性。
24、可選地,所述方法還包括:將主干網(wǎng)絡(luò)參數(shù)更新至預(yù)先構(gòu)建的yolov8s模型中之后,在執(zhí)行預(yù)訓(xùn)練的步驟時,凍結(jié)預(yù)先構(gòu)建的yolov8s模型中主干網(wǎng)絡(luò)的參數(shù)。
25、本技術(shù)通過simclr風(fēng)格的對比學(xué)習(xí)對主干網(wǎng)絡(luò)進(jìn)行了訓(xùn)練,使其學(xué)習(xí)到了具有良好區(qū)分性的特征表示,凍結(jié)主干網(wǎng)絡(luò)參數(shù)可以使得在預(yù)訓(xùn)練階段,在對比學(xué)習(xí)中獲得的優(yōu)質(zhì)特征不會被后續(xù)的訓(xùn)練過程破壞或改變。凍結(jié)主干網(wǎng)絡(luò)的參數(shù)意味著在預(yù)訓(xùn)練階段只需要對頸部網(wǎng)絡(luò)和檢測頭的參數(shù)進(jìn)行更新,減少了需要訓(xùn)練的參數(shù)數(shù)量,加速了預(yù)訓(xùn)練的收斂速度,節(jié)省了訓(xùn)練時間和計(jì)算資源,而且在預(yù)訓(xùn)練的反向傳播過程中,梯度只需要傳遞到頸部網(wǎng)絡(luò)和檢測頭,梯度傳播的路徑更加穩(wěn)定和直接,有助于yolov8s模型更快地調(diào)整頸部網(wǎng)絡(luò)和檢測頭的參數(shù),使yolov8s模型能夠更好地適應(yīng)預(yù)訓(xùn)練數(shù)據(jù)集,加速整個yolov8s模型的收斂過程。
26、可選地,在確定最小外接矩形的坐標(biāo)范圍和子圖的坐標(biāo)范圍之后,所述方法還包括:
27、為每個最小外接矩形設(shè)置初始的置信度,采用區(qū)域分割算法對標(biāo)注有整體邊界框的拼接圖像進(jìn)行圖像分割,篩選包含有設(shè)備部件的圖像塊,獲取每個圖像塊的坐標(biāo)范圍;
28、判斷第i個圖像塊的坐標(biāo)范圍是否落入對應(yīng)的最小外接矩形的坐標(biāo)范圍,若是,則增加第i個圖像塊所屬最小外接矩形的置信度;若否,則減小第i個圖像塊所屬最小外接矩形的置信度,刪除置信度小于預(yù)設(shè)置信度閾值的最小外接矩形。
29、本技術(shù)采用區(qū)域分割算法對標(biāo)注有整體邊界框的拼接圖像進(jìn)行分割,進(jìn)而篩選出包含設(shè)備部件的圖像塊,將原本可能包含多個設(shè)備部件或背景干擾的整體邊界框區(qū)域,進(jìn)一步劃分為更精確的設(shè)備部件所在圖像塊。
30、本技術(shù)通過判斷圖像塊坐標(biāo)范圍與最小外接矩形坐標(biāo)范圍的關(guān)系,動態(tài)增加或減小最小外接矩形的置信度,當(dāng)圖像塊坐標(biāo)范圍落入最小外接矩形內(nèi)時,說明該最小外接矩形可能準(zhǔn)確包含了該設(shè)備部件,增加其置信度;反之則減小置信度,上述方案能夠根據(jù)實(shí)際的圖像分割結(jié)果,對最小外接矩形進(jìn)行篩選和優(yōu)化,刪除置信度小于預(yù)設(shè)置信度閾值的最小外接矩形,從而去除那些可能包含錯誤標(biāo)注或無關(guān)區(qū)域的邊界框,提高最終標(biāo)注結(jié)果的準(zhǔn)確性。
31、可選地,若子圖中存在重疊的最小外接矩形,所述方法還包括:保留置信度最大的最小外接矩形,將剩余的最小外接矩形更新為部件輪廓的形狀。
32、當(dāng)兩個部件的最小外接矩形交疊時,可能會產(chǎn)生錯誤的標(biāo)注信息,干擾對目標(biāo)部件的識別和分析,本技術(shù)通過保留置信度大的矩形框,有效減少了誤標(biāo)注的可能性。交疊的矩形框可能會使目標(biāo)范圍的定義變得模糊,影響對子圖內(nèi)容的準(zhǔn)確理解。減少交疊后,可以更精確地確定每個目標(biāo)的最小外接矩形,從而準(zhǔn)確判斷子圖是否包含了這些完整的目標(biāo)范圍,因?yàn)榕袛嘧訄D是否包含完整最小外接矩形需要進(jìn)行一系列的計(jì)算和比較操作,如判斷矩形框的頂點(diǎn)坐標(biāo)是否在子圖范圍內(nèi)等。當(dāng)存在大量交疊矩形框時,計(jì)算過程會變得復(fù)雜且耗時。減少交疊矩形框后,需要處理的矩形框數(shù)量減少,計(jì)算量也相應(yīng)降低,從而提高了判斷的效率。
33、可選地,將拼接圖像所包含的歷史圖像記為第一圖像,所述方法還包括:
34、采用sift算法提取第一圖像中的關(guān)鍵點(diǎn)和sift描述符,基于關(guān)鍵點(diǎn)和sift描述符,通過最近鄰匹配策略生成初始匹配點(diǎn)對;
35、利用ransac算法篩選初始匹配點(diǎn)對中的內(nèi)點(diǎn),獲得第一圖像之間的單應(yīng)性矩陣,根據(jù)單應(yīng)性矩陣對第一圖像進(jìn)行透視變換,獲得新的第一圖像,將新的第一圖像進(jìn)行拼接處理,獲得新的拼接圖像。
36、sift算法能夠檢測出圖像中具有尺度不變性和旋轉(zhuǎn)不變性的關(guān)鍵點(diǎn),sift描述符能夠有效地描述關(guān)鍵點(diǎn)周圍的局部特征信息,由于sift描述符具有較高的獨(dú)特性,因此能夠減少誤匹配的發(fā)生,提高初始匹配點(diǎn)對的準(zhǔn)確性。最近鄰匹配策略通過計(jì)算關(guān)鍵點(diǎn)描述符之間的距離,快速找到最相似的匹配點(diǎn)對,從而能夠在大量關(guān)鍵點(diǎn)中快速篩選出潛在的匹配點(diǎn)。ransac算法通過隨機(jī)采樣和模型驗(yàn)證的方式,能夠準(zhǔn)確地估計(jì)出第一圖像之間的單應(yīng)性矩陣,提高了幾何變換的準(zhǔn)確性,本技術(shù)根據(jù)ransac算法估計(jì)出的單應(yīng)性矩陣對第一圖像進(jìn)行透視變換,能夠?qū)⒉煌暯桥臄z的圖像準(zhǔn)確地對齊,通過上述方案生成的拼接圖像在視覺上更加自然,無明顯拼接痕跡,能夠保留原始的第一圖像的細(xì)節(jié)和特征。
37、可選地,所述方法還包括:
38、利用sobel算子分別計(jì)算新的第一圖像的梯度場,以梯度場為約束條件,構(gòu)建泊松方程,通過最小二乘法優(yōu)化拼接邊界區(qū)域的像素值。
39、sobel算子能有效計(jì)算圖像的梯度場,它通過分別在水平和垂直方向上對圖像進(jìn)行卷積運(yùn)算,得到新的第一圖像在兩個方向上的梯度信息,進(jìn)而構(gòu)建出完整的梯度場,本技術(shù)以該梯度場為約束構(gòu)建泊松方程,并使用最小二乘法優(yōu)化拼接邊界區(qū)域的像素值,可以使拼接邊界兩側(cè)的像素值實(shí)現(xiàn)平滑過渡。
40、第二方面,本技術(shù)提供了一種基于深度學(xué)習(xí)的電力設(shè)備智能識別系統(tǒng),采用如下的技術(shù)方案:
41、一種基于深度學(xué)習(xí)的電力設(shè)備智能識別系統(tǒng),包括:存儲器和處理器,
42、所述存儲器內(nèi)存儲有計(jì)算機(jī)可讀存儲介質(zhì);
43、所述處理器處理所述計(jì)算機(jī)可讀存儲介質(zhì)上存儲的計(jì)算機(jī)程序時,以實(shí)現(xiàn)如第一方面所述的方法。
44、綜上所述,本技術(shù)包括以下至少一種有益技術(shù)效果:
45、1.本技術(shù)通過對歷史圖像進(jìn)行拼接,獲得拼接圖像,以及在拼接圖像中截取子圖等操作,有效擴(kuò)充了訓(xùn)練數(shù)據(jù)集,增加了數(shù)據(jù)的多樣性和豐富度,有助于分類模型學(xué)習(xí)到更全面的圖像特征,提高分類模型的分類準(zhǔn)確率和泛化能力,使其在面對不同場景、不同狀態(tài)的電力設(shè)備圖像時都能做出準(zhǔn)確分類。
46、2.本技術(shù)構(gòu)建的分類模型能夠?qū)Σ杉碾娏υO(shè)備的圖像進(jìn)行快速分類,實(shí)現(xiàn)了對電力設(shè)備狀態(tài)的實(shí)時監(jiān)測。通過及時輸出分類結(jié)果,本技術(shù)可以幫助運(yùn)維人員迅速了解設(shè)備的運(yùn)行狀況,及時發(fā)現(xiàn)潛在問題,為電力設(shè)備的維護(hù)和管理提供有力支持,有助于提高電力系統(tǒng)的穩(wěn)定性和可靠性。
47、3.本技術(shù)對每個目標(biāo)圖像進(jìn)行simclr風(fēng)格的增強(qiáng)處理,生成增強(qiáng)圖像對,從而能夠創(chuàng)造出與原始圖像相似但又具有差異的新圖像。在實(shí)際應(yīng)用中,電力設(shè)備的圖像可能會受到各種因素的影響,如光照變化、拍攝角度不同、設(shè)備表面污漬等。simclr風(fēng)格的增強(qiáng)處理可以模擬這些真實(shí)場景中的變化,讓yolov8s模型在訓(xùn)練過程中接觸到更多類似實(shí)際情況的圖像樣本。本技術(shù)通過生成增強(qiáng)圖像對,增加了數(shù)據(jù)的多樣性,有助于yolov8s模型學(xué)習(xí)到更具泛化性的特征,盡量避免yolov8s模型過擬合于特定的圖像特征,使yolov8s模型能夠更好地適應(yīng)不同場景和條件下的圖像。本技術(shù)通過對比學(xué)習(xí)提升了主干網(wǎng)絡(luò)的特征提取能力,進(jìn)而為整個yolov8s模型的邊界框標(biāo)注任務(wù)提供了更優(yōu)質(zhì)的特征輸入。在后續(xù)的預(yù)訓(xùn)練和微調(diào)過程中,yolov8s模型可以更好地利用這些特征進(jìn)行邊界框預(yù)測,從而提高yolov8s模型在標(biāo)注拼接圖像中電力設(shè)備整體邊界框任務(wù)上的準(zhǔn)確性和魯棒性。