本發(fā)明涉及水下無(wú)人集群協(xié)同控制與通信優(yōu)化,具體涉及一種多視圖融合與序列強(qiáng)化學(xué)習(xí)的水下auv集群通信優(yōu)化方法。
背景技術(shù):
1、在水下無(wú)人集群系統(tǒng)的協(xié)同控制中,通常需要依賴分布式傳感器網(wǎng)絡(luò)對(duì)海況、auv(自主水下機(jī)器人)自身運(yùn)動(dòng)狀態(tài)及周邊環(huán)境進(jìn)行感知,并通過(guò)通信鏈路在節(jié)點(diǎn)之間共享這些信息,從而實(shí)現(xiàn)實(shí)時(shí)的路徑調(diào)整、隊(duì)形保持和任務(wù)分配。
2、在典型的實(shí)現(xiàn)方式中,集群中的每個(gè)auv會(huì)利用自帶的慣性導(dǎo)航系統(tǒng)(ins)、水下聲吶或其他傳感器來(lái)測(cè)量自身與鄰居節(jié)點(diǎn)的相對(duì)位置和速度,并將這些測(cè)量結(jié)果發(fā)送給上層指揮節(jié)點(diǎn)或其他auv成員。
3、上層控制算法根據(jù)各單元上報(bào)的數(shù)據(jù),動(dòng)態(tài)計(jì)算出新的控制指令或分配策略,再下發(fā)給相應(yīng)節(jié)點(diǎn)執(zhí)行。
4、然而,在水下通信環(huán)境中,帶寬普遍較低且延遲偏高,并且由于水文條件、海底地形和洋流等因素影響,通信鏈路極易出現(xiàn)短時(shí)的高丟包率或徹底中斷。
5、當(dāng)需要對(duì)多個(gè)auv進(jìn)行同步協(xié)作時(shí),就會(huì)產(chǎn)生如下問(wèn)題:
6、一方面,對(duì)應(yīng)控制算法通常會(huì)針對(duì)較大尺度的誤差或偏差(如明顯的隊(duì)形散開(kāi)、姿態(tài)突變等)做出快速響應(yīng),卻往往將周期性的小擾動(dòng)簡(jiǎn)單視作傳感器噪聲而忽略處理;
7、另一方面,這些輕微擾動(dòng)若無(wú)法第一時(shí)間進(jìn)行修正或在全網(wǎng)絡(luò)中通報(bào)累積,就可能在通信恢復(fù)后“合并”成顯著的總體偏差,導(dǎo)致控制算法在恢復(fù)通信時(shí)面對(duì)的已不再是原本的微小分散問(wèn)題,而是因局部累計(jì)信息失真而導(dǎo)致的整體形態(tài)失穩(wěn)。
8、目前來(lái)說(shuō)為應(yīng)對(duì)這種小規(guī)模擾動(dòng)和高延遲帶來(lái)的不確定性,現(xiàn)有系統(tǒng)通常在每個(gè)節(jié)點(diǎn)內(nèi)部或集群中央部署濾波器(如卡爾曼濾波、粒子濾波等)來(lái)平滑噪聲,并基于估計(jì)的全局或局部狀態(tài)進(jìn)行協(xié)同控制。
9、但是就是說(shuō)各節(jié)點(diǎn)對(duì)環(huán)境、狀態(tài)和干擾的感知精度其實(shí)一般情況下是比較難做到一致的,或通信鏈路時(shí)斷時(shí)續(xù),濾波器所依賴的輸入數(shù)據(jù)將出現(xiàn)空窗甚至偏離,從而降低全局狀態(tài)估計(jì)的可靠性。
10、另外更嚴(yán)重的來(lái)講,針對(duì)分布式網(wǎng)絡(luò)的協(xié)同控制算法往往默認(rèn)時(shí)延或噪聲特征較為穩(wěn)定,無(wú)法實(shí)時(shí)捕捉小規(guī)模累計(jì)誤差逐步擴(kuò)大的過(guò)程。
11、例如,當(dāng)部分auv出現(xiàn)輕微偏移時(shí),如果遲遲沒(méi)有得到外部修正信息,局部控制循環(huán)可能會(huì)誤判場(chǎng)景,從而做出與整體期望不一致的命令。這種現(xiàn)象在環(huán)境動(dòng)態(tài)性較高的近岸水域或深海暗流區(qū)域尤為明顯,若處理不當(dāng)就會(huì)導(dǎo)致控制失效甚至引發(fā)連鎖錯(cuò)誤。
12、因此本次申請(qǐng)擬定提出一種基于多視圖感知融合及序列建模強(qiáng)化學(xué)習(xí)的水下auv集群通信鏈路傳輸優(yōu)化方法來(lái)解決上述問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)現(xiàn)有技術(shù)中的上述不足,本發(fā)明提供了一種多視圖融合與序列強(qiáng)化學(xué)習(xí)的水下auv集群通信優(yōu)化方法。
2、為了達(dá)到上述發(fā)明目的,本發(fā)明采用的技術(shù)方案為:
3、一種多視圖融合與序列強(qiáng)化學(xué)習(xí)的水下auv集群通信優(yōu)化方法,包括如下步驟:
4、s1、獲取來(lái)自慣性導(dǎo)航模塊、聲吶模塊及環(huán)境監(jiān)測(cè)模塊的多視圖感知數(shù)據(jù)并在時(shí)域上進(jìn)行同步,形成具有多個(gè)獨(dú)立視圖的多維數(shù)據(jù)矩陣;
5、s2、選取視圖完整度高于設(shè)定閾值且時(shí)序連續(xù)的片段作為基準(zhǔn)時(shí)段,基于局部差異對(duì)比算子進(jìn)行多步迭代對(duì)齊與融合,生成高精度的融合觀測(cè)矩陣;
6、s3、將融合觀測(cè)矩陣按時(shí)間索引與傳感器編號(hào)重排形成時(shí)序向量集并進(jìn)行時(shí)序橋接,利用序列建模算子對(duì)橋接后的時(shí)序向量集進(jìn)行迭代更新并輸出校正后的序列估計(jì)結(jié)果;
7、s4、計(jì)算序列估計(jì)結(jié)果的擾動(dòng)風(fēng)險(xiǎn)信息并進(jìn)行標(biāo)記,將序列估計(jì)結(jié)果與擾動(dòng)風(fēng)險(xiǎn)的標(biāo)記作為強(qiáng)化學(xué)習(xí)的狀態(tài)特征,利用強(qiáng)化學(xué)習(xí)算法進(jìn)行迭代更新生成最優(yōu)動(dòng)作序列;
8、s5、將所生成的最優(yōu)動(dòng)作序列映射為鏈路調(diào)度向量并進(jìn)行動(dòng)態(tài)修正得到通信鏈路調(diào)度方案,基于水下無(wú)人集群系統(tǒng)的實(shí)際運(yùn)行狀態(tài)對(duì)調(diào)度方案進(jìn)行跟蹤和修正并判斷局部累計(jì)誤差或通信通道阻塞狀態(tài);若局部累計(jì)誤差或通信通道阻塞狀態(tài)任意一個(gè)超過(guò)設(shè)定閾值則返回s2并更新序列建模算子和強(qiáng)化學(xué)習(xí)參數(shù)。
9、本發(fā)明具有以下有益效果:
10、1、本次申請(qǐng)構(gòu)建從環(huán)境感知到協(xié)同控制的全鏈路優(yōu)化框架,通過(guò)多模態(tài)傳感器數(shù)據(jù)的動(dòng)態(tài)對(duì)齊與可信度融合,生成水下環(huán)境的統(tǒng)一態(tài)勢(shì)表征。基于擾動(dòng)傳播檢測(cè)與序列狀態(tài)估計(jì)建立風(fēng)險(xiǎn)預(yù)警模型,驅(qū)動(dòng)強(qiáng)化學(xué)習(xí)策略的在線進(jìn)化與路徑規(guī)劃的實(shí)時(shí)修正,最終通過(guò)冗余調(diào)度與驗(yàn)證反饋形成閉環(huán)自優(yōu)化機(jī)制。體系實(shí)現(xiàn)從數(shù)據(jù)噪聲抑制、動(dòng)態(tài)環(huán)境建模到群體協(xié)同決策的層次化貫通,有效應(yīng)對(duì)復(fù)雜海況下的通信中斷與協(xié)同失穩(wěn)問(wèn)題。
11、2、針對(duì)水下多傳感器異步采樣問(wèn)題,提出基于多維完整度評(píng)估的動(dòng)態(tài)分塊機(jī)制。通過(guò)融合各傳感器數(shù)據(jù)有效性與信號(hào)質(zhì)量構(gòu)建復(fù)合評(píng)價(jià)指標(biāo),實(shí)現(xiàn)高丟包場(chǎng)景下的自適應(yīng)時(shí)序?qū)R。相較于傳統(tǒng)固定窗口分割方法,能夠顯著提升海況突變時(shí)的數(shù)據(jù)塊劃分精度,確保后續(xù)融合階段對(duì)局部異常的有效處理能力。
12、3、設(shè)計(jì)隱含狀態(tài)與累進(jìn)式記憶向量的雙通道更新機(jī)制,通過(guò)歷史偏移量的指數(shù)衰減累積,在通信中斷恢復(fù)后有效抑制狀態(tài)估計(jì)值的階躍式跳變。突破傳統(tǒng)時(shí)序模型對(duì)短期依賴的局限性,能在長(zhǎng)達(dá)數(shù)十秒的中斷場(chǎng)景中維持對(duì)微小環(huán)境漂移的連續(xù)跟蹤,為水下長(zhǎng)時(shí)監(jiān)測(cè)提供穩(wěn)定狀態(tài)估計(jì)。
13、4、建立融合擾動(dòng)強(qiáng)度與方向一致性的復(fù)合檢測(cè)模型,通過(guò)可變范數(shù)策略區(qū)分局部異常與全局趨勢(shì)性擾動(dòng)。結(jié)合窗口累積算法對(duì)同向擾動(dòng)進(jìn)行強(qiáng)化跟蹤,實(shí)現(xiàn)漸進(jìn)式風(fēng)險(xiǎn)擴(kuò)散的早期預(yù)警。將環(huán)境擾動(dòng)檢測(cè)的時(shí)效性提升至分鐘級(jí),為強(qiáng)化學(xué)習(xí)決策提供前置風(fēng)險(xiǎn)信號(hào)輸入,形成從感知到?jīng)Q策的閉環(huán)響應(yīng)鏈路。
1.一種多視圖融合與序列強(qiáng)化學(xué)習(xí)的水下auv集群通信優(yōu)化方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的多視圖融合與序列強(qiáng)化學(xué)習(xí)的水下auv集群通信優(yōu)化方法,其特征在于,所述s1具體包括如下步驟:
3.根據(jù)權(quán)利要求2所述的多視圖融合與序列強(qiáng)化學(xué)習(xí)的水下auv集群通信優(yōu)化方法,其特征在于,所述s12中視圖完整度函數(shù)表示為:
4.根據(jù)權(quán)利要求1所述的多視圖融合與序列強(qiáng)化學(xué)習(xí)的水下auv集群通信優(yōu)化方法,其特征在于,所述s2具體包括如下步驟:
5.根據(jù)權(quán)利要求4所述的多視圖融合與序列強(qiáng)化學(xué)習(xí)的水下auv集群通信優(yōu)化方法,其特征在于,所述s22中差異對(duì)比算子表示為:
6.根據(jù)權(quán)利要求1所述的多視圖融合與序列強(qiáng)化學(xué)習(xí)的水下auv集群通信優(yōu)化方法,其特征在于,所述s3具體包括如下步驟:
7.根據(jù)權(quán)利要求1所述的多視圖融合與序列強(qiáng)化學(xué)習(xí)的水下auv集群通信優(yōu)化方法,其特征在于,所述s4具體包括如下步驟:
8.根據(jù)權(quán)利要求1所述的多視圖融合與序列強(qiáng)化學(xué)習(xí)的水下auv集群通信優(yōu)化方法,其特征在于,所述s5具體包括如下步驟:
9.根據(jù)權(quán)利要求7所述的多視圖融合與序列強(qiáng)化學(xué)習(xí)的水下auv集群通信優(yōu)化方法,其特征在于,所述s54中局部累積誤差的具體計(jì)算方式為:
10.根據(jù)權(quán)利要求7所述的多視圖融合與序列強(qiáng)化學(xué)習(xí)的水下auv集群通信優(yōu)化方法,其特征在于,所述s55通信通道阻塞狀態(tài)計(jì)算方式為: