亚洲综合日韩精品欧美综合区,日韩国产在线一区,久久久精品一二三区,午夜精品久久久久久中宇69,国产做爰一区二区三区视频,aa天堂,三级在线视频

車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法及電子設(shè)備與流程

文檔序號(hào):42101943發(fā)布日期:2025-06-06 19:27閱讀:17來(lái)源:國(guó)知局

本發(fā)明涉及車輛,特別涉及一種車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法及電子設(shè)備。


背景技術(shù):

1、語(yǔ)音活性檢測(cè)(voiceactivity?detection,vad)技術(shù)是一項(xiàng)用于語(yǔ)音處理的技術(shù),目的是檢測(cè)語(yǔ)音信號(hào)是否存在。當(dāng)前,車載語(yǔ)音交互系統(tǒng)的vad結(jié)束時(shí)間這一參數(shù)是固定的。因此,當(dāng)前車載語(yǔ)音交互系統(tǒng)采用固定的語(yǔ)音交互后端點(diǎn)策略來(lái)結(jié)束語(yǔ)音輸入。也即,車載語(yǔ)音交互系統(tǒng)若在固定的vad結(jié)束時(shí)間內(nèi)沒(méi)有檢測(cè)到新的用戶語(yǔ)音,則會(huì)結(jié)束語(yǔ)音交互。但在實(shí)際行車過(guò)程中,經(jīng)常存在用戶未及時(shí)完成語(yǔ)音指令的輸入的情況。因此,基于固定的vad結(jié)束時(shí)間,也即固定的語(yǔ)音交互后端點(diǎn),結(jié)束語(yǔ)音交互,可能會(huì)存在語(yǔ)音交互被過(guò)早結(jié)束,影響用戶體驗(yàn)的問(wèn)題。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的在于解決車輛中采用固定的vad結(jié)束時(shí)間,也即固定的語(yǔ)音交互后端點(diǎn)策略,結(jié)束語(yǔ)音交互,可能會(huì)存在語(yǔ)音交互被過(guò)早結(jié)束,從而影響用戶體驗(yàn)的問(wèn)題。

2、為解決上述技術(shù)問(wèn)題,第一方面,本發(fā)明的實(shí)施方式公開了一種車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法,該方法包括:獲取目標(biāo)信息,目標(biāo)信息包括車輛的行駛狀態(tài)信息和/或車輛中用戶的用戶狀態(tài)信息;根據(jù)目標(biāo)信息,調(diào)整車載語(yǔ)音交互系統(tǒng)的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間。

3、采用上述方法時(shí),可以基于獲得的車輛的行駛狀態(tài)信息和/或車輛中用戶的用戶狀態(tài)信息調(diào)整車載語(yǔ)音交互系統(tǒng)的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間?;谲囕v的行駛狀態(tài)信息和/或用戶的用戶狀態(tài)信息調(diào)整車載語(yǔ)音交互系統(tǒng)的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,使得車載語(yǔ)音交互系統(tǒng)的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間能夠被動(dòng)態(tài)調(diào)整,可以減少或者避免語(yǔ)音交互被過(guò)早結(jié)束的情況,從而確保用戶能夠完整的完成語(yǔ)音輸入,提高語(yǔ)音交互的準(zhǔn)確性,以及提升用戶體驗(yàn)。另外,還可以提升車輛語(yǔ)音控制的及時(shí)性和準(zhǔn)確性,提升車輛駕駛安全等。

4、根據(jù)上述權(quán)要及相關(guān)內(nèi)容,本發(fā)明的實(shí)施方式公開的一種車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法中,在目標(biāo)信息包括行駛狀態(tài)信息的情況下,根據(jù)目標(biāo)信息,調(diào)整車載語(yǔ)音交互系統(tǒng)的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,包括:將行駛狀態(tài)信息輸入至駕駛場(chǎng)景識(shí)別模型中,得到車輛的駕駛場(chǎng)景;根據(jù)車輛的駕駛場(chǎng)景,確定車載語(yǔ)音交互系統(tǒng)的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間。

5、采用上述車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法時(shí),根據(jù)車輛的駕駛場(chǎng)景,確定語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,使得語(yǔ)音活性檢測(cè)結(jié)束時(shí)間與駕駛場(chǎng)景相對(duì)應(yīng),從而在不同駕駛場(chǎng)景下分別有對(duì)應(yīng)的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,可以有效的保證在車輛處于不同駕駛場(chǎng)景時(shí),用戶依舊能夠完整的完成語(yǔ)音輸入,提高語(yǔ)音交互的準(zhǔn)確性,提高用戶的體驗(yàn)感。

6、根據(jù)上述權(quán)要及相關(guān)內(nèi)容,本發(fā)明的實(shí)施方式公開的一種車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法中,在目標(biāo)信息包括用戶狀態(tài)信息的情況下,根據(jù)目標(biāo)信息,調(diào)整車載語(yǔ)音交互系統(tǒng)的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,包括:將用戶狀態(tài)信息輸入至用戶狀態(tài)識(shí)別模型中,得到用戶狀態(tài);根據(jù)用戶狀態(tài),確定車載語(yǔ)音交互系統(tǒng)的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間。

7、采用上述車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法時(shí),根據(jù)用戶狀態(tài),確定語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,即語(yǔ)音活性檢測(cè)結(jié)束時(shí)間可以基于用戶狀態(tài)進(jìn)行變化。從而在用戶狀態(tài)不同時(shí),使得語(yǔ)音交互系統(tǒng)的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間也不同,以保證在用戶狀態(tài)不同時(shí),用戶依舊能夠完整的完成語(yǔ)音輸入,提高語(yǔ)音交互的準(zhǔn)確性,提高用戶的體驗(yàn)感。

8、根據(jù)上述權(quán)要及相關(guān)內(nèi)容,本發(fā)明的實(shí)施方式公開的一種車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法中,在目標(biāo)信息包括行駛狀態(tài)信息和用戶狀態(tài)信息的情況下,根據(jù)目標(biāo)信息,調(diào)整車載語(yǔ)音交互系統(tǒng)的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,包括:將行駛狀態(tài)信息輸入至駕駛場(chǎng)景識(shí)別模型中,得到車輛的駕駛場(chǎng)景;將用戶狀態(tài)信息輸入至用戶狀態(tài)識(shí)別模型中,得到用戶狀態(tài);根據(jù)駕駛場(chǎng)景以及用戶狀態(tài),確定車載語(yǔ)音交互系統(tǒng)的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間。

9、采用上述車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法時(shí),根據(jù)駕駛場(chǎng)景和用戶狀態(tài),確定語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,即將駕駛場(chǎng)景和用戶狀態(tài)結(jié)合,確定語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,以使得車載語(yǔ)音交互系統(tǒng)的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間更加準(zhǔn)確。

10、根據(jù)上述權(quán)要及相關(guān)內(nèi)容,本發(fā)明的實(shí)施方式公開的一種車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法中,根據(jù)駕駛場(chǎng)景以及用戶狀態(tài),調(diào)整車載語(yǔ)音交互系統(tǒng)的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,包括:根據(jù)駕駛場(chǎng)景,確定初始語(yǔ)音活性檢測(cè)結(jié)束時(shí)間;根據(jù)用戶狀態(tài),調(diào)整初始語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,得到語(yǔ)音活性檢測(cè)結(jié)束時(shí)間。

11、采用上述車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法時(shí),根據(jù)駕駛場(chǎng)景確定初始語(yǔ)音活性檢測(cè)結(jié)束時(shí)間后,可以根據(jù)用戶狀態(tài),進(jìn)一步調(diào)整初始語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,以確定當(dāng)前車載語(yǔ)音交互系統(tǒng)的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,使得得到的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間更為準(zhǔn)確。

12、根據(jù)上述權(quán)要及相關(guān)內(nèi)容,本發(fā)明的實(shí)施方式公開的一種車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法中,用戶狀態(tài)包括用戶注意力狀態(tài),根據(jù)駕駛場(chǎng)景以及用戶狀態(tài),確定車載語(yǔ)音交互系統(tǒng)中的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,包括通過(guò)以下公式確定:

13、

14、其中,為語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,tbase為預(yù)設(shè)的基礎(chǔ)語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,為駕駛場(chǎng)景對(duì)應(yīng)的敏感系數(shù),z為fattention或者ascore,fattention為用戶注意力狀態(tài)對(duì)應(yīng)的用戶注意力系數(shù),ascore為所述用戶注意力狀態(tài)對(duì)應(yīng)的用戶注意力分?jǐn)?shù),i為所述駕駛場(chǎng)景的個(gè)數(shù)。

15、采用上述車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法時(shí),可基于預(yù)設(shè)的基礎(chǔ)語(yǔ)音活性檢測(cè)結(jié)束時(shí)間、駕駛場(chǎng)景對(duì)應(yīng)的敏感系數(shù)和用戶注意力狀態(tài)對(duì)應(yīng)的用戶注意力系數(shù)或用戶注意力分?jǐn)?shù)準(zhǔn)確的計(jì)算得到車輛當(dāng)前的駕駛場(chǎng)景及用戶當(dāng)前的用戶狀態(tài)對(duì)應(yīng)的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,以保證用戶能夠完整的完成語(yǔ)音輸入,提高語(yǔ)音交互的準(zhǔn)確性。

16、根據(jù)上述權(quán)要及相關(guān)內(nèi)容,本發(fā)明的實(shí)施方式公開的一種車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法還包括,通過(guò)以下公式得到用戶注意力分?jǐn)?shù)ascore:

17、

18、其中,w為預(yù)設(shè)的權(quán)重,b為預(yù)設(shè)的偏置參數(shù),x為基于用戶狀態(tài)計(jì)算得到的特征向量。

19、采用上述車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法時(shí),可以基于預(yù)設(shè)的權(quán)重和偏置參數(shù)以及基于用戶狀態(tài)信息計(jì)算得到的特征向量準(zhǔn)確的計(jì)算得到用戶注意力分?jǐn)?shù),基于用戶注意力分?jǐn)?shù)調(diào)整語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,從而使得語(yǔ)音活性檢測(cè)結(jié)束時(shí)間更符合用戶當(dāng)前狀態(tài)下的語(yǔ)音交互所需的時(shí)間。

20、根據(jù)上述權(quán)要及相關(guān)內(nèi)容,本發(fā)明的實(shí)施方式公開的一種車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法中,行駛狀態(tài)信息包括車輛運(yùn)動(dòng)傳感器采集到的車輛運(yùn)動(dòng)狀態(tài)信息,車輛運(yùn)動(dòng)傳感器包括加速度計(jì)、陀螺儀和定位速度傳感器;用戶狀態(tài)信息包括車輛攝像頭采集到的用戶面部狀態(tài)信息,用戶面部狀態(tài)信息包括面部表情信息和/或眼動(dòng)信息。

21、采用上述車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法時(shí),可基于加速度計(jì)、陀螺儀和定位速度傳感器采集到車輛的多個(gè)車輛運(yùn)動(dòng)狀態(tài)信息,以更好的確定車輛的行駛狀態(tài)信息,以準(zhǔn)確的計(jì)算得到車輛當(dāng)前駕駛狀態(tài)對(duì)應(yīng)的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間。

22、采用上述車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法時(shí),可基于車輛攝像頭采集到的用戶面部狀態(tài)信息,準(zhǔn)確的獲得用戶狀態(tài)信息,以更好的調(diào)整語(yǔ)音活性檢測(cè)結(jié)束時(shí)間。

23、根據(jù)上述權(quán)要及相關(guān)內(nèi)容,本發(fā)明的實(shí)施方式公開的一種車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法還包括:獲得車載語(yǔ)音交互系統(tǒng)對(duì)應(yīng)的語(yǔ)音完整率;在語(yǔ)音完整率與語(yǔ)音活性檢測(cè)結(jié)束時(shí)間的比值低于預(yù)設(shè)閾值的情況下,根據(jù)目標(biāo)信息,調(diào)整車載語(yǔ)音交互系統(tǒng)的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間。

24、采用上述車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法時(shí),可以基于車載語(yǔ)音交互系統(tǒng)對(duì)應(yīng)的語(yǔ)音完整率與語(yǔ)音活性檢測(cè)結(jié)束時(shí)間的比值與預(yù)設(shè)閾值的比較,以進(jìn)一步調(diào)整車載語(yǔ)音交互系統(tǒng)中的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,使得車載語(yǔ)音交互系統(tǒng)中語(yǔ)音活性檢測(cè)結(jié)束時(shí)間能夠保證在車輛當(dāng)前的駕駛狀態(tài)和車內(nèi)用戶的當(dāng)前用戶狀態(tài)下,用戶輸入語(yǔ)音的時(shí)間在語(yǔ)音活性檢測(cè)結(jié)束時(shí)間內(nèi)。

25、第二方面,本發(fā)明的實(shí)施方式還公開了一種電子設(shè)備,電子設(shè)備包括:處理器,與處理器通信連接的存儲(chǔ)器,存儲(chǔ)器存儲(chǔ)計(jì)算機(jī)執(zhí)行指令;處理器執(zhí)行存儲(chǔ)器存儲(chǔ)的計(jì)算機(jī)執(zhí)行指令,以使電子設(shè)備實(shí)現(xiàn)如上述任意一項(xiàng)的車載語(yǔ)音交互系統(tǒng)的參數(shù)管理方法。

26、采用上述電子設(shè)備時(shí),處理器可基于車輛的行駛狀態(tài)信息和/或車輛中用戶的用戶狀態(tài)信息調(diào)整車載語(yǔ)音交互系統(tǒng)中的語(yǔ)音活性檢測(cè)結(jié)束時(shí)間,以避免語(yǔ)音交互過(guò)程過(guò)早結(jié)束,從而確保用戶能夠完整的完成語(yǔ)音輸入,提高語(yǔ)音交互的準(zhǔn)確性,提高用戶的體驗(yàn)感。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1