一種語音識(shí)別方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)與流程

文檔序號(hào)：42041063發(fā)布日期：2025-05-30 17:39閱讀：24來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及語音識(shí)別，具體而言，涉及一種語音識(shí)別方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)。

背景技術(shù)：

1、現(xiàn)有技術(shù)中噪聲是影響語音識(shí)別系統(tǒng)準(zhǔn)確性和魯棒性的關(guān)鍵因素，許多語音識(shí)別模型在處理攜帶噪聲的音頻數(shù)據(jù)時(shí)表現(xiàn)不佳，導(dǎo)致識(shí)別錯(cuò)誤率增加，特別是在嘈雜環(huán)境下，語音信號(hào)中的噪聲干擾可能掩蓋語音信息，影響特征提取和模型性能，因此亟需一種有效的方法來處理攜帶噪聲的語音數(shù)據(jù)，以提升語音識(shí)別系統(tǒng)的準(zhǔn)確性和魯棒性。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的在于提供一種語音識(shí)別方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)，以改善上述問題。為了實(shí)現(xiàn)上述目的，本發(fā)明采取的技術(shù)方案如下：

2、第一方面，本申請(qǐng)?zhí)峁┝艘环N語音識(shí)別方法，包括：

3、獲取歷史音頻數(shù)據(jù)，所述歷史音頻數(shù)據(jù)包括攜帶有噪聲的歷史語音數(shù)據(jù)和未攜帶噪聲的歷史語音數(shù)據(jù)；

4、將攜帶有噪聲的歷史語音數(shù)據(jù)輸入預(yù)設(shè)的處理模型中進(jìn)行預(yù)處理，得到處理后的語音數(shù)據(jù)；

5、對(duì)處理后的語音數(shù)據(jù)和未攜帶噪聲的歷史語音數(shù)據(jù)進(jìn)行特征提取，分別得到第一語音特征和第二語音特征；

6、計(jì)算所述第一語音特征和所述第二語音特征的相似度，當(dāng)相似度大于第一設(shè)定閾值時(shí)，將預(yù)設(shè)的目標(biāo)音頻數(shù)據(jù)輸入所述預(yù)處理模型中進(jìn)行預(yù)處理，得到目標(biāo)語音數(shù)據(jù)，所述目標(biāo)音頻數(shù)據(jù)為待識(shí)別的音頻數(shù)據(jù)；

7、將所述目標(biāo)語音數(shù)據(jù)輸入預(yù)設(shè)的語音識(shí)別模型進(jìn)行語音識(shí)別，得到語音識(shí)別結(jié)果。

8、第二方面，本申請(qǐng)還提供了一種語音識(shí)別裝置，包括：

9、第一獲取單元，用于獲取歷史音頻數(shù)據(jù)，所述歷史音頻數(shù)據(jù)包括攜帶有噪聲的歷史語音數(shù)據(jù)和未攜帶噪聲的歷史語音數(shù)據(jù)；

10、第一輸入單元，用于將攜帶有噪聲的歷史語音數(shù)據(jù)輸入預(yù)設(shè)的處理模型中進(jìn)行預(yù)處理，得到處理后的語音數(shù)據(jù)；

11、提取單元，用于對(duì)處理后的語音數(shù)據(jù)和未攜帶噪聲的歷史語音數(shù)據(jù)進(jìn)行特征提取，分別得到第一語音特征和第二語音特征；

12、第一計(jì)算單元，用于計(jì)算所述第一語音特征和所述第二語音特征的相似度，當(dāng)相似度大于第一設(shè)定閾值時(shí)，將預(yù)設(shè)的目標(biāo)音頻數(shù)據(jù)輸入所述預(yù)處理模型中進(jìn)行預(yù)處理，得到目標(biāo)語音數(shù)據(jù)，所述目標(biāo)音頻數(shù)據(jù)為待識(shí)別的音頻數(shù)據(jù)；

13、第二輸入單元，用于將所述目標(biāo)語音數(shù)據(jù)輸入預(yù)設(shè)的語音識(shí)別模型進(jìn)行語音識(shí)別，得到語音識(shí)別結(jié)果。

14、第三方面，本申請(qǐng)還提供了一種語音識(shí)別設(shè)備，包括：

15、存儲(chǔ)器，用于存儲(chǔ)計(jì)算機(jī)程序；

16、處理器，用于執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)所述語音識(shí)別方法的步驟。

17、第四方面，本申請(qǐng)還提供了一種可讀存儲(chǔ)介質(zhì)，所述可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述語音識(shí)別方法的步驟。

18、本發(fā)明的有益效果為：

19、本發(fā)明通過將攜帶噪聲的歷史語音數(shù)據(jù)輸入模型進(jìn)行預(yù)處理，并將處理后的數(shù)據(jù)與未攜帶噪聲的歷史語音數(shù)據(jù)進(jìn)行特征比對(duì)，持續(xù)優(yōu)化模型的參數(shù)和算法，使得訓(xùn)練得到的預(yù)處理模型能夠更有效地識(shí)別和去除噪聲干擾，為后續(xù)的語音識(shí)別模型提供更清晰、準(zhǔn)確的輸入信號(hào)，確保只有高質(zhì)量的語音數(shù)據(jù)進(jìn)入識(shí)別流程，顯著提高語音識(shí)別模型的識(shí)別準(zhǔn)確性。

20、本發(fā)明的其他特征和優(yōu)點(diǎn)將在隨后的說明書闡述，并且，部分地從說明書中變得顯而易見，或者通過實(shí)施本發(fā)明實(shí)施例了解。

技術(shù)特征：

1.一種語音識(shí)別方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的語音識(shí)別方法，其特征在于,對(duì)處理后的語音數(shù)據(jù)和未攜帶噪聲的歷史語音數(shù)據(jù)進(jìn)行特征提取，分別得到第一語音特征和第二語音特征，包括：

3.根據(jù)權(quán)利要求2所述的語音識(shí)別方法，其特征在于,對(duì)所有目標(biāo)聚類集合中的子音頻數(shù)據(jù)進(jìn)行特征提取，并將提取到的多個(gè)特征進(jìn)行聚合處理，得到所述第一語音特征，包括：

4.根據(jù)權(quán)利要求1所述的語音識(shí)別方法，其特征在于,構(gòu)建所述語音識(shí)別模型，包括：

5.根據(jù)權(quán)利要求4所述的語音識(shí)別方法，其特征在于,基于混沌映射對(duì)麻雀種群位置初始化，獲得多個(gè)初始位置參數(shù)，包括：

6.根據(jù)權(quán)利要求5所述的語音識(shí)別方法，其特征在于,初始位置參數(shù)計(jì)算公式為：

7.根據(jù)權(quán)利要求4所述的語音識(shí)別方法，其特征在于,發(fā)現(xiàn)者的位置更新公式為：

8.一種語音識(shí)別裝置，其特征在于，包括：

9.根據(jù)權(quán)利要求8所述的語音識(shí)別裝置，其特征在于，所述提取單元包括：

10.根據(jù)權(quán)利要求9所述的語音識(shí)別裝置，其特征在于，所述聚合單元包括：

技術(shù)總結(jié)
本發(fā)明提供了一種語音識(shí)別方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)，涉及語音識(shí)別技術(shù)領(lǐng)域，包括獲取歷史音頻數(shù)據(jù)；得到處理后的語音數(shù)據(jù)；進(jìn)行特征提取得到第一語音特征和第二語音特征；當(dāng)相似度大于第一設(shè)定閾值時(shí)，將預(yù)設(shè)的目標(biāo)音頻數(shù)據(jù)輸入預(yù)處理模型中進(jìn)行預(yù)處理，得到目標(biāo)語音數(shù)據(jù)；得到語音識(shí)別結(jié)果。本發(fā)明通過將攜帶噪聲的歷史語音數(shù)據(jù)輸入模型進(jìn)行預(yù)處理，并將處理后的數(shù)據(jù)與未攜帶噪聲的歷史語音數(shù)據(jù)進(jìn)行特征比對(duì)，持續(xù)優(yōu)化模型的參數(shù)和算法，使得訓(xùn)練得到的預(yù)處理模型能夠更有效地識(shí)別和去除噪聲干擾，為后續(xù)的語音識(shí)別模型提供更清晰、準(zhǔn)確的輸入信號(hào)，確保只有高質(zhì)量的語音數(shù)據(jù)進(jìn)入識(shí)別流程，顯著提高語音識(shí)別模型的識(shí)別準(zhǔn)確性。

技術(shù)研發(fā)人員：彭德偉,文裕光,劉濤,曹鶴,魏琪
受保護(hù)的技術(shù)使用者：四川信云調(diào)科技服務(wù)有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/5/29

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：彭德偉,文裕光,劉濤,曹鶴,魏琪
技術(shù)所有人：四川信云調(diào)科技服務(wù)有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲综合日韩精品欧美综合区,日韩国产在线一区,久久久精品一二三区,午夜精品久久久久久中宇69,国产做爰一区二区三区视频,aa天堂,三级在线视频

一種語音識(shí)別方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)與流程

一種語音識(shí)別方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)與流程