亚洲综合日韩精品欧美综合区,日韩国产在线一区,久久久精品一二三区,午夜精品久久久久久中宇69,国产做爰一区二区三区视频,aa天堂,三级在线视频

語音識別方法、裝置、電子設(shè)備和存儲介質(zhì)與流程

文檔序號:42295309發(fā)布日期:2025-06-27 18:32閱讀:8來源:國知局

本技術(shù)涉及語音識別,特別是涉及一種語音識別方法、裝置、電子設(shè)備和計算機(jī)可讀存儲介質(zhì)。


背景技術(shù):

1、語音識別技術(shù),是一種能夠?qū)⒁纛l轉(zhuǎn)換成文本或命令的技術(shù),識別準(zhǔn)確性是語音識別技術(shù)的優(yōu)劣評價的一個重要維度。通常情況下,不同業(yè)務(wù)場景下識別的內(nèi)容領(lǐng)域偏好存在差異,應(yīng)用領(lǐng)域內(nèi)經(jīng)常出現(xiàn)的詞匯或者定制的偏好詞匯,也可以叫做熱詞。實際應(yīng)用場景中,可以在語音識別過程中考慮熱詞的影響,提高識別準(zhǔn)確率。

2、然而,傳統(tǒng)的語音識別熱詞增強(qiáng)技術(shù)中,由于熱詞識別效果受限,識別的準(zhǔn)確率較差。


技術(shù)實現(xiàn)思路

1、本技術(shù)實施例提供了一種語音識別方法、裝置、電子設(shè)備、計算機(jī)可讀存儲介質(zhì),可以提高識別準(zhǔn)確率。

2、第一方面,本技術(shù)提供了一種語音識別方法。所述方法用于對語音信號中的語音幀進(jìn)行識別,包括:

3、根據(jù)所述語音幀的目標(biāo)解碼路徑,對所述語音幀進(jìn)行解碼,得到所述語音幀的多個候選路徑及對應(yīng)的路徑分值,每個候選路徑對應(yīng)一個路徑分值,所述目標(biāo)解碼路徑為與所述語音幀相鄰的上一語音幀的任一目標(biāo)路徑;

4、根據(jù)所述路徑分值和目標(biāo)熱詞,從所述多個候選路徑中確定保留路徑,所述保留路徑包括路徑分值排名前n的分值匹配路徑以及與所述目標(biāo)熱詞相匹配的熱詞匹配路徑,所述n為正整數(shù),所述目標(biāo)熱詞為根據(jù)所述目標(biāo)解碼路徑從預(yù)設(shè)熱詞庫中確定得到;

5、根據(jù)所述預(yù)設(shè)熱詞庫中所述目標(biāo)熱詞的熱詞分值,對所述保留路徑的路徑分值進(jìn)行更新,得到更新后的路徑分值;

6、根據(jù)所述更新后的路徑分值,從所述保留路徑中確定所述語音幀的與所述目標(biāo)解碼路徑對應(yīng)的目標(biāo)路徑。

7、在其中一個實施例中,所述熱詞匹配路徑的確定方式,包括:

8、根據(jù)所述目標(biāo)熱詞,從所述多個候選路徑中確定與所述目標(biāo)熱詞相匹配的初始匹配路徑;

9、根據(jù)所述目標(biāo)熱詞的熱詞分值,對所述初始匹配路徑的路徑分值進(jìn)行更新,得到更新后的初始匹配路徑的路徑分值;

10、確定所述更新后的初始匹配路徑的路徑分值排名前m的初始匹配路徑作為熱詞匹配路徑,所述m為正整數(shù)。

11、在其中一個實施例中,所述目標(biāo)熱詞包括潛在熱詞和同音熱詞中的至少一種,所述熱詞匹配路徑的確定方式,包括:

12、從所述多個候選路徑中,確定包含所述潛在熱詞的候選路徑為潛在匹配路徑;

13、從所述多個候選路徑中,確定與所述同音熱詞相匹配的候選路徑為同音匹配路徑;

14、根據(jù)所述潛在匹配路徑和所述同音匹配路徑中的至少一種,得到熱詞匹配路徑。

15、在其中一個實施例中,所述同音熱詞的確定方式,包括:

16、針對所述目標(biāo)解碼路徑,從所述語音幀的除所述目標(biāo)解碼路徑以外的其他解碼路徑中,確定倒數(shù)第二個詞單元與所述目標(biāo)解碼路徑的最后一個詞單元相同的路徑,作為同音路徑;

17、從所述預(yù)設(shè)熱詞庫中,確定與所述同音路徑的最后一個詞單元同音的目標(biāo)詞單元,并將所述目標(biāo)詞單元對應(yīng)的熱詞作為同音熱詞。

18、在其中一個實施例中,所述潛在熱詞的確定方式,包括:

19、根據(jù)所述目標(biāo)解碼路徑的最后一個詞單元,從所述預(yù)設(shè)熱詞庫中確定與所述最后一個詞單元相匹配的熱詞,作為潛在熱詞。

20、在其中一個實施例中,所述從所述預(yù)設(shè)熱詞庫中確定與所述最后一個詞單元的熱詞,作為潛在熱詞,包括:

21、從所述預(yù)設(shè)熱詞庫中確定與所述最后一個詞單元相匹配的熱詞為候選熱詞;

22、從所述候選熱詞中,確定熱詞分值大于預(yù)設(shè)分值的熱詞為潛在熱詞。

23、第二方面,本技術(shù)還提供了一種語音識別裝置。所述裝置用于對語音信號中的語音幀進(jìn)行識別,包括:

24、解碼模塊,用于根據(jù)所述語音幀的目標(biāo)解碼路徑,對所述語音幀進(jìn)行解碼,得到所述語音幀的多個候選路徑及對應(yīng)的路徑分值,每個候選路徑對應(yīng)一個路徑分值,所述目標(biāo)解碼路徑為與所述語音幀相鄰的上一語音幀的任一目標(biāo)路徑;

25、第一確定模塊,用于根據(jù)所述路徑分值和目標(biāo)熱詞,從所述多個候選路徑中確定保留路徑,所述保留路徑包括路徑分值排名前n的分值匹配路徑以及與所述目標(biāo)熱詞相匹配的熱詞匹配路徑,所述n為正整數(shù),所述目標(biāo)熱詞為根據(jù)所述目標(biāo)解碼路徑從預(yù)設(shè)熱詞庫中確定得到;

26、更新模塊,用于根據(jù)所述預(yù)設(shè)熱詞庫中所述目標(biāo)熱詞的熱詞分值,對所述保留路徑的路徑分值進(jìn)行更新,得到更新后的路徑分值;

27、第二確定模塊,用于根據(jù)所述更新后的路徑分值,從所述保留路徑中確定所述語音幀的與所述目標(biāo)解碼路徑對應(yīng)的目標(biāo)路徑。

28、在其中一個實施例中,所述裝置包括熱詞匹配路徑的確定模塊,所述熱詞匹配路徑的確定模塊,包括:

29、第一確定子模塊,用于根據(jù)所述目標(biāo)熱詞,從所述多個候選路徑中確定與所述目標(biāo)熱詞相匹配的初始匹配路徑;

30、第一更新子模塊,用于根據(jù)所述目標(biāo)熱詞的熱詞分值,對所述初始匹配路徑的路徑分值進(jìn)行更新,得到更新后的初始匹配路徑的路徑分值;

31、第二確定子模塊,用于確定所述更新后的初始匹配路徑的路徑分值排名前m的初始匹配路徑作為熱詞匹配路徑,所述m為正整數(shù)。

32、在其中一個實施例中,所述目標(biāo)熱詞包括潛在熱詞和同音熱詞中的至少一種,所述裝置包括熱詞匹配路徑的確定模塊,所述熱詞匹配路徑的確定模塊包括:

33、第三確定子模塊,用于從所述多個候選路徑中,確定包含所述潛在熱詞的候選路徑為潛在匹配路徑;

34、第四確定子模塊,用于從所述多個候選路徑中,確定與所述同音熱詞相匹配的候選路徑為同音匹配路徑;

35、第五確定子模塊,用于根據(jù)所述潛在匹配路徑和所述同音匹配路徑中的至少一種,得到熱詞匹配路徑。

36、在其中一個實施例中,所述裝置還包括同音熱詞的確定模塊,所述同音熱詞的確定模塊包括:

37、第六確定子模塊,用于針對所述目標(biāo)解碼路徑,從所述語音幀的除所述目標(biāo)解碼路徑以外的其他解碼路徑中,確定倒數(shù)第二個詞單元與所述目標(biāo)解碼路徑的最后一個詞單元相同的路徑,作為同音路徑;

38、第七確定子模塊,用于從所述預(yù)設(shè)熱詞庫中,確定與所述同音路徑的最后一個詞單元同音的目標(biāo)詞單元,并將所述目標(biāo)詞單元對應(yīng)的熱詞作為同音熱詞。

39、在其中一個實施例中,所述裝置還包括潛在熱詞的確定模塊,所述潛在熱詞的確定模塊包括:

40、第八確定子模塊,用于根據(jù)所述目標(biāo)解碼路徑的最后一個詞單元,從所述預(yù)設(shè)熱詞庫中確定與所述最后一個詞單元相匹配的熱詞,作為潛在熱詞。

41、在其中一個實施例中,所述第八確定子模塊,包括:

42、第一確定單元,用于從所述預(yù)設(shè)熱詞庫中確定與所述最后一個詞單元相匹配的熱詞為候選熱詞;

43、第二確定單元,用于從所述候選熱詞中,確定熱詞分值大于預(yù)設(shè)分值的熱詞為潛在熱詞。

44、第三方面,本技術(shù)還提供了一種電子設(shè)備。所述電子設(shè)備包括存儲器和處理器,所述存儲器存儲有計算機(jī)程序,所述處理器執(zhí)行所述計算機(jī)程序時實現(xiàn)本公開實施例中任一項所述的方法的步驟。

45、第四方面,本技術(shù)還提供了一種計算機(jī)可讀存儲介質(zhì)。所述計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)本公開實施例中任一項所述的方法的步驟。

46、第五方面,本技術(shù)還提供了一種計算機(jī)程序產(chǎn)品。所述計算機(jī)程序產(chǎn)品,包括計算機(jī)程序,該計算機(jī)程序被處理器執(zhí)行時實現(xiàn)本公開實施例中任一項所述的方法的步驟。

47、上述語音識別方法、裝置、電子設(shè)備、計算機(jī)可讀存儲介質(zhì)和計算機(jī)程序產(chǎn)品,用于對語音信號的語音幀進(jìn)行識別,針對語音幀的目標(biāo)解碼路徑,對語音幀進(jìn)行解碼,得到多個候選路徑及對應(yīng)的路徑分值,并根據(jù)路徑分值和目標(biāo)熱詞確定保留路徑,保留路徑包括路徑分值排名前n的分值匹配路徑和與目標(biāo)熱詞相匹配的熱詞匹配路徑,根據(jù)預(yù)設(shè)熱詞庫中目標(biāo)熱詞的熱詞分值,對保留路徑的路徑分值進(jìn)行更新,得到更新后的路徑分值,并根據(jù)更新后的路徑分值,從保留路徑中確定語音幀的與所述目標(biāo)解碼路徑對應(yīng)的目標(biāo)路徑。由于本方案中在從候選路徑中選擇目標(biāo)路徑時,先根據(jù)路徑分值和目標(biāo)熱詞確定保留路徑,能夠兼顧路徑分值和熱詞對識別效果的影響,在路徑分值更新前保留分值匹配路徑和熱詞匹配路徑,降低在保留路徑篩選過程中熱詞分值較高的熱詞匹配路徑被遺漏的概率;再根據(jù)目標(biāo)熱詞的熱詞分值對路徑分值進(jìn)行更新,根據(jù)更新后的路徑分值從保留路徑中確定目標(biāo)路徑,能夠通過熱詞分值增強(qiáng)熱詞匹配路徑,提高目標(biāo)路徑中熱詞匹配路徑的命中概率,優(yōu)化了熱詞的識別性能,有效增強(qiáng)語音識別中的場景定制化能力,保證了每一幀語音幀的識別準(zhǔn)確率,進(jìn)而有效提高語音信號的識別準(zhǔn)確率;且在語音信號的識別過程中,對從候選路徑中確定目標(biāo)路徑的選擇方式進(jìn)行優(yōu)化調(diào)整,無需調(diào)整每一個語音幀的目標(biāo)路徑組成的識別結(jié)果搜索空間,平衡了熱詞識別性能和解碼效率,不額外增加解碼耗時保證解碼過程效率的同時,有效提高了熱詞識別效果,進(jìn)而提高了語音信號識別結(jié)果的準(zhǔn)確率,有效增強(qiáng)語音識別中的場景定制化能力。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1