DAV首頁
數字音視工程網

微信公眾號

數字音視工程網

手機DAV

  • 熱門搜索:
  • 技術風向標
  • LED小間距
  • null
    null
    null
    卓華,
    招商,
    null
    null
    null
    快捷,
    null

    我的位置:

    share

    關于語言清晰度(可理解性)的深入洞察(二)

    來源:同創音頻        編輯:ZZZ    2024-06-18 09:42:23     加入收藏    咨詢

    咨詢
    所在單位:*
    姓名:*
    手機:*
    職位:
    郵箱:*
    其他聯系方式:
    咨詢內容:
    驗證碼:
    不能為空 驗證碼錯誤
    確定

    在語音中,共振峰是另一個重要的概念。它們是通過聲道中空腔的共振“調諧”而產生的,

      在(zai)上一期(qi)的探討中,我們深入了解了語(yu)音(yin)產生的原理,并分享了關(guan)(guan)于(yu)錄擴(kuo)音(yin)的實用建議。本期(qi),我們將繼(ji)續這一旅程,聚焦于(yu)語(yu)音(yin)頻譜、共振峰(feng)以及影響語(yu)言清晰度的關(guan)(guan)鍵因素,以期(qi)為大家呈現更全面(mian)的語(yu)言清晰度(可理解性(xing))洞察(cha)。

     

      語音頻譜

      語音的頻譜覆蓋了可聽頻譜的廣泛區域,其中元音輔音 構成了語音的基本元素。元音 由聲帶振動產生,經過聲腔的精細過濾,賦予聲音獨特的音色。而輔音 則(ze)是由空氣在喉(hou)嚨和(he)口腔中的流動(dong),特別是舌頭和(he)嘴唇的精細操作產生的。

      元(yuan)音(yin)(yin)的特(te)征,即(ji)使是在講悄(qiao)悄(qiao)話中也能被識別,這是因為(wei)形成不同(tong)元(yuan)音(yin)(yin)的空(kong)腔結構依然影(ying)響著空(kong)氣的流動。男性(xing)復雜語音(yin)(yin)音(yin)(yin)調的基頻(pin)(pin)通(tong)常在100-120 Hz之間,女(nv)性(xing)則(ze)高出一個八度,而兒童則(ze)更高。輔音(yin)(yin)則(ze)通(tong)常位(wei)于500 Hz以上的高頻(pin)(pin)區域,對語音(yin)(yin)的清(qing)晰度至(zhi)關(guan)重要(yao)。

     

      共振峰

      在語音中,共振峰是另一(yi)個重要(yao)的(de)概(gai)念。它們是通過聲道中空腔的(de)共振“調(diao)諧”而產生的(de),

      如果你聽(ting)兩個人以相(xiang)同(tong)(tong)(tong)的(de)音(yin)(yin)(yin)(yin)高說(shuo)或唱同(tong)(tong)(tong)一個元(yuan)(yuan)音(yin)(yin)(yin)(yin),那么在這兩種情況下,元(yuan)(yuan)音(yin)(yin)(yin)(yin)可能是相(xiang)同(tong)(tong)(tong)的(de)。然而(er),任何兩種聲(sheng)(sheng)音(yin)(yin)(yin)(yin)都(dou)不一定產生完全相(xiang)同(tong)(tong)(tong)的(de)頻譜。共(gong)振峰(feng)為元(yuan)(yuan)音(yin)(yin)(yin)(yin)提供了可感(gan)知的(de)特(te)征,每個人獨特(te)的(de)聲(sheng)(sheng)道結構(gou)使得共(gong)振峰(feng)具有個體差(cha)異,這也是我們能夠區分不同(tong)(tong)(tong)說(shuo)話者聲(sheng)(sheng)音(yin)(yin)(yin)(yin)的(de)原因。

     

      影響語言清晰度的關鍵因素

      一、輔音的重要性:

      在漢(han)語(yu)(yu)、泰(tai)語(yu)(yu)等聲(sheng)調(diao)語(yu)(yu)言(yan)中(zhong),語(yu)(yu)調(diao)或基本(ben)頻(pin)率承載著(zhu)意義。而在非聲(sheng)調(diao)語(yu)(yu)言(yan)中(zhong),如英語(yu)(yu)、西(xi)班牙(ya)語(yu)(yu)和(he)日語(yu)(yu),元音(yin)和(he)輔(fu)音(yin)的變(bian)化則是區(qu)分單詞(ci)的關鍵。其(qi)中(zhong),輔(fu)音(yin)的重(zhong)要(yao)性尤(you)為突出。輔(fu)音(yin)主要(yao)位于(yu)高頻(pin)區(qu)域,對(dui)于(yu)語(yu)(yu)言(yan)的清晰度具有決定性作(zuo)用。

      二、頻率的重要性:

      西(xi)方語音中,頻率的(de)重(zhong)要(yao)性如(ru)下(xia)圖所示:

      在圖中我們可(ke)以看到(dao),2kHz左(zuo)右(you)的頻帶是感知(zhi)清晰度方(fang)面最重要的頻率范圍。因為大多數輔(fu)音都在這個頻帶中。

      (Ref: N.R. French & J.C. Steinberg: Factors governing the intelligibility of speech sounds. JASA vol. 19, No 1, 1947).

      對語音信號進行高通或低通濾波的實驗也驗證了這一點。使用20 Hz的高通濾波器,語音可以100%被理解,這是因為完整的語音頻譜并未被過濾。當高通濾波器切斷500Hz以下的信號時,因為即使一部分語音能量被刪除,語音的可理解性僅降低5%;但當低通濾波器在1kHz處(chu)切(qie)斷時,可理解(jie)性已大幅下(xia)降至40%以下(xia)。這再次強調了1kHz至4kHz頻(pin)率范(fan)圍對語音清晰度的重要(yao)性。

      三、背景噪聲:

      背景噪聲是(shi)影響(xiang)語(yu)音(yin)(yin)(yin)清(qing)晰度的(de)(de)(de)另(ling)一重要(yao)因素。在(zai)語(yu)音(yin)(yin)(yin)系統(tong)中,除了(le)語(yu)音(yin)(yin)(yin)本身(shen)之外的(de)(de)(de)所有(you)信(xin)號都可(ke)以被認為是(shi)噪聲。因此,在(zai)禮堂或(huo)(huo)教(jiao)室里,空(kong)調和(he)其他嘈雜的(de)(de)(de)設(she)備(bei)運行時都會使語(yu)音(yin)(yin)(yin)變(bian)得不那么清(qing)晰。此外,其他人的(de)(de)(de)存在(zai)也會產(chan)生噪音(yin)(yin)(yin)。在(zai)電視或(huo)(huo)電影音(yin)(yin)(yin)效中,對(dui)白的(de)(de)(de)電平(ping)與背景音(yin)(yin)(yin)樂或(huo)(huo)氛圍聲音(yin)(yin)(yin)電平(ping)之間的(de)(de)(de)關系問題(ti)也是(shi)非(fei)常(chang)重要(yao)的(de)(de)(de)。

      在(zai)這個圖(tu)表(biao)中,語(yu)音(yin)可理解度是根(gen)據信噪(zao)比(bi)(S/N)繪制的(de)。較(jiao)低(di)的(de)曲線表(biao)明,即(ji)使信噪(zao)比(bi)為(wei)負(fu),也就是說噪(zao)聲比(bi)語(yu)音(yin)水平高(gao)10 dB,語(yu)音(yin)仍然可以在(zai)一定(ding)程度上被理解。但在(zai)任何(he)情(qing)況下,最(zui)佳(jia)的(de)感知語(yu)音(yin)水平約為(wei)60 dB或20 μPa。

      通(tong)過大量的研(yan)究(jiu),總的來說(shuo)結果表明(ming):

      1. 當背景噪音(yin)低(di)于40dBA時,最佳語音(yin)電(dian)平不(bu)變。

      2. 當(dang)背景噪(zao)(zao)聲電(dian)平(ping)大于40 dB(A)時,最(zui)佳(jia)語音(yin)電(dian)平(ping)或信噪(zao)(zao)比保持在+15 dB(A)左(zuo)右的(de)電(dian)平(ping)。

      3. 在信(xin)噪比足夠好的情況下(xia),聽力可(ke)(ke)理解性(xing)的難(nan)度(du)隨(sui)著語音電平的增加(jia)而增加(jia),使可(ke)(ke)理解性(xing)接近完美。

      此外,1kHz-4kHz的頻率范圍應該“保持清晰”。例如,當添加音樂在影視作品中作為背景時,參量均衡器在該(gai)頻率(lv)范圍內衰減音樂5-10 dB,這樣將會(hui)提高語(yu)音對白(bai)的可理解性。

      四、混響:

      在談論(lun)語音清晰度時,混(hun)響(xiang)也被視為一種(zhong)“噪音”。雖(sui)然輕微的混(hun)響(xiang)可以支持講話(hua),但(dan)一旦輔音被抹去,可理解性將大(da)幅下降。因此,在錄(lu)音和擴聲過程中(zhong),需要仔細控制混(hun)響(xiang)的影響(xiang)。

      通過深入了解(jie)語(yu)音(yin)(yin)頻譜、共(gong)振峰(feng)以及影響語(yu)言(yan)清(qing)晰度(du)的(de)(de)關鍵因素,我們(men)可以更好地(di)掌(zhang)握如何確保(bao)在(zai)各種場景下維持高(gao)質(zhi)量的(de)(de)語(yu)音(yin)(yin)清(qing)晰度(du)。無論(lun)是面對面交流還(huan)是通過擴聲(sheng)系統傳播(bo)聲(sheng)音(yin)(yin),這些洞察(cha)都將為我們(men)提(ti)供寶貴的(de)(de)指導。

    免責聲明:本文來源于同創音頻,本文僅代表作者個人觀點,本站不作任何保證和承諾,若有任何疑問,請與本文作者聯系或有侵權行為聯系本站刪除。(原創稿件未經許可,不可轉載,轉載請注明來源)
    掃一掃關注數字音視工程網公眾號

    相關閱讀related

    評論comment

     
    驗證碼:
    您還能輸入500