關于語言清晰度(可理解性)的深入洞察(一)
來源:同創音頻 編輯:lgh 2024-06-04 09:52:40 加入收藏 咨詢

所在單位: | * |
姓名: | * |
手機: | * |
職位: | |
郵箱: | * |
其他聯系方式: | |
咨詢內容: | |
驗證碼: |
|
在日常交(jiao)流中,面對(dui)面交(jiao)談的語音清晰(xi)度往(wang)往(wang)令人感到自然(ran)而(er)毫不費(fei)力(li)。然(ran)而(er),一(yi)旦涉及到擴(kuo)聲,保持這種清晰(xi)度就變(bian)得(de)頗具挑(tiao)戰性(xing)。本文旨在深入探討語言清晰(xi)度(可(ke)理解(jie)性(xing))的關鍵要(yao)素,并(bing)分享一(yi)些實用的技(ji)巧,以確保在各種場景下都能(neng)維持高質量的語音清晰(xi)度。

核心(xin)要點概述
語言來自口頭表達。因此在(zai)對(dui)語音進(jin)行擴聲時,您應該始終考慮如何保(bao)持語言的清(qing)晰度(可理(li)解性)。
語音(yin)(yin)(yin)的產(chan)生(sheng):聲(sheng)音(yin)(yin)(yin)是通過(guo)聲(sheng)帶(dai)的振動而產(chan)生(sheng),音(yin)(yin)(yin)量和音(yin)(yin)(yin)高均可通過(guo)聲(sheng)帶(dai)的控(kong)制來變化。聲(sheng)音(yin)(yin)(yin)頻譜的過(guo)濾(lv)則受到(dao)咽、口、鼻等腔體的影(ying)響。
錄音(yin)(yin)(yin)技巧:改變(bian)聲(sheng)音(yin)(yin)(yin)的力度可(ke)以改變(bian)聲(sheng)音(yin)(yin)(yin)的音(yin)(yin)(yin)量和頻(pin)譜。甚至(zhi)聲(sheng)音(yin)(yin)(yin)的音(yin)(yin)(yin)高也會隨著(zhu)發聲(sheng)的力度而變(bian)化。例(li)如大(da)(da)喊大(da)(da)叫(jiao)聽起來(lai)就明(ming)顯(xian)不同(tong)于(yu)正常說話。因此在錄音(yin)(yin)(yin)時,確保捕捉語(yu)音(yin)(yin)(yin)信號的峰值至(zhi)關(guan)重(zhong)要(yao),因為它(ta)們(men)在RMS或平均音(yin)(yin)(yin)量之(zhi)上可(ke)能顯(xian)著(zhu)升高。同(tong)樣對(dui)于(yu)出現在500hz以上的頻(pin)率(lv)范圍(wei)(wei)內輔音(yin)(yin)(yin)(k, p, s, t等),特(te)別是位于(yu)2kHz - 4kHz頻(pin)率(lv)范圍(wei)(wei)內的輔音(yin)(yin)(yin),對(dui)于(yu)非聲(sheng)調語(yu)言的清晰(xi)度至(zhi)關(guan)重(zhong)要(yao)。

距離與位(wei)置(zhi):距離說話者大約一(yi)米(mi)時,語音(yin)(yin)的(de)(de)(de)清(qing)晰度(du)和(he)自(zi)然度(du)通(tong)常(chang)達到(dao)最(zui)佳,我(wo)(wo)們(men)(men)會(hui)覺得他的(de)(de)(de)聲音(yin)(yin)是自(zi)然的(de)(de)(de),站在人(ren)的(de)(de)(de)旁邊或(huo)(huo)后面會(hui)降低自(zi)然度(du)和(he)清(qing)晰度(du)(可理解性(xing))。不同的(de)(de)(de)位(wei)置(zhi)(如側(ce)面或(huo)(huo)后方)可能會(hui)影(ying)響聲音(yin)(yin)的(de)(de)(de)感(gan)知。實際上,除(chu)了我(wo)(wo)們(men)(men)用耳(er)朵或(huo)(huo)麥克(ke)風(feng)靠近發言人(ren)的(de)(de)(de)時候,幾乎在任(ren)何其他位(wei)置(zhi)都(dou)能聽到(dao)清(qing)晰的(de)(de)(de)聲音(yin)(yin)。
音色與頻率:頭部、胸部或身體的不同位置會賦予聲音獨特的音色。例如,胸部位置的語音頻譜可能缺乏2kHz-4kHz范圍內的關鍵頻率,這會導致語音清晰度降低。如果麥克風不能補償這一點,你應該用均衡器進行校正。
語音(yin)作為聲源
語(yu)音(yin)不僅是(shi)(shi)交流的(de)工(gong)具,更(geng)是(shi)(shi)一種復(fu)雜(za)的(de)聲學信(xin)號。雖然語(yu)言本身具有普(pu)遍性,但每個人的(de)聲音(yin)特征(zheng)和(he)音(yin)質都是(shi)(shi)獨一無二(er)的(de)。了解這些差異(yi)對于確保錄(lu)音(yin)和(he)擴聲中的(de)清晰度(du)至關重要。
聲級
因為人(ren)(ren)們在發聲(sheng)時用力(li)的(de)(de)(de)程度不同,從(cong)輕聲(sheng)低語到大聲(sheng)喊叫,語音(yin)(yin)的(de)(de)(de)音(yin)(yin)量變化范(fan)圍極大,所以(yi)很難給語音(yin)(yin)音(yin)(yin)量指定一個固(gu)定的(de)(de)(de)數字(zi)。下表中的(de)(de)(de)值表示成年人(ren)(ren)的(de)(de)(de)平均A加(jia)權語音(yin)(yin)音(yin)(yin)量。值得(de)注(zhu)意(yi)的(de)(de)(de)是,當(dang)語音(yin)(yin)音(yin)(yin)量對應于1米距離處的(de)(de)(de)正常語音(yin)(yin)水平時,理解語音(yin)(yin)的(de)(de)(de)能力(li)是最佳的(de)(de)(de)。換言之,大約55-65 dB的(de)(de)(de)聲(sheng)壓級為20μPa。
(在這種情況下,參考是可聽到的最弱聲壓級)

作為收聽/錄音距離的函數的平均語音水平。正常講話和叫喊之間有將近20分貝的差異。
峰值
同時要(yao)(yao)注意峰值(zhi)因素——即峰值(zhi)電平(ping)與(yu)RMS電平(ping)之(zhi)間的比率,這對于(yu)避免錄音或拾音的失(shi)真至關重(zhong)要(yao)(yao)。
上表中顯示(shi)的(de)每個(ge)電平都是(shi)(shi)平均RMS電平,而不是(shi)(shi)峰值電平。通常,峰值比RMS電平高出20-23dB。峰值電平和RMS電平之間的(de)比率(lv)稱為(wei)峰值因子。當(dang)在(zai)電聲(sheng)系統中記錄或再現語(yu)音(yin)時,該因素是(shi)(shi)一個(ge)重(zhong)要參數。另請注意:在(zai)嘴唇處測量的(de)大(da)聲(sheng)歌唱可(ke)以(yi)達(da)到130 dB (參考20μPa RMS)的(de)電平,峰值水平超(chao)過150 dB(參考20μPa RMS)。

?
男聲,正常講話(hua)(時(shi)長18秒)。平均(jun)RMS:-21.5 dBFS,峰值:-0.5 dBFS。波峰系數11(21 dB)。紅(hong)色虛線表示RMS電平。
實用建議
選擇合適(shi)的麥克(ke)風(feng):針(zhen)對特定應用場(chang)景選擇合適(shi)的麥克(ke)風(feng),確保捕捉高音頻細(xi)節。
善用均(jun)衡(heng)器:針對錄音環境或(huo)麥(mai)克風位置導(dao)致的頻率(lv)缺失,使用均(jun)衡(heng)器進行補償。
優化錄音(yin)環境(jing):盡量避免(mian)背景(jing)噪音(yin)和回聲(sheng),在空間(jian)內使用(yong)吸聲(sheng)材料(liao)或采取其他聲(sheng)學處理措施。
注意距離(li)與位置:保持與發言者的適當距離(li)和位置,最大化語音的清晰度和自然度。
遵循這些建議,深(shen)入了解語音產生的原理,您將在各種(zhong)場合下輕(qing)松確(que)保(bao)高質量的語音清晰(xi)度(du)。讓我們期(qi)待(dai)下一期(qi),繼續探(tan)索語言清晰(xi)度(du)的更多(duo)奧秘!
本(ben)文轉載自DSP同創(chuang)音頻微信(xin)公眾號
評論comment