DAV首頁
數字音視工程網

微信公眾號

數字音視工程網

手機DAV

  • 熱門搜索:
  • 技術風向標
  • LED小間距
  • null
    null
    null
    卓華,
    招商,
    null
    null
    null
    快捷,
    null

    我的位置:

    share

    關于語言清晰度(可理解性)的深入洞察(三)

    來源:同創音頻        編輯:ZZZ    2024-06-26 08:52:38     加入收藏    咨詢

    咨詢
    所在單位:*
    姓名:*
    手機:*
    職位:
    郵箱:*
    其他聯系方式:
    咨詢內容:
    驗證碼:
    不能為空 驗證碼錯誤
    確定

    聲音的指向性,即聲音在不同方向上傳播的強度和特性。

      在上一期中,我們深(shen)入探討了語(yu)音頻譜、共(gong)振峰以及(ji)影響語(yu)言清(qing)晰(xi)度的關鍵因素。本期,我們將(jiang)聚焦聲場對語(yu)言清(qing)晰(xi)度的影響,并(bing)為大家總結麥克風放置的實用(yong)規則。

     

      關于聲場對語言清晰度的影響

      在探(tan)討聲(sheng)場對(dui)語言清晰度(du)的(de)影響時,一個關(guan)鍵(jian)的(de)觀察點是聲(sheng)音的(de)指向(xiang)性,即聲(sheng)音在不同方向(xiang)上(shang)傳播的(de)強度(du)和特(te)性。通過(guo)精心設(she)計的(de)實(shi)驗(yan)和測量,我們(men)可(ke)以(yi)觀察到聲(sheng)場中的(de)諸多細節(jie),這些細節(jie)對(dui)于理解如何捕捉和傳達清晰的(de)語言至關(guan)重(zhong)要。

      當發(fa)言人發(fa)言時,其(qi)聲(sheng)音不僅受到周圍聲(sheng)場環境的影響(xiang),還(huan)受到人的頭(tou)部和身體的影響(xiang)。這種影響(xiang)在(zai)多個維度(du)上展現(xian),包括(kuo)指(zhi)向性、距(ju)離(li)與方向、以及頭(tou)部和胸部的反射等。

    下面是人(ren)類說(shuo)話者在垂直(zhi)和水平(ping)平(ping)面上(shang)的極(ji)坐標圖。

    (參考: Chu, W.T.; Warnock, A.A.C.: Detailed Directivity of Sound Fields Around Human Talkers.)

      首先(xian),值(zhi)得注(zhu)意的(de)是,當我們繪制出人類(lei)說(shuo)話者(zhe)在垂直和水(shui)平平面(mian)上的(de)極坐標圖時,可(ke)以發現(xian)一個明(ming)顯(xian)的(de)現(xian)象(xiang):電平在經過A加權后,男性和女性在正面(mian)和背(bei)(bei)面(mian)之間的(de)差值(zhi)大約為7dB。這意味著聲音在直接面(mian)對的(de)方向上最為強烈,而在背(bei)(bei)后則相對較弱(ruo)。

      然而,這一數據(ju)并沒有(you)揭示出關于頻(pin)(pin)率相關性的全部信息。事實上,高頻(pin)(pin)聲音在(zai)背面的衰減比低頻(pin)(pin)聲音更(geng)為顯著。這一發現對于麥克風的選擇和放置位(wei)置具有(you)指(zhi)導意義,因為它意味(wei)著為了捕捉(zhuo)更(geng)多(duo)的高頻(pin)(pin)細節,麥克風需要(yao)更(geng)加靠近說話者(zhe)的正面。

    (參考: Chu, W.T.; Warnock, A.A.C.: Detailed Directivity of Sound Fields Around Human Talkers.)

      從(cong)上(shang)圖(tu)可以(yi)看(kan)出,方向性從(cong)大約1kHz及(ji)以(yi)上(shang)增加。將這一事實與1kHz以(yi)上(shang)頻率的重要(yao)性相(xiang)結(jie)合,很明顯,當在(zai)人前(qian)面(mian)(mian)而不是在(zai)人后面(mian)(mian)拾音時,可以(yi)獲(huo)得更高的可懂度。

    (參考: Chu, W.T.; Warnock, A.A.C.: Detailed Directivity of Sound Fields Around Human Talkers.)

      此(ci)外,在垂直面上(shang),我們注意到一個(ge)有(you)趣(qu)的細節(jie):與其他方(fang)向(xiang)相比,330°方(fang)向(xiang)(大(da)致指向(xiang)胸部區域)的水平(ping)面更高。這(zhe)并(bing)非偶然,而是(shi)由于聲音(yin)從胸部反射出來所導致的。這(zhe)種(zhong)反射不僅增強了(le)該方(fang)向(xiang)上(shang)的聲音(yin)強度,還可能對頻譜(pu)產(chan)生一定的影(ying)響,尤其是(shi)在低頻部分(fen)。

     

      距離與方向

      由于并非所有(you)麥克風都(dou)放置在(zai)距離(li)講話(hua)者1米的地方,因此(ci)了解當我(wo)們靠(kao)近聲源時會發生什(shen)么(me)是很有(you)趣的。

      下圖顯(xian)示了在給定方向(xiang)上1米處(chu)記錄的語(yu)音頻譜的偏差(cha)。角(jiao)度(du)(du)(+45度(du)(du)、0度(du)(du)和(he)-45度(du)(du))在垂直平(ping)面內。這(zhe)些(xie)結果是10個(ge)談話(hua)者的平(ping)均值。

      三個圖中(zhong)的(de)每條線分別顯示(shi)了(le)80厘(li)米(mi)(mi)、40厘(li)米(mi)(mi)、20厘(li)米(mi)(mi)和(he)10厘(li)米(mi)(mi)處的(de)偏差。

      如果在(zai)改變方向和距(ju)離時頻(pin)譜沒(mei)有變化(hua),所有曲線(xian)(xian)都將是直線(xian)(xian),但隨著我(wo)們(men)離談話者越來越近,偏差會(hui)增加。

      下圖顯示(shi)了(le)從軸(zhou)向平面向上45°的測量位置。與這里的偏差是微妙的。而不那么依賴于距離。

      下(xia)圖顯示了當我們(men)在軸向平面下(xia)方45°的(de)(de)測量位(wei)置。身體(ti)對聲音的(de)(de)反(fan)射對的(de)(de)影響是(shi)巨(ju)大的(de)(de)。

      下圖顯示了(le)在(zai)軸向上偏(pian)差在(zai)一定程度上介(jie)于其他兩個(ge)之間,這(zhe)意味著語(yu)音(yin)的頻譜隨著到(dao)麥克風(feng)的距(ju)離而變化(hua)。

    (參考: Brixen, Eddy B.: Near field registration of the human voice: Spectral changes due to positions. AES Convention 104, Amsterdam, the Netherlands. Preprint 4728)

      研究表明,聲(sheng)(sheng)音(yin)在(zai)垂直和水平平面上都(dou)表現(xian)出明顯的指向(xiang)性(xing),其中(zhong)高頻聲(sheng)(sheng)音(yin)的指向(xiang)性(xing)尤為顯著(zhu)。這意味著(zhu)在(zai)麥(mai)克風拾音(yin)時,麥(mai)克風的位置和方向(xiang)對語音(yin)清(qing)晰度至(zhi)關重(zhong)要(yao)(yao)。此(ci)外,隨(sui)著(zhu)我們與聲(sheng)(sheng)源的距(ju)離變化,語音(yin)的頻譜也會發(fa)生變化,這進一步強(qiang)調(diao)了麥(mai)克風放置的重(zhong)要(yao)(yao)性(xing)。

      對(dui)于頭(tou)部和(he)胸部的(de)反射,研究同(tong)樣揭示(shi)了它們對(dui)語音頻譜(pu)的(de)顯(xian)著影(ying)響。領夾式麥(mai)克(ke)風或(huo)頭(tou)戴式麥(mai)克(ke)風雖然(ran)(ran)提供了行動自由,但也可能導致(zhi)記錄(lu)的(de)頻譜(pu)與自然(ran)(ran)感知的(de)頻譜(pu)存在差(cha)異。因此(ci),在選擇和(he)放置麥(mai)克(ke)風時,我們需(xu)要考慮這些因素對(dui)語音清晰度的(de)影(ying)響。

     

      頭部和胸部

      在廣播和(he)現場聲音應用(yong)中,首選的(de)(de)(de)麥(mai)克(ke)風通常是(shi)領(ling)夾式(shi)麥(mai)克(ke)風(胸部佩(pei)戴)或(huo)頭(tou)戴式(shi)麥(mai)克(ke)風(頭(tou)戴),這(zhe)允(yun)許用(yong)戶(hu)有更多的(de)(de)(de)行動(dong)自由。人(ren)們應該意識到這(zhe)樣一個事實,即(ji)將麥(mai)克(ke)風放置在如此短的(de)(de)(de)距離處(chu)會導(dao)致記錄的(de)(de)(de)頻(pin)譜不同于在正常收聽距離處(chu)感知到的(de)(de)(de)自然和(he)中性頻(pin)譜。這(zhe)種差異遠遠不能忽略。

      以下是(shi)五(wu)條曲(qu)線,解(jie)釋(shi)了將麥克(ke)風放置在身體或頭部時語音頻(pin)譜(pu)的變化(hua)。所(suo)有曲(qu)線均基于測量值,平均為10人(見參考文獻)。

      上曲線(胸(xiong)部(bu)(bu))量(liang)化(hua)了在(zai)胸(xiong)部(bu)(bu)采集的(de)(de)語音(yin)頻(pin)(pin)譜(pu)與在(zai)軸上1米處采集的(de)(de)同一個人的(de)(de)語音(yin)頻(pin)(pin)譜(pu)的(de)(de)不同方式。當(dang)將麥(mai)克風放在(zai)胸(xiong)部(bu)(bu)時,關鍵2-4 kHz范圍內的(de)(de)頻(pin)(pin)率會顯(xian)著降低。

      第(di)二(er)條曲線(頸部(bu))顯示了麥(mai)克風離(li)下巴更近時的偏差。這一立場非常適(shi)用(yong)于廣播(bo),因為如果(guo)記者(zhe)或受(shou)訪者(zhe)穿著(zhu)t恤、運動衫(shan)等或外套,這是放置領夾式麥(mai)克風的唯一實用(yong)方法(fa)。在(zai)戶外使用(yong)時,麥(mai)克風可以披著(zhu)毛(mao)皮或戴在(zai)圍巾后面。在(zai)任何情況下:輔音(yin)頻率都會大(da)幅(fu)降(jiang)低(di)。

      前額曲線表明,將麥克風放在前額上是對頻譜干擾最小的位置。這個位置非常適合舞臺和電影(ying),但不適合新聞。

      耳(er)朵曲線顯(xian)示了(le)在這個位置較高頻(pin)率(lv)的(de)逐(zhu)漸衰減(jian)。將麥克風放置在耳(er)朵處可(ke)以很方便;然而(er),它需要補償(chang)以保持語音可(ke)懂度。

      將麥克風放在臉頰(耳機)時,與大多數其他位(wei)置(zhi)相比,2-4 kHz的范圍更好。然而,仍然需要(yao)在(zai)最高頻(pin)率下(xia)提升(sheng)。DPA耳機具有內(nei)置(zhi)升(sheng)降裝置(zhi)。

      需要注(zhu)意(yi)的是,與胸(xiong)部(bu)姿勢(shi)相比(bi),“微笑的角落”(臉頰(jia)處)的語音水平高出約10 dB。

      從曲線中可(ke)以看出,在800Hz附近存在上升的一般趨勢,這可(ke)以被(bei)認為是補償的。然(ran)而,最顯(xian)著的偏差是導致(zhi)語音可(ke)懂(dong)度降低(di)的衰減(jian)。這一定(ding)要時刻(ke)注意!

    (參考: Brixen, Eddy B.: Spectral degradation of speech captured by miniature microphones mounted on Persons’ heads and chests. AES Convention no. 100, Copenhagen, Denmark. Preprint 4284.)

     

      麥克風的放置規則

      基于上述分(fen)析,我(wo)們為麥克風的選擇和放置制定了(le)以下(xia)規則:

      人聲手持(chi)麥克風應位于口(kou)腔前方(fang),角度(du)為±30°,并盡量保持(chi)軸向對(dui)齊。

      領夾式/胸部(bu)佩戴(dai)式麥(mai)克風應使用預均(jun)衡(heng)或(huo)后期均(jun)衡(heng)來(lai)補償(chang)在胸部(bu)位置處缺(que)失的3-4kHz頻(pin)率(lv)范圍。

      頭戴(dai)麥(mai)克(ke)風相對中性,但可能仍需(xu)對高(gao)頻(pin)進行適(shi)當補償。

      講臺麥克風(feng)應具有指向性,并(bing)指向講話(hua)者(zhe)的嘴部,以減(jian)少環境噪音的影響。

      在多揚(yang)聲器(qi)環境中,應選(xuan)擇定向麥克風,并確保(bao)每個揚(yang)聲器(qi)的(de)麥克風能夠將其(qi)他揚(yang)聲器(qi)的(de)聲音(yin)衰減(jian)至少10 dB。

     

      結語與展望

      至此,關于語(yu)言清晰度(du)(可理解性(xing))的(de)(de)深入(ru)洞察系列(lie)已告一(yi)段落。我們(men)希望通過這一(yi)系列(lie)文章,為(wei)大(da)家提供了對語(yu)音產(chan)生、傳播(bo)和接收過程中影響語(yu)言清晰度(du)的(de)(de)因(yin)素的(de)(de)全面理解。

      然而,音(yin)頻技(ji)術的探(tan)索永無止境。在(zai)未(wei)來(lai),我(wo)們(men)將繼續(xu)關注音(yin)頻技(ji)術的最新發展,并為大家帶(dai)來(lai)更(geng)(geng)多關于(yu)音(yin)頻原理、前沿技(ji)術及其(qi)應用場景的探(tan)討(tao)。讓(rang)我(wo)們(men)共同(tong)期待(dai)音(yin)頻技(ji)術為我(wo)們(men)帶(dai)來(lai)的更(geng)(geng)多可能!

    免責聲明:本文來源于同創音頻,本文僅代表作者個人觀點,本站不作任何保證和承諾,若有任何疑問,請與本文作者聯系或有侵權行為聯系本站刪除。(原創稿件未經許可,不可轉載,轉載請注明來源)
    掃一掃關注數字音視工程網公眾號

    相關閱讀related

    評論comment

     
    驗證碼:
    您還能輸入500