沉浸聲專題討論一：《沉浸聲—聲音情景的重構與創造（上）》

來源：中國傳媒大學編輯：ZZZ 2024-07-22 14:13:52 加入收藏咨詢

咨詢

所在單位:	*
姓名:	*
手機:	*
職位:
郵箱:	*
其他聯系方式:
咨詢內容:
驗證碼:	不能為空驗證碼錯誤

確定

隨著技術發展和時代進步，近年來，沉浸聲這一概念成為了音頻界最為熱點的詞匯，并出現了眾多與之類似的稱謂，如全景聲、全向聲、3D音頻、空間音頻等。

沉浸聲——聲音情景的重構與創造（上）

魏增來耿依楊徐曉軼

中國傳媒大學

　　摘要

　　沉浸聲技術是近年來音頻領域的熱點之一。本文首先解析了人耳聽覺感知的內容和過程，指出“聲源特征”、“空間特征”及“個人特征”是影響聽覺感知的三個主要因素;此后從電聲重現聲音情景的發展歷程入手，探討了沉浸聲的基本概念，并結合影響聽感的三個要素，分析了沉浸聲通過耳機重放和揚聲器重放這兩(liang)個主要實現手段(duan)的基本原(yuan)理;在(zai)此基礎上(shang)，本文(wen)探(tan)討了沉浸聲用以重構復刻和創造聲音情(qing)景的這兩(liang)個主要用途(tu);最(zui)后筆(bi)者分別從呈現感知(zhi)層(ceng)面和使用操作(zuo)層(ceng)面提出了當前沉浸聲技術所面臨的主要問題，并(bing)對未(wei)來沉浸聲的發展(zhan)目標進行了展(zhan)望(wang)。

　　關鍵詞：

　　沉浸聲(sheng)(sheng) 聲(sheng)(sheng)音情景聲(sheng)(sheng)源(yuan)特征空(kong)間特征個人特征寫實還原寫意創造

　　正文

　　隨(sui)著(zhu)技術發展和時代(dai)進步，近(jin)年來，沉浸(jin)聲(sheng)這(zhe)一概念成(cheng)為了(le)音頻界(jie)最為熱(re)點的(de)(de)詞匯，并(bing)出(chu)現了(le)眾多(duo)與之類似的(de)(de)稱謂，如全(quan)景(jing)(jing)聲(sheng)、全(quan)向聲(sheng)、3D音頻、空(kong)間音頻等，但究其(qi)根本，如何(he)理解這(zhe)些名詞，到底什么樣(yang)的(de)(de)聲(sheng)音又(you)可以(yi)被稱之為沉浸(jin)聲(sheng)呢，業界(jie)也存在一定(ding)的(de)(de)爭(zheng)鳴(ming)。以(yi)此為背景(jing)(jing)，筆者嘗試從人耳(er)聽(ting)覺感知入手，逐步梳(shu)理電聲(sheng)化重現聲(sheng)音情(qing)景(jing)(jing)的(de)(de)發展歷程，進而對(dui)沉浸(jin)聲(sheng)的(de)(de)定(ding)義及其(qi)用途進行探索和討論(lun)。

　　一、人耳聽覺感知

　　所謂(wei)人(ren)(ren)(ren)耳聽(ting)(ting)覺(jue)(jue)感(gan)(gan)知(zhi)，可以簡單(dan)理(li)解為(wei)(wei)人(ren)(ren)(ren)對聲(sheng)波產(chan)生行為(wei)(wei)反應的(de)過(guo)程(cheng)。在日常生活中(zhong)(zhong)，具(ju)體(ti)表現(xian)為(wei)(wei)發聲(sheng)體(ti)通(tong)過(guo)振(zhen)動而產(chan)生的(de)聲(sheng)波，經(jing)由空氣傳播到人(ren)(ren)(ren)耳，并在人(ren)(ren)(ren)耳結(jie)構中(zhong)(zhong)完成(cheng)(cheng)一系列和(he)轉換后(hou)，最終在大腦(nao)聽(ting)(ting)覺(jue)(jue)皮(pi)層形成(cheng)(cheng)有效信息的(de)生物感(gan)(gan)知(zhi)過(guo)程(cheng)。盡管基于聲(sheng)源、空間環(huan)境等(deng)(deng)“因”的(de)不同，我(wo)們通(tong)過(guo)聽(ting)(ting)覺(jue)(jue)所能獲(huo)取(qu)到的(de)“果”，即(ji)語義(yi)信息、聽(ting)(ting)感(gan)(gan)體(ti)驗等(deng)(deng)也都(dou)不盡相同，但人(ren)(ren)(ren)類形成(cheng)(cheng)聽(ting)(ting)覺(jue)(jue)的(de)過(guo)程(cheng)和(he)原理(li)卻(que)是(shi)一致的(de)。當談及聽(ting)(ting)覺(jue)(jue)感(gan)(gan)知(zhi)時(shi)，首先需要明(ming)確兩個(ge)最為(wei)(wei)關(guan)鍵(jian)的(de)問題，即(ji)“聽(ting)(ting)什么”和(he)“如何聽(ting)(ting)”。

　　（一）“聽什么？”

　　當人(ren)耳接收聲(sheng)(sheng)(sheng)(sheng)音(yin)(yin)(yin)(yin)信息(xi)時，主要有(you)兩(liang)方面因素(su)會(hui)對聽感(gan)(gan)產(chan)生影響(xiang)，一是(shi)(shi)聲(sheng)(sheng)(sheng)(sheng)音(yin)(yin)(yin)(yin)元(yuan)素(su)，二是(shi)(shi)空間(jian)聲(sheng)(sheng)(sheng)(sheng)學環境信息(xi)。所謂聲(sheng)(sheng)(sheng)(sheng)音(yin)(yin)(yin)(yin)元(yuan)素(su)，泛指直接振(zhen)動發聲(sheng)(sheng)(sheng)(sheng)的(de)(de)聲(sheng)(sheng)(sheng)(sheng)源，如人(ren)聲(sheng)(sheng)(sheng)(sheng)、樂器、物體撞(zhuang)擊、鳥鳴(ming)等。不(bu)同(tong)(tong)聲(sheng)(sheng)(sheng)(sheng)源有(you)著(zhu)不(bu)同(tong)(tong)的(de)(de)聲(sheng)(sheng)(sheng)(sheng)音(yin)(yin)(yin)(yin)特征(zheng)，通常可由響(xiang)度、音(yin)(yin)(yin)(yin)調和音(yin)(yin)(yin)(yin)色來描述。以小提琴(qin)為例，每把琴(qin)、每次演奏的(de)(de)音(yin)(yin)(yin)(yin)量、音(yin)(yin)(yin)(yin)調以及相(xiang)關的(de)(de)基波(bo)(bo)、諧波(bo)(bo)以及頻譜包絡等因素(su)均有(you)所不(bu)同(tong)(tong)，這些因素(su)共(gong)同(tong)(tong)構成了(le)聲(sheng)(sheng)(sheng)(sheng)源的(de)(de)特征(zheng)，而聲(sheng)(sheng)(sheng)(sheng)源特征(zheng)的(de)(de)變化對聽覺感(gan)(gan)知產(chan)生的(de)(de)影響(xiang)是(shi)(shi)不(bu)言而喻的(de)(de)。

　　此外，當(dang)聲(sheng)(sheng)(sheng)(sheng)源(yuan)處在某(mou)一(yi)(yi)(yi)空(kong)(kong)間中發聲(sheng)(sheng)(sheng)(sheng)時(shi)，其所(suo)(suo)表(biao)現出來(lai)的(de)(de)(de)(de)(de)聲(sheng)(sheng)(sheng)(sheng)音(yin)(yin)(yin)將不(bu)(bu)(bu)(bu)可避免地(di)受到該空(kong)(kong)間聲(sheng)(sheng)(sheng)(sheng)學環(huan)境(jing)(jing)的(de)(de)(de)(de)(de)影(ying)響(xiang)，例如由于界面的(de)(de)(de)(de)(de)反射(she)聲(sheng)(sheng)(sheng)(sheng)波而使聲(sheng)(sheng)(sheng)(sheng)源(yuan)的(de)(de)(de)(de)(de)響(xiang)度(du)加強并產生混響(xiang)感等。同(tong)(tong)(tong)(tong)(tong)樣(yang)以小提(ti)琴(qin)(qin)為例，同(tong)(tong)(tong)(tong)(tong)一(yi)(yi)(yi)位(wei)(wei)演奏家在室外、音(yin)(yin)(yin)樂(le)廳、大教堂、錄音(yin)(yin)(yin)棚、消(xiao)聲(sheng)(sheng)(sheng)(sheng)室內(nei)等不(bu)(bu)(bu)(bu)同(tong)(tong)(tong)(tong)(tong)場所(suo)(suo)使用同(tong)(tong)(tong)(tong)(tong)一(yi)(yi)(yi)把小提(ti)琴(qin)(qin)演奏相同(tong)(tong)(tong)(tong)(tong)曲目時(shi)，聽(ting)(ting)眾通過(guo)聽(ting)(ting)覺所(suo)(suo)捕獲的(de)(de)(de)(de)(de)琴(qin)(qin)聲(sheng)(sheng)(sheng)(sheng)聽(ting)(ting)感肯定是(shi)不(bu)(bu)(bu)(bu)同(tong)(tong)(tong)(tong)(tong)的(de)(de)(de)(de)(de)，甚(shen)至(zhi)同(tong)(tong)(tong)(tong)(tong)一(yi)(yi)(yi)空(kong)(kong)間內(nei)位(wei)(wei)于不(bu)(bu)(bu)(bu)同(tong)(tong)(tong)(tong)(tong)位(wei)(wei)置的(de)(de)(de)(de)(de)聽(ting)(ting)眾所(suo)(suo)捕獲的(de)(de)(de)(de)(de)聽(ting)(ting)感也有(you)一(yi)(yi)(yi)定差異，因(yin)為聽(ting)(ting)音(yin)(yin)(yin)位(wei)(wei)置不(bu)(bu)(bu)(bu)同(tong)(tong)(tong)(tong)(tong)時(shi)，直(zhi)達(da)聲(sheng)(sheng)(sheng)(sheng)音(yin)(yin)(yin)量、方(fang)位(wei)(wei)以及(ji)反射(she)聲(sheng)(sheng)(sheng)(sheng)音(yin)(yin)(yin)量、方(fang)位(wei)(wei)都會(hui)(hui)不(bu)(bu)(bu)(bu)同(tong)(tong)(tong)(tong)(tong)，它們的(de)(de)(de)(de)(de)共同(tong)(tong)(tong)(tong)(tong)作(zuo)用一(yi)(yi)(yi)定會(hui)(hui)帶來(lai)聽(ting)(ting)感的(de)(de)(de)(de)(de)不(bu)(bu)(bu)(bu)同(tong)(tong)(tong)(tong)(tong)。這時(shi)，人耳所(suo)(suo)接收的(de)(de)(de)(de)(de)聲(sheng)(sheng)(sheng)(sheng)音(yin)(yin)(yin)信息中不(bu)(bu)(bu)(bu)僅會(hui)(hui)包括聲(sheng)(sheng)(sheng)(sheng)源(yuan)本(ben)身的(de)(de)(de)(de)(de)聲(sheng)(sheng)(sheng)(sheng)音(yin)(yin)(yin)特(te)征(zheng)，同(tong)(tong)(tong)(tong)(tong)時(shi)也會(hui)(hui)包含聲(sheng)(sheng)(sheng)(sheng)源(yuan)所(suo)(suo)處的(de)(de)(de)(de)(de)空(kong)(kong)間環(huan)境(jing)(jing)的(de)(de)(de)(de)(de)聲(sheng)(sheng)(sheng)(sheng)音(yin)(yin)(yin)特(te)征(zheng)，具體如圖1所(suo)(suo)示(shi)，這也就是(shi)說空(kong)(kong)間特(te)征(zheng)一(yi)(yi)(yi)定會(hui)(hui)對聽(ting)(ting)覺感知產生影(ying)響(xiang)。

圖1：人耳所接收的“聲源特(te)征(zheng)”及(ji)“空間(jian)特(te)征(zheng)”示意圖

　　綜上所述，聽(ting)覺感知(zhi)是與聲(sheng)(sheng)源本身(shen)以及聲(sheng)(sheng)源所處(chu)的(de)空(kong)間環(huan)境緊密(mi)聯系的(de)，聲(sheng)(sheng)源特(te)征(zheng)和(he)空(kong)間特(te)征(zheng)共同構成了人(ren)耳能夠感知(zhi)和(he)獲取到的(de)聽(ting)覺特(te)征(zheng)信息，所謂“聽(ting)什么(me)”，實際上就是收聽(ting)“聲(sheng)(sheng)源特(te)征(zheng)”和(he)“空(kong)間特(te)征(zheng)”。

　　（二）“如何聽？”

　　所(suo)謂“如何聽”，本文中(zhong)(zhong)主(zhu)要指人(ren)耳(er)接收聲音信息(xi)(xi)并將(jiang)其(qi)轉換成(cheng)具體的(de)、可被聽者(zhe)理解(jie)的(de)含義的(de)這一過(guo)(guo)程，包括客(ke)觀感(gan)知(zhi)和主(zhu)觀映射兩個(ge)環節。其(qi)中(zhong)(zhong)，客(ke)觀感(gan)知(zhi)環節與耳(er)朵的(de)生理結構以及耳(er)內(nei)各個(ge)部位所(suo)對(dui)應的(de)功能息(xi)(xi)息(xi)(xi)相關(guan)。當(dang)聲源(yuan)在空間中(zhong)(zhong)通(tong)(tong)過(guo)(guo)振動產生聲波(bo)(bo)(bo)并經(jing)由(you)介質傳播到(dao)人(ren)耳(er)后(hou)，由(you)耳(er)廓和外(wai)耳(er)道(dao)所(suo)構成(cheng)的(de)外(wai)耳(er)首先對(dui)聲波(bo)(bo)(bo)進行聚合并傳導至中(zhong)(zhong)耳(er);中(zhong)(zhong)耳(er)則通(tong)(tong)過(guo)(guo)鼓膜(mo)、鼓室、聽小骨、咽鼓管(guan)等(deng)(deng)的(de)共同(tong)作用(yong)將(jiang)聲波(bo)(bo)(bo)進一步放大(da)(da)并傳導至內(nei)耳(er);內(nei)耳(er)再利(li)用(yong)前庭、半規管(guan)、耳(er)蝸以及神經(jing)束等(deng)(deng)，將(jiang)聲波(bo)(bo)(bo)為生物電信號(hao)，并傳導至大(da)(da)腦聽覺(jue)皮層(ceng)。這一環節眾(zhong)多(duo)研(yan)究已(yi)非常清楚地進行了闡述(shu)，本文不再贅述(shu)。概括來說(shuo)，聽音者(zhe)通(tong)(tong)過(guo)(guo)外(wai)耳(er)、中(zhong)(zhong)耳(er)、內(nei)耳(er)和大(da)(da)腦聽覺(jue)皮層(ceng)的(de)共同(tong)作用(yong)，完成(cheng)了對(dui)聲音信息(xi)(xi)的(de)客(ke)觀感(gan)知(zhi)。

　　此外(wai)，在(zai)整(zheng)個(ge)(ge)聽(ting)音(yin)的(de)(de)過(guo)(guo)(guo)程中(zhong)(zhong)，還有最為重(zhong)要的(de)(de)主(zhu)(zhu)(zhu)觀(guan)映射(she)環節，也就是聽(ting)音(yin)者(zhe)如(ru)何將聽(ting)到(dao)的(de)(de)客觀(guan)聲(sheng)學信息(如(ru)音(yin)節、起(qi)(qi)伏(fu)包絡、響度、頻率(lv)、音(yin)色等(deng))轉(zhuan)換成可以(yi)(yi)理(li)解的(de)(de)含義(yi)及其(qi)(qi)他相(xiang)(xiang)關(guan)(guan)(guan)信息的(de)(de)環節。筆(bi)者(zhe)認(ren)為，主(zhu)(zhu)(zhu)觀(guan)映射(she)的(de)(de)過(guo)(guo)(guo)程一(yi)(yi)部(bu)分(fen)可能來自于我(wo)(wo)們的(de)(de)基(ji)因(yin)，但絕大(da)部(bu)分(fen)應(ying)該源(yuan)于我(wo)(wo)們從(cong)呱呱墜地后(hou)經過(guo)(guo)(guo)長(chang)期的(de)(de)聽(ting)覺(jue)與(yu)(yu)其(qi)(qi)他如(ru)視覺(jue)、觸(chu)覺(jue)、嗅覺(jue)等(deng)多重(zhong)感覺(jue)聯(lian)結在(zai)一(yi)(yi)起(qi)(qi)時，所(suo)(suo)共同(tong)(tong)建(jian)立(li)起(qi)(qi)的(de)(de)主(zhu)(zhu)(zhu)觀(guan)映射(she)聯(lian)系(xi)(xi)。以(yi)(yi)語(yu)(yu)(yu)(yu)言為例，當(dang)(dang)我(wo)(wo)們從(cong)小聽(ting)到(dao)漢語(yu)(yu)(yu)(yu)、英語(yu)(yu)(yu)(yu)、日(ri)語(yu)(yu)(yu)(yu)等(deng)不(bu)同(tong)(tong)語(yu)(yu)(yu)(yu)言的(de)(de)某一(yi)(yi)句(ju)(ju)話(hua)或某一(yi)(yi)個(ge)(ge)詞語(yu)(yu)(yu)(yu)，如(ru)“請跑(pao)過(guo)(guo)(guo)去”、“抓(zhua)住你的(de)(de)胳膊”等(deng)，并通過(guo)(guo)(guo)后(hou)續一(yi)(yi)系(xi)(xi)列與(yu)(yu)之(zhi)相(xiang)(xiang)關(guan)(guan)(guan)的(de)(de)過(guo)(guo)(guo)程或動(dong)作(zuo)或感覺(jue)獲得相(xiang)(xiang)應(ying)結果后(hou)，我(wo)(wo)們就可以(yi)(yi)將這(zhe)(zhe)(zhe)(zhe)種(zhong)(zhong)聲(sheng)音(yin)特征與(yu)(yu)某種(zhong)(zhong)含義(yi)建(jian)立(li)關(guan)(guan)(guan)聯(lian)，而(er)通過(guo)(guo)(guo)長(chang)期的(de)(de)這(zhe)(zhe)(zhe)(zhe)種(zhong)(zhong)類似關(guan)(guan)(guan)聯(lian)后(hou)，我(wo)(wo)們則可以(yi)(yi)建(jian)立(li)起(qi)(qi)這(zhe)(zhe)(zhe)(zhe)種(zhong)(zhong)聲(sheng)音(yin)特征與(yu)(yu)特定含義(yi)之(zhi)間的(de)(de)映射(she)關(guan)(guan)(guan)系(xi)(xi)。甚至當(dang)(dang)這(zhe)(zhe)(zhe)(zhe)種(zhong)(zhong)主(zhu)(zhu)(zhu)觀(guan)映射(she)達到(dao)更高階段，如(ru)說(shuo)話(hua)者(zhe)帶著不(bu)同(tong)(tong)的(de)(de)語(yu)(yu)(yu)(yu)氣和情緒(xu)來陳述同(tong)(tong)一(yi)(yi)句(ju)(ju)話(hua)時，也能夠使聽(ting)者(zhe)獲取(qu)到(dao)不(bu)同(tong)(tong)的(de)(de)語(yu)(yu)(yu)(yu)義(yi)信息。當(dang)(dang)然，這(zhe)(zhe)(zhe)(zhe)一(yi)(yi)過(guo)(guo)(guo)程中(zhong)(zhong)，同(tong)(tong)樣也會(hui)逐漸建(jian)立(li)起(qi)(qi)聽(ting)音(yin)者(zhe)對聲(sheng)源(yuan)空間方位及所(suo)(suo)處空間環境的(de)(de)判斷映射(she)。這(zhe)(zhe)(zhe)(zhe)種(zhong)(zhong)現象的(de)(de)產生與(yu)(yu)日(ri)常(chang)生活中(zhong)(zhong)不(bu)斷的(de)(de)聯(lian)覺(jue)體驗及其(qi)(qi)主(zhu)(zhu)(zhu)觀(guan)映射(she)的(de)(de)建(jian)立(li)不(bu)可分(fen)割。

　　在闡述“如何聽”這一過程時，不得不提到人的“雙耳效應”、 “頭相關傳遞函數(HRTF)” 和“雙耳聲(Binaural)”這三個概念，其示意可見圖2。我們都知道，人類是通過兩只耳朵來采集聲音并據此進行主觀映射的。由于橫向排布的兩只耳朵與聲源間的不同距離會造成時間差，從而形成相位差，同時頭部的遮擋也會造成音色差，且距離差和頭部遮擋還會造成響度差，上述雙耳間的相位差、音色差以及響度差這些因素均會對聽者的定位感知和環境感知方面造成一定影響，導致客觀感知層面產生不同的聽感并影響到主觀映射的建立，這就是所謂的雙耳效應。此外，當人通過兩只耳朵接收聲音時，還會受到耳廓、頭、肩形狀以及毛發甚至衣物等相關部位或因素的影響，它們匯同雙耳效應，共同對聲波的傳輸產生一定的作用，使得進入耳朵的聲音類似于經過了一個特定的綜合濾波器，這個(ge)特(te)定濾波(bo)器這就(jiu)是所(suo)(suo)謂的(de)(de)(de)(de)“頭(tou)相關(guan)傳遞(di)函(han)數(Head-Related Transfer Function, HRTF )”，它包含了聲波(bo)與(yu)人(ren)體發生作用后所(suo)(suo)引起的(de)(de)(de)(de)所(suo)(suo)有譜(pu)特(te)征。由于(yu)(yu)不(bu)(bu)同(tong)的(de)(de)(de)(de)人(ren)體在(zai)(zai)上述人(ren)體結構及其影(ying)(ying)響因素(su)上具有一定的(de)(de)(de)(de)差異性(xing)，因此(ci)，每個(ge)人(ren)的(de)(de)(de)(de)頭(tou)相關(guan)傳遞(di)函(han)數其實也(ye)是不(bu)(bu)同(tong)的(de)(de)(de)(de)、個(ge)性(xing)化(hua)的(de)(de)(de)(de)。而且，即便(bian)我們(men)位(wei)于(yu)(yu)同(tong)一空(kong)間(jian)的(de)(de)(de)(de)同(tong)一位(wei)置收聽同(tong)樣的(de)(de)(de)(de)聲源信息，每個(ge)人(ren)經過其個(ge)體的(de)(de)(de)(de)頭(tou)相關(guan)傳遞(di)函(han)數濾波(bo)后所(suo)(suo)感知到的(de)(de)(de)(de)聲音客觀信息也(ye)是不(bu)(bu)同(tong)的(de)(de)(de)(de)，并進而影(ying)(ying)響到其主觀映射的(de)(de)(de)(de)建立(li)和后續判(pan)斷。因此(ci)，我們(men)可以認(ren)為(wei)，任何人(ren)在(zai)(zai)空(kong)間(jian)中(zhong)感知聲音時，一定會受到個(ge)性(xing)化(hua)頭(tou)相關(guan)傳遞(di)函(han)數的(de)(de)(de)(de)影(ying)(ying)響，這種影(ying)(ying)響就(jiu)形成了所(suo)(suo)謂的(de)(de)(de)(de)“雙耳(er)聲”，而這種雙耳(er)聲，在(zai)(zai)聲音的(de)(de)(de)(de)聲源特(te)征、空(kong)間(jian)特(te)征的(de)(de)(de)(de)基礎上，又不(bu)(bu)可避免地(di)加載(zai)了每位(wei)聽者獨特(te)的(de)(de)(de)(de)個(ge)人(ren)特(te)征。

圖2：雙(shuang)(shuang)耳效應、頭(tou)相關傳遞函數及雙(shuang)(shuang)耳聲(sheng)示意

　　（三）聽覺感知三要素

　　綜上所(suo)述，筆者認(ren)為，在(zai)現(xian)實生(sheng)活中，個(ge)人對任何(he)聲源的(de)(de)感知實則就是在(zai)聲源特(te)征(zheng)(zheng)(zheng)(zheng)、空間(jian)特(te)征(zheng)(zheng)(zheng)(zheng)和個(ge)體特(te)征(zheng)(zheng)(zheng)(zheng)這三個(ge)要(yao)素的(de)(de)共同影響下產生(sheng)聽覺(jue)，再基于心理聲學建(jian)立起長期主觀映射的(de)(de)復雜過程(cheng)。聲源特(te)征(zheng)(zheng)(zheng)(zheng)、空間(jian)特(te)征(zheng)(zheng)(zheng)(zheng)和個(ge)體特(te)征(zheng)(zheng)(zheng)(zheng)是構(gou)成聽覺(jue)感知的(de)(de)最重(zhong)要(yao)的(de)(de)三個(ge)基于物(wu)理層面(mian)的(de)(de)要(yao)素。

　　（四）現實生活中的“沉浸聲”

　　實際(ji)在(zai)日常生(sheng)活中，我們(men)其實每天處于(yu)來自(zi)于(yu)各(ge)個(ge)方向不同聲(sheng)(sheng)源(yuan)所(suo)發出的(de)，且結合了當前(qian)空間環境特征(zheng)(zheng)所(suo)提(ti)供的(de)各(ge)級次反(fan)射(she)的(de)聲(sheng)(sheng)音(yin)(yin)的(de)包圍(wei)中，它(ta)們(men)在(zai)受到我們(men)個(ge)人HRTF特征(zheng)(zheng)影響(xiang)(xiang)后被大腦所(suo)感知。這(zhe)(zhe)也就(jiu)是說，我們(men)在(zai)生(sheng)活中始終“沉浸”于(yu)這(zhe)(zhe)種(zhong)最(zui)原(yuan)始、也最(zui)為(wei)真實和(he)(he)自(zi)然(ran)的(de)聲(sheng)(sheng)場(chang)中，這(zhe)(zhe)種(zhong)聲(sheng)(sheng)場(chang)，正是目前(qian)沉浸式(shi)聲(sheng)(sheng)音(yin)(yin)技(ji)術所(suo)不斷追(zhui)求的(de)最(zui)終還原(yuan)目標(biao)。因此要(yao)(yao)實現對沉浸聲(sheng)(sheng)的(de)良好理解(jie)和(he)(he)應用，就(jiu)需要(yao)(yao)從(cong)聲(sheng)(sheng)源(yuan)特征(zheng)(zheng)、空間特征(zheng)(zheng)和(he)(he)人體(ti)特征(zheng)(zheng)這(zhe)(zhe)三個(ge)聽覺感知要(yao)(yao)素入(ru)手，它(ta)們(men)都會對最(zui)終的(de)整體(ti)聽覺感知產生(sheng)重要(yao)(yao)的(de)影響(xiang)(xiang)。

　　二、電聲化重現聲音情景的發展歷程

　　聲(sheng)音(yin)情(qing)景的(de)(de)(de)(de)電聲(sheng)化重現就是指通過電聲(sheng)方式(shi)實(shi)(shi)現某個聲(sheng)音(yin)情(qing)景中各(ge)類(lei)聲(sheng)音(yin)元(yuan)素(su)的(de)(de)(de)(de)虛擬再(zai)現和相關空間聲(sheng)學(xue)環境的(de)(de)(de)(de)虛擬重構，從而為聽眾(zhong)復(fu)刻該(gai)特定的(de)(de)(de)(de)聲(sheng)音(yin)情(qing)景的(de)(de)(de)(de)過程，如流水潺潺的(de)(de)(de)(de)溪谷(gu)、演(yan)奏(zou)熱烈的(de)(de)(de)(de)音(yin)樂廳等(deng)。其(qi)實(shi)(shi)，如前所述，我們日常在生活(huo)中，始終都“沉浸”于這(zhe)種原始、真實(shi)(shi)和自然的(de)(de)(de)(de)聲(sheng)場中。而這(zhe)種聲(sheng)場，正是電聲(sheng)技術所不斷追求的(de)(de)(de)(de)最終還(huan)原目標。

　　（一）從單點還原到三維還原

　　19世(shi)紀70年代(dai)留聲(sheng)(sheng)(sheng)機的(de)(de)(de)(de)(de)(de)(de)(de)誕生使人(ren)們迎來(lai)了(le)最早(zao)(zao)的(de)(de)(de)(de)(de)(de)(de)(de)音響系(xi)統(tong)(tong)(tong)(tong)，它(ta)(ta)采(cai)用(yong)單點(單聲(sheng)(sheng)(sheng)道(dao)(dao))還原方式(shi)，重(zhong)現(xian)(xian)(xian)了(le)所播放(fang)聲(sheng)(sheng)(sheng)音情景(jing)的(de)(de)(de)(de)(de)(de)(de)(de)部分(fen)特征(zheng)(zheng)(zheng)(主(zhu)要為(wei)聲(sheng)(sheng)(sheng)源(yuan)特征(zheng)(zheng)(zheng))。但(dan)在(zai)時代(dai)的(de)(de)(de)(de)(de)(de)(de)(de)發展(zhan)之(zhi)下，它(ta)(ta)逐漸(jian)難以(yi)適(shi)應人(ren)們越(yue)來(lai)越(yue)高的(de)(de)(de)(de)(de)(de)(de)(de)審美追求，因(yin)此，到(dao)20世(shi)紀20年代(dai)，英、法、美等國(guo)家開(kai)始使用(yong)立(li)體(ti)聲(sheng)(sheng)(sheng)系(xi)統(tong)(tong)(tong)(tong)，相比較(jiao)于單聲(sheng)(sheng)(sheng)道(dao)(dao)方式(shi)，它(ta)(ta)能夠提供較(jiao)好的(de)(de)(de)(de)(de)(de)(de)(de)音質(zhi)和(he)一定(ding)的(de)(de)(de)(de)(de)(de)(de)(de)水(shui)(shui)平空(kong)間定(ding)位(wei)感，使聲(sheng)(sheng)(sheng)源(yuan)特征(zheng)(zheng)(zheng)和(he)空(kong)間特征(zheng)(zheng)(zheng)都適(shi)當得(de)以(yi)加強，但(dan)同時也(ye)存在(zai)著(zhu)較(jiao)多(duo)(duo)的(de)(de)(de)(de)(de)(de)(de)(de)局限，對此，很多(duo)(duo)文(wen)(wen)獻已進行了(le)詳細探(tan)討，本文(wen)(wen)不再贅述。之(zhi)后(hou)，到(dao)了(le)1977年，杜比實驗室成功研發出(chu)了(le)包括左、中(zhong)、右、后(hou)四(si)個聲(sheng)(sheng)(sheng)道(dao)(dao)在(zai)內的(de)(de)(de)(de)(de)(de)(de)(de)商用(yong)環(huan)繞系(xi)統(tong)(tong)(tong)(tong)——Dolby Stereo，這一系(xi)統(tong)(tong)(tong)(tong)的(de)(de)(de)(de)(de)(de)(de)(de)研發既成為(wei)了(le)后(hou)續(xu)主(zhu)流(liu)的(de)(de)(de)(de)(de)(de)(de)(de)Dolby Digital5.1聲(sheng)(sheng)(sheng)道(dao)(dao)系(xi)統(tong)(tong)(tong)(tong)的(de)(de)(de)(de)(de)(de)(de)(de)前身(shen)，也(ye)標志(zhi)著(zhu)重(zhong)放(fang)系(xi)統(tong)(tong)(tong)(tong)進入了(le)多(duo)(duo)聲(sheng)(sheng)(sheng)道(dao)(dao)環(huan)繞時代(dai)。之(zhi)后(hou)基于影(ying)院(yuan)音響系(xi)統(tong)(tong)(tong)(tong)的(de)(de)(de)(de)(de)(de)(de)(de)應用(yong)，又逐步開(kai)發出(chu)了(le)側向、頂向和(he)后(hou)向的(de)(de)(de)(de)(de)(de)(de)(de)揚聲(sheng)(sheng)(sheng)器來(lai)用(yong)于環(huan)境聲(sheng)(sheng)(sheng)的(de)(de)(de)(de)(de)(de)(de)(de)重(zhong)放(fang)，從而(er)起到(dao)輔助和(he)烘托整體(ti)氛圍(wei)的(de)(de)(de)(de)(de)(de)(de)(de)作用(yong)，并(bing)逐漸(jian)將其(qi)應用(yong)于影(ying)院(yuan)之(zhi)外的(de)(de)(de)(de)(de)(de)(de)(de)其(qi)它(ta)(ta)場(chang)景(jing)中(zhong)(如(ru)唱片、現(xian)(xian)(xian)場(chang)擴聲(sheng)(sheng)(sheng)等)。因(yin)此，聲(sheng)(sheng)(sheng)音情景(jing)的(de)(de)(de)(de)(de)(de)(de)(de)電聲(sheng)(sheng)(sheng)化重(zhong)現(xian)(xian)(xian)歷程可以(yi)簡單概括為(wei)從最早(zao)(zao)的(de)(de)(de)(de)(de)(de)(de)(de)幾乎不具備任何(he)空(kong)間特征(zheng)(zheng)(zheng)的(de)(de)(de)(de)(de)(de)(de)(de)單聲(sheng)(sheng)(sheng)道(dao)(dao)再現(xian)(xian)(xian)，逐漸(jian)演(yan)變為(wei)能夠部分(fen)呈現(xian)(xian)(xian)水(shui)(shui)平空(kong)間特征(zheng)(zheng)(zheng)的(de)(de)(de)(de)(de)(de)(de)(de)立(li)體(ti)聲(sheng)(sheng)(sheng)(Stereo)或(huo)前置多(duo)(duo)聲(sheng)(sheng)(sheng)道(dao)(dao)再現(xian)(xian)(xian)，再到(dao)之(zhi)后(hou)可以(yi)在(zai)水(shui)(shui)平和(he)縱深兩維方向上(shang)展(zhan)現(xian)(xian)(xian)空(kong)間特征(zheng)(zheng)(zheng)的(de)(de)(de)(de)(de)(de)(de)(de)再現(xian)(xian)(xian)，到(dao)如(ru)今又逐步發展(zhan)到(dao)可以(yi)在(zai)水(shui)(shui)平、縱深和(he)高度三個維度上(shang)體(ti)現(xian)(xian)(xian)空(kong)間特征(zheng)(zheng)(zheng)的(de)(de)(de)(de)(de)(de)(de)(de)再現(xian)(xian)(xian)，這一過程，實際上(shang)就是人(ren)類不斷嘗試更好地重(zhong)現(xian)(xian)(xian)現(xian)(xian)(xian)實生活中(zhong)真實場(chang)景(jing)的(de)(de)(de)(de)(de)(de)(de)(de)探(tan)索(suo)。

　　（二）何謂“沉浸聲”或“Immersive Sound”？

　　行文至此(ci)(ci)，筆者也(ye)想基于(yu)自己的(de)(de)(de)(de)理(li)解(jie)，給出(chu)所(suo)謂沉(chen)(chen)浸(jin)(jin)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)或(huo)對(dui)應的(de)(de)(de)(de)英文名詞“Immersive Sound”的(de)(de)(de)(de)定義。應該講，目前業界(jie)對(dui)于(yu)沉(chen)(chen)浸(jin)(jin)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)并(bing)沒有形成統一且明確的(de)(de)(de)(de)定義，此(ci)(ci)類(lei)音頻(pin)的(de)(de)(de)(de)叫(jiao)法也(ye)五(wu)花八門，包括全景聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)、全向聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)、3D音頻(pin)、空間(jian)音頻(pin)等，但查閱“沉(chen)(chen)浸(jin)(jin)”的(de)(de)(de)(de)中(zhong)文語(yu)意(yi)，可以得(de)到(dao)(dao)三個解(jie)釋，其一為(wei)(wei)“浸(jin)(jin)泡，浸(jin)(jin)入水中(zhong)。多(duo)比喻(yu)完全處于(yu)某種(zhong)境(jing)界(jie)或(huo)思想活(huo)動中(zhong)”;其二(er)為(wei)(wei)“全神貫(guan)注于(yu)某種(zhong)事物”;其三則為(wei)(wei)“使......充(chong)滿(man)”。而查閱英文單(dan)詞術語(yu)“Immersive”，則可以得(de)到(dao)(dao)“used to describe a computer system or image that seems to surround the user——感覺(jue)(jue)圍繞在使用者周圍，慣用于(yu)描述計(ji)算機系統或(huo)圖像。” 或(huo)“(of a computer display or system)generating a 3-dimensional image which appears to surround the user——(計(ji)算機系統或(huo)顯示設備)產生出(chu)一種(zhong)三維(wei)的(de)(de)(de)(de)、使人(ren)感覺(jue)(jue)被圍繞的(de)(de)(de)(de)畫面(mian)。” ，由此(ci)(ci)可見，無論(lun)中(zhong)文還(huan)(huan)(huan)是英文，其解(jie)釋中(zhong)最為(wei)(wei)核心的(de)(de)(de)(de)詞匯為(wei)(wei)“浸(jin)(jin)泡”、“完全處于(yu)”、“充(chong)滿(man)”、“圍繞”、“三維(wei)”等，意(yi)即從四面(mian)八方包裹(guo)起(qi)來(lai)(lai)的(de)(de)(de)(de)意(yi)思，而“沉(chen)(chen)浸(jin)(jin)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)”加上后(hou)(hou)綴這個“聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)”字后(hou)(hou)，我(wo)們還(huan)(huan)(huan)需(xu)要結合聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)音學(xue)科及(ji)其發展(zhan)歷(li)程來(lai)(lai)研究(jiu)其定義。所(suo)以，經多(duo)維(wei)度考(kao)慮(lv)后(hou)(hou)，筆者認為(wei)(wei)：所(suo)謂沉(chen)(chen)浸(jin)(jin)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)或(huo)Immersive Sound，就是指與人(ren)類(lei)日(ri)常生活(huo)中(zhong)實(shi)際聽覺(jue)(jue)感知極其類(lei)似(si)的(de)(de)(de)(de)、可以從水平、縱深及(ji)高度三個維(wei)度呈現聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)音信息的(de)(de)(de)(de)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)場(chang)。人(ren)類(lei)利(li)用電聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)系統從單(dan)點還(huan)(huan)(huan)原(yuan)到(dao)(dao)一維(wei)還(huan)(huan)(huan)原(yuan)再到(dao)(dao)兩(liang)維(wei)還(huan)(huan)(huan)原(yuan)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)場(chang)的(de)(de)(de)(de)過程，實(shi)際上都(dou)可以看做是沉(chen)(chen)浸(jin)(jin)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)還(huan)(huan)(huan)原(yuan)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)場(chang)(即三維(wei)還(huan)(huan)(huan)原(yuan)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)場(chang))的(de)(de)(de)(de)前期探索。

　　在這里特別值得一提的是，目前在沉浸聲擴聲系統的應用中，有一個名詞叫做前置式系統(Frontal System),它通常指布置在舞臺(或表演區)前(qian)(qian)部(bu)，面向(xiang)(xiang)觀眾供(gong)聲(sheng)(sheng)的(de)(de)(de)(de)多組(zu)揚聲(sheng)(sheng)器，那(nei)它到底算不(bu)算沉(chen)(chen)浸(jin)(jin)聲(sheng)(sheng)系(xi)統(tong)(tong)呢?筆者認為，這個(ge)要(yao)依(yi)賴(lai)于(yu)其要(yao)重構的(de)(de)(de)(de)聲(sheng)(sheng)音(yin)情景(jing)來(lai)看。研究表明(ming)，人(ren)耳對于(yu)聲(sheng)(sheng)音(yin)高(gao)度(du)信息的(de)(de)(de)(de)變化并(bing)不(bu)敏感(gan)，所以(yi)當多個(ge)不(bu)存(cun)在(zai)明(ming)顯高(gao)度(du)差異(yi)的(de)(de)(de)(de)聲(sheng)(sheng)源(yuan)只排列于(yu)聽眾前(qian)(qian)方并(bing)且距(ju)觀眾有一定距(ju)離時(shi)，這種(zhong)高(gao)度(du)差異(yi)或其變化已(yi)不(bu)容易引起聽眾聽感(gan)的(de)(de)(de)(de)不(bu)同了，而這時(shi)，如果前(qian)(qian)置的(de)(de)(de)(de)多組(zu)揚聲(sheng)(sheng)器能夠準確虛擬出(chu)各聲(sheng)(sheng)源(yuan)的(de)(de)(de)(de)發聲(sheng)(sheng)效果(包括其聲(sheng)(sheng)源(yuan)音(yin)色、空(kong)間(jian)(jian)布局等)，且不(bu)需要(yao)電聲(sheng)(sheng)系(xi)統(tong)(tong)重構相關空(kong)間(jian)(jian)聲(sheng)(sheng)學(xue)環境特(te)征的(de)(de)(de)(de)話(hua)，那(nei)么這種(zhong)前(qian)(qian)置式(shi)系(xi)統(tong)(tong)也可以(yi)稱之為沉(chen)(chen)浸(jin)(jin)聲(sheng)(sheng)。以(yi)室外空(kong)曠場地舉行(xing)的(de)(de)(de)(de)流(liu)(liu)行(xing)音(yin)樂演唱會為例，首(shou)先，該空(kong)間(jian)(jian)可以(yi)近似的(de)(de)(de)(de)認為是自由場，不(bu)存(cun)在(zai)頂部(bu)、側向(xiang)(xiang)及(ji)后(hou)向(xiang)(xiang)反射聲(sheng)(sheng);其次，流(liu)(liu)行(xing)音(yin)樂的(de)(de)(de)(de)演員(yuan)全部(bu)都在(zai)舞臺上(shang)表演，也不(bu)存(cun)在(zai)位(wei)于(yu)觀眾側向(xiang)(xiang)、后(hou)向(xiang)(xiang)及(ji)頂部(bu)的(de)(de)(de)(de)演出(chu)用聲(sheng)(sheng)源(yuan)，這時(shi)，如果良好的(de)(de)(de)(de)前(qian)(qian)置式(shi)系(xi)統(tong)(tong)能夠較好地虛擬再(zai)現出(chu)與我們視(shi)覺感(gan)知非(fei)常接近的(de)(de)(de)(de)聲(sheng)(sheng)音(yin)情景(jing)的(de)(de)(de)(de)話(hua)，我們將其稱為沉(chen)(chen)浸(jin)(jin)式(shi)擴聲(sheng)(sheng)也并(bing)無(wu)不(bu)妥。

　　由(you)此可見，雖然從字面上(shang)講，沉浸聲是(shi)指可以從水平(ping)、縱(zong)深(shen)及(ji)高度三(san)個(ge)維(wei)度呈(cheng)(cheng)現聲音(yin)(yin)信息(xi)(xi)的聲場(chang)，但從應用角(jiao)度來(lai)看，能夠較為(wei)準確地還原出與人(ren)類視覺(jue)等其他感知維(wei)度在心里聲學(xue)層面所映射到(dao)的聽(ting)覺(jue)效(xiao)果相接近的聲場(chang)，其實就可以稱之為(wei)沉浸聲。不過(guo)，通常而(er)言，這(zhe)種聲場(chang)必須具備呈(cheng)(cheng)現水平(ping)、縱(zong)深(shen)及(ji)高度三(san)個(ge)維(wei)度聲音(yin)(yin)信息(xi)(xi)的能力(li)，因為(wei)絕大多數日常生活中(zhong)的聲音(yin)(yin)情景都是(shi)三(san)維(wei)的。

　　（三）基于聲道與基于對象

　　當前，沉(chen)(chen)(chen)(chen)浸聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)的(de)(de)(de)制作(zuo)(zuo)與實(shi)(shi)現主(zhu)要(yao)(yao)包括(kuo)基(ji)(ji)于(yu)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)道(dao)(Channel Based)和基(ji)(ji)于(yu)對(dui)象(xiang)(xiang)(Object Based)兩種(zhong)(zhong)技術(shu)。其(qi)中在(zai)(zai)傳統的(de)(de)(de)立體聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)或5.1、7.1平(ping)面環繞聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)或5.1.2等(deng)格(ge)式(shi)(shi)(shi)的(de)(de)(de)三(san)維沉(chen)(chen)(chen)(chen)浸聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)中，聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)道(dao)格(ge)式(shi)(shi)(shi)和揚(yang)(yang)(yang)(yang)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)器布(bu)局二者間(jian)(jian)需要(yao)(yao)統一，即理想的(de)(de)(de)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)源(yuan)制作(zuo)(zuo)端(duan)要(yao)(yao)求使用多聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)道(dao)的(de)(de)(de)拾(shi)音(yin)(yin)(yin)(yin)制式(shi)(shi)(shi)、同樣數(shu)量的(de)(de)(de)多聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)道(dao)母線(xian)分(fen)配機制和多聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)道(dao)監聽揚(yang)(yang)(yang)(yang)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)器(當然，也可(ke)(ke)以(yi)通過母線(xian)分(fen)配機制將(jiang)少于(yu)監聽揚(yang)(yang)(yang)(yang)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)器通道(dao)數(shu)量的(de)(de)(de)拾(shi)音(yin)(yin)(yin)(yin)信(xin)號(hao)(hao)或非實(shi)(shi)際拾(shi)音(yin)(yin)(yin)(yin)獲取的(de)(de)(de)信(xin)號(hao)(hao)進行重(zhong)新的(de)(de)(de)通道(dao)分(fen)配)，同時(shi)重(zhong)放(fang)端(duan)揚(yang)(yang)(yang)(yang)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)器數(shu)量和布(bu)局方(fang)(fang)式(shi)(shi)(shi)也要(yao)(yao)和制作(zuo)(zuo)端(duan)嚴格(ge)匹配，以(yi)此來對(dui)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)音(yin)(yin)(yin)(yin)場景(jing)及(ji)空間(jian)(jian)進行再現，這樣的(de)(de)(de)實(shi)(shi)現方(fang)(fang)式(shi)(shi)(shi)一般稱之為(wei)基(ji)(ji)于(yu)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)道(dao)的(de)(de)(de)沉(chen)(chen)(chen)(chen)浸聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)音(yin)(yin)(yin)(yin)頻(pin)。該技術(shu)主(zhu)要(yao)(yao)應用于(yu)廣(guang)播、唱片、影院等(deng)固定(ding)揚(yang)(yang)(yang)(yang)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)器布(bu)局和模式(shi)(shi)(shi)的(de)(de)(de)標準應用場景(jing)下，可(ke)(ke)遷移性(xing)及(ji)應用靈活(huo)(huo)性(xing)較差，因此，基(ji)(ji)于(yu)對(dui)象(xiang)(xiang)的(de)(de)(de)沉(chen)(chen)(chen)(chen)浸聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)音(yin)(yin)(yin)(yin)頻(pin)在(zai)(zai)這之后便應運而(er)生。這種(zhong)(zhong)基(ji)(ji)于(yu)對(dui)象(xiang)(xiang)的(de)(de)(de)沉(chen)(chen)(chen)(chen)浸聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)技術(shu)對(dui)制作(zuo)(zuo)和重(zhong)放(fang)揚(yang)(yang)(yang)(yang)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)器的(de)(de)(de)布(bu)局沒有(you)特定(ding)的(de)(de)(de)要(yao)(yao)求，不(bu)管采用何種(zhong)(zhong)方(fang)(fang)式(shi)(shi)(shi)，聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)源(yuan)制作(zuo)(zuo)端(duan)只需要(yao)(yao)提供各個聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)源(yuan)對(dui)象(xiang)(xiang)的(de)(de)(de)空間(jian)(jian)坐(zuo)標信(xin)息(xi)，那么在(zai)(zai)重(zhong)放(fang)端(duan)就能通過沉(chen)(chen)(chen)(chen)浸式(shi)(shi)(shi)引擎算法對(dui)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)源(yuan)對(dui)象(xiang)(xiang)進行渲染，并(bing)分(fen)配給不(bu)同布(bu)局的(de)(de)(de)重(zhong)放(fang)揚(yang)(yang)(yang)(yang)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)器或耳機，即可(ke)(ke)再現包括(kuo)空間(jian)(jian)特征(zheng)在(zai)(zai)內(nei)的(de)(de)(de)聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)音(yin)(yin)(yin)(yin)情景(jing)，因此這種(zhong)(zhong)技術(shu)具有(you)更強的(de)(de)(de)靈活(huo)(huo)性(xing)、適應性(xing)和可(ke)(ke)遷移性(xing)，近年(nian)來已(yi)成為(wei)了沉(chen)(chen)(chen)(chen)浸聲(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)(sheng)制作(zuo)(zuo)播出的(de)(de)(de)主(zhu)流方(fang)(fang)式(shi)(shi)(shi)。

　　三、沉浸聲的實現

　　對于(yu)沉浸聲(sheng)的實現來(lai)說，其最(zui)終呈現載體通(tong)(tong)常而言有兩種方式，一種是通(tong)(tong)過耳機進行重放，另一種是通(tong)(tong)過揚聲(sheng)器進行重放。

　　（一）耳機重放

　　通(tong)過前面的(de)分析我們知道，影(ying)響聲(sheng)(sheng)音(yin)(yin)聽(ting)感的(de)三(san)個重(zhong)(zhong)要因(yin)素分別是聲(sheng)(sheng)源特征(zheng)、空間特征(zheng)和(he)人(ren)(ren)體特征(zheng)。針對將沉(chen)浸式聲(sheng)(sheng)音(yin)(yin)通(tong)過耳(er)機重(zhong)(zhong)放這種再現方式來(lai)說，因(yin)為在(zai)此過程中(zhong)，聲(sheng)(sheng)音(yin)(yin)將直接通(tong)過耳(er)機進(jin)入到(dao)人(ren)(ren)耳(er)(即左、右聲(sheng)(sheng)道信號分別被直接送入左耳(er)和(he)右耳(er))，所以(yi)聲(sheng)(sheng)音(yin)(yin)在(zai)整個傳播(bo)過程中(zhong)缺少了(le)人(ren)(ren)體特征(zheng)(即包含(han)了(le)雙耳(er)效應的(de)頭相(xiang)關(guan)傳遞函數)的(de)影(ying)響，因(yin)此，在(zai)利用耳(er)機實現沉(chen)浸聲(sheng)(sheng)重(zhong)(zhong)放時(shi)，非常重(zhong)(zhong)要的(de)一點就是需要人(ren)(ren)為地對聲(sheng)(sheng)音(yin)(yin)進(jin)行(xing)人(ren)(ren)體特征(zheng)的(de)重(zhong)(zhong)構，無論這種重(zhong)(zhong)構是在(zai)制作端還是在(zai)播(bo)出(chu)端。

　　如前文所(suo)述，人體特征主要(yao)表現為個性化(hua)的HRTF，所(suo)以，在(zai)用耳機(ji)實現沉(chen)浸聲(sheng)(sheng)這(zhe)一過(guo)程(cheng)中，一定需要(yao)加載與聽音(yin)(yin)(yin)者相(xiang)匹配的HRTF才能完(wan)全還原聲(sheng)(sheng)音(yin)(yin)(yin)，根(gen)據聲(sheng)(sheng)音(yin)(yin)(yin)信號的電聲(sheng)(sheng)化(hua)重現過(guo)程(cheng)來看(kan)，加載HRTF的方式無外乎三種(zhong)：第(di)一，在(zai)拾(shi)音(yin)(yin)(yin)環節加載HRTF;第(di)二，在(zai)聲(sheng)(sheng)音(yin)(yin)(yin)信號制作環節加載HRTF;第(di)三，在(zai)耳機(ji)重放環節加載HRTF。

　　1.拾音環節加載HRTF

　　如(ru)果(guo)想在(zai)(zai)拾(shi)(shi)音(yin)(yin)(yin)時(shi)加載HRTF，最理想的(de)方式就(jiu)是在(zai)(zai)演出現(xian)(xian)場(chang)將(jiang)拾(shi)(shi)音(yin)(yin)(yin)器置(zhi)于聽(ting)(ting)(ting)音(yin)(yin)(yin)者的(de)雙(shuang)耳進行拾(shi)(shi)音(yin)(yin)(yin)，將(jiang)聽(ting)(ting)(ting)音(yin)(yin)(yin)者本人(ren)(ren)(ren)在(zai)(zai)特(te)(te)定空(kong)(kong)間(jian)(jian)的(de)特(te)(te)定位(wei)置(zhi)聽(ting)(ting)(ting)到(dao)的(de)原始聲音(yin)(yin)(yin)記(ji)錄下(xia)來，這個(ge)信號既包括聲源特(te)(te)征(zheng)和(he)空(kong)(kong)間(jian)(jian)特(te)(te)征(zheng)，也包含(han)聽(ting)(ting)(ting)音(yin)(yin)(yin)者個(ge)性(xing)化(hua)的(de)人(ren)(ren)(ren)體特(te)(te)征(zheng)。之(zhi)后，無論聽(ting)(ting)(ting)音(yin)(yin)(yin)者在(zai)(zai)任何(he)空(kong)(kong)間(jian)(jian)、任何(he)位(wei)置(zhi)進行耳機重(zhong)放(fang)時(shi)，都將(jiang)完全還原拾(shi)(shi)音(yin)(yin)(yin)時(shi)的(de)聲音(yin)(yin)(yin)狀態。這一(yi)(yi)方法雖然相對完美，但從(cong)實(shi)際應用(yong)的(de)角(jiao)度(du)來看(kan)，并不(bu)具可(ke)操作性(xing)，因為不(bu)可(ke)能每個(ge)聽(ting)(ting)(ting)音(yin)(yin)(yin)者都能親(qin)自到(dao)現(xian)(xian)場(chang)進行雙(shuang)耳拾(shi)(shi)音(yin)(yin)(yin)，所(suo)以可(ke)以適(shi)當(dang)妥(tuo)協，在(zai)(zai)最終效果(guo)和(he)實(shi)用(yong)性(xing)之(zhi)間(jian)(jian)進行平衡(heng)，如(ru)采用(yong)普適(shi)性(xing)的(de)人(ren)(ren)(ren)工(gong)頭來代替聽(ting)(ting)(ting)音(yin)(yin)(yin)者完成現(xian)(xian)場(chang)的(de)雙(shuang)耳拾(shi)(shi)音(yin)(yin)(yin)工(gong)作。當(dang)然，在(zai)(zai)此過程(cheng)中(zhong)一(yi)(yi)定要注意一(yi)(yi)個(ge)細節，即(ji)人(ren)(ren)(ren)工(gong)頭擺(bai)放(fang)于該(gai)聲場(chang)空(kong)(kong)間(jian)(jian)的(de)哪個(ge)位(wei)置(zhi)，重(zhong)放(fang)時(shi)的(de)聽(ting)(ting)(ting)感(gan)就(jiu)會(hui)置(zhi)身(shen)于此位(wei)置(zhi)，例如(ru)將(jiang)人(ren)(ren)(ren)工(gong)頭擺(bai)放(fang)在(zai)(zai)觀(guan)眾席位(wei)置(zhi)拾(shi)(shi)音(yin)(yin)(yin)和(he)擺(bai)放(fang)在(zai)(zai)樂隊指(zhi)揮的(de)位(wei)置(zhi)進行拾(shi)(shi)音(yin)(yin)(yin)，重(zhong)放(fang)時(shi)所(suo)得(de)到(dao)的(de)聲音(yin)(yin)(yin)聽(ting)(ting)(ting)感(gan)是不(bu)一(yi)(yi)樣的(de)，即(ji)人(ren)(ren)(ren)體特(te)(te)征(zheng)已(yi)被加載的(de)前提下(xia)，不(bu)同聽(ting)(ting)(ting)音(yin)(yin)(yin)位(wei)置(zhi)所(suo)拾(shi)(shi)取到(dao)的(de)聲源特(te)(te)征(zheng)和(he)空(kong)(kong)間(jian)(jian)特(te)(te)征(zheng)將(jiang)會(hui)決(jue)定最終的(de)聽(ting)(ting)(ting)感(gan)。圖3即(ji)為采用(yong)Neumman KU100人(ren)(ren)(ren)工(gong)頭或KEMAR人(ren)(ren)(ren)體模型進行拾(shi)(shi)音(yin)(yin)(yin)的(de)示意。

圖3：Neumman KU100人工頭及

KEMAR人體模(mo)型拾音示(shi)意圖

　　2.信號制作環節加載HRTF

　　如果拾音時沒有采用真人雙耳拾音或人工頭拾音，那么所拾取的信號雖然具有一定的聲源特征和空間特征(如通過立體聲或環繞聲、沉浸聲制式所拾取的聲音)，但卻不會包含人體特征。尤其是通過近距離單點拾音方式拾取的信號，其空間特征極其不明確。當然，除此之外，還有些聲音信號可能是非實際物理聲學所產生的合成音源或(huo)電子類(lei)音(yin)(yin)(yin)(yin)源，它們(men)(men)更(geng)不具(ju)備(bei)(bei)實際(ji)的(de)(de)(de)(de)空(kong)間特(te)(te)征(zheng)(zheng)，所(suo)(suo)以，對(dui)于(yu)這類(lei)聲(sheng)(sheng)(sheng)音(yin)(yin)(yin)(yin)信(xin)號的(de)(de)(de)(de)沉(chen)浸(jin)(jin)(jin)聲(sheng)(sheng)(sheng)重(zhong)現，就需(xu)(xu)要(yao)(yao)以創作者(zhe)的(de)(de)(de)(de)視(shi)角來(lai)制(zhi)作沉(chen)浸(jin)(jin)(jin)聲(sheng)(sheng)(sheng)了，即需(xu)(xu)要(yao)(yao)給它們(men)(men)人為地(di) “加(jia)載”人體特(te)(te)征(zheng)(zheng)和(he)空(kong)間特(te)(te)征(zheng)(zheng)。對(dui)于(yu)前(qian)(qian)者(zhe)，目前(qian)(qian)已(yi)有眾多(duo)公司(si)提供(gong)了沉(chen)浸(jin)(jin)(jin)聲(sheng)(sheng)(sheng)雙(shuang)耳渲(xuan)染(ran)硬件(jian)設備(bei)(bei)或(huo)軟件(jian)插件(jian)，如圖(tu)4所(suo)(suo)示的(de)(de)(de)(de)Dolby、Anaglyph等，通過它們(men)(men)對(dui)原始信(xin)號的(de)(de)(de)(de)渲(xuan)染(ran)，可(ke)以獲(huo)得類(lei)似(si)雙(shuang)耳聲(sheng)(sheng)(sheng)的(de)(de)(de)(de)聽(ting)(ting)感，但在渲(xuan)染(ran)之前(qian)(qian)，對(dui)于(yu)那些不具(ju)備(bei)(bei)空(kong)間特(te)(te)征(zheng)(zheng)的(de)(de)(de)(de)聲(sheng)(sheng)(sheng)音(yin)(yin)(yin)(yin)信(xin)號，制(zhi)作者(zhe)還需(xu)(xu)通過各種(zhong)聲(sheng)(sheng)(sheng)像(Pan)類(lei)電位器、各類(lei)混響(xiang)器、延時器等來(lai)賦予其空(kong)間特(te)(te)征(zheng)(zheng)。上述兩種(zhong)方(fang)法結合在一起(qi)，可(ke)以共同幫助(zhu)我們(men)(men)努力(li)接近(jin)想要(yao)(yao)的(de)(de)(de)(de)沉(chen)浸(jin)(jin)(jin)式聲(sheng)(sheng)(sheng)音(yin)(yin)(yin)(yin)效(xiao)果(guo)。不過就目前(qian)(qian)而言(yan)，到底哪款雙(shuang)耳渲(xuan)染(ran)設備(bei)(bei)或(huo)插件(jian)的(de)(de)(de)(de)算法更(geng)逼真、更(geng)普(pu)遍適用、聽(ting)(ting)感更(geng)好，則需(xu)(xu)要(yao)(yao)更(geng)深一步進行(xing)相(xiang)關的(de)(de)(de)(de)主觀評價(jia)實驗。

圖(tu)4：Dolby及Anaglyph的雙耳(er)聲(sheng)渲染插件

　　3.耳機重放環節加載HRTF

　　所(suo)謂在信(xin)號重放(fang)環節加(jia)(jia)載(zai)HRTF是(shi)指將(jiang)帶有聲(sheng)源特征和空(kong)(kong)間特征的(de)(de)(de)(de)聲(sheng)音(yin)(yin)信(xin)號送入耳(er)(er)機重放(fang)時(shi)(shi)，首先經過與聽音(yin)(yin)者相(xiang)匹配的(de)(de)(de)(de)HRTF濾波器(qi)，從(cong)而(er)將(jiang)其(qi)轉化(hua)成雙耳(er)(er)聲(sheng)來(lai)實(shi)現沉浸式重放(fang)。當然，最(zui)精準的(de)(de)(de)(de)效果就是(shi)加(jia)(jia)載(zai)聽音(yin)(yin)者自己的(de)(de)(de)(de)個(ge)(ge)性(xing)(xing)化(hua)HRTF，但這需(xu)要在專業的(de)(de)(de)(de)消(xiao)聲(sheng)室內進(jin)行多(duo)角度、全(quan)方位的(de)(de)(de)(de)先期測量并做歸(gui)納運算(suan)，這實(shi)際上這很(hen)難實(shi)現。于是(shi)，妥協的(de)(de)(de)(de)方案有兩(liang)個(ge)(ge)，一(yi)個(ge)(ge)是(shi)加(jia)(jia)載(zai)經過大數據統計平均而(er)來(lai)的(de)(de)(de)(de)普(pu)適性(xing)(xing)HRTF;另一(yi)個(ge)(ge)則是(shi)可以在某(mou)一(yi)個(ge)(ge)空(kong)(kong)間環境(jing)里用(yong)某(mou)一(yi)款揚(yang)聲(sheng)器(qi)重放(fang)脈沖信(xin)號來(lai)測量聽音(yin)(yin)者雙耳(er)(er)的(de)(de)(de)(de)全(quan)頻(pin)脈沖響應(ying)，以快速獲得(de)該(gai)聽音(yin)(yin)人的(de)(de)(de)(de)個(ge)(ge)性(xing)(xing)化(hua)HRTF，實(shi)際上這個(ge)(ge)HRTF同時(shi)(shi)也加(jia)(jia)載(zai)了(le)當時(shi)(shi)重放(fang)揚(yang)聲(sheng)器(qi)以及重放(fang)空(kong)(kong)間環境(jing)的(de)(de)(de)(de)影(ying)響，可以說是(shi)一(yi)個(ge)(ge)綜合性(xing)(xing)的(de)(de)(de)(de)HRTF，而(er)不(bu)是(shi)僅僅基(ji)于個(ge)(ge)人影(ying)響的(de)(de)(de)(de)HRTF。該(gai)類設(she)備目前已有成熟的(de)(de)(de)(de)量產(chan)商用(yong)產(chan)品，如圖5所(suo)示的(de)(de)(de)(de)Smyth Realizer A16等，它們(men)多(duo)用(yong)于通過耳(er)(er)機虛擬某(mou)一(yi)制作空(kong)(kong)間的(de)(de)(de)(de)聽覺感受，如好(hao)萊塢的(de)(de)(de)(de)某(mou)個(ge)(ge)杜(du)比(bi)全(quan)景(jing)聲(sheng)電影(ying)混(hun)錄棚等，以用(yong)于異(yi)地仿真混(hun)音(yin)(yin)等。

圖5：Smyth Realizer A16虛擬(ni)現實渲(xuan)染器

　　（二）揚聲器重放

　　利用揚聲(sheng)(sheng)(sheng)器重現沉浸聲(sheng)(sheng)(sheng)時(shi)，聽(ting)音者依(yi)靠(kao)雙耳收聽(ting)聲(sheng)(sheng)(sheng)音信(xin)息，本(ben)身就帶有(you)了個人HRTF的(de)影響，所以無需再考慮重構人體特(te)(te)(te)征(zheng)了。此時(shi)，我(wo)們(men)需要(yao)著重考慮聲(sheng)(sheng)(sheng)源特(te)(te)(te)征(zheng)和空(kong)間(jian)特(te)(te)(te)征(zheng)的(de)重構。當然(ran)，這種重構也依(yi)據聲(sheng)(sheng)(sheng)音信(xin)號(hao)的(de)電(dian)(dian)聲(sheng)(sheng)(sheng)化重現過(guo)程(cheng)，主(zhu)要(yao)分(fen)為兩(liang)種方(fang)法。第一，在拾音環(huan)節(jie)予(yu)以確定;第二，在制作(zuo)環(huan)節(jie)予(yu)以確定。基(ji)于常(chang)識，我(wo)們(men)知道，無論是話筒拾取(qu)的(de)聲(sheng)(sheng)(sheng)音信(xin)號(hao)，亦或(huo)電(dian)(dian)子化方(fang)式合成的(de)聲(sheng)(sheng)(sheng)音信(xin)號(hao)，其已(yi)基(ji)本(ben)具備較為清晰(xi)的(de)聲(sheng)(sheng)(sheng)源特(te)(te)(te)征(zheng)了，所以空(kong)間(jian)特(te)(te)(te)征(zheng)(包括聲(sheng)(sheng)(sheng)源方(fang)位和聲(sheng)(sheng)(sheng)場(chang)環(huan)境特(te)(te)(te)征(zheng)等(deng)，則是上(shang)述聲(sheng)(sheng)(sheng)音重構過(guo)程(cheng)的(de)核心工作(zuo)。

　　1.在拾音環節確定聲源的空間特征

　　我們知道，利用(yong)立體(ti)聲(sheng)(sheng)(sheng)(sheng)拾音(yin)制(zhi)式(shi)(shi)(shi)、環繞聲(sheng)(sheng)(sheng)(sheng)拾音(yin)制(zhi)式(shi)(shi)(shi)及相(xiang)關調整，即可(ke)(ke)獲(huo)(huo)取(qu)(qu)聲(sheng)(sheng)(sheng)(sheng)源(yuan)的(de)(de)(de)(de)水(shui)平位(wei)置信(xin)息(xi)或者水(shui)平+縱深位(wei)置信(xin)息(xi)，那么同(tong)理，利用(yong)沉(chen)浸式(shi)(shi)(shi)拾音(yin)制(zhi)式(shi)(shi)(shi)(或稱之(zhi)為(wei)三維聲(sheng)(sheng)(sheng)(sheng)拾音(yin)制(zhi)式(shi)(shi)(shi))，具(ju)體(ti)如Sennheiser Ambeo、Rode SoundField、LDK Cube等，則同(tong)樣可(ke)(ke)以獲(huo)(huo)取(qu)(qu)三維空間信(xin)息(xi)。之(zhi)后(hou)，基(ji)于當前的(de)(de)(de)(de)技(ji)術現狀，通(tong)過與重(zhong)放揚(yang)聲(sheng)(sheng)(sheng)(sheng)器通(tong)道的(de)(de)(de)(de)直接對應或經(jing)相(xiang)關的(de)(de)(de)(de)轉(zhuan)換算(suan)法后(hou)，通(tong)常(chang)即可(ke)(ke)得(de)到(dao)基(ji)于聲(sheng)(sheng)(sheng)(sheng)道的(de)(de)(de)(de)沉(chen)浸聲(sheng)(sheng)(sheng)(sheng)，并(bing)(bing)可(ke)(ke)通(tong)過同(tong)樣聲(sheng)(sheng)(sheng)(sheng)道的(de)(de)(de)(de)揚(yang)聲(sheng)(sheng)(sheng)(sheng)器予以重(zhong)放。當然(ran)，制(zhi)作人員也可(ke)(ke)以更(geng)進(jin)一(yi)步，將所拾取(qu)(qu)到(dao)的(de)(de)(de)(de)聲(sheng)(sheng)(sheng)(sheng)音(yin)通(tong)道視為(wei)不同(tong)的(de)(de)(de)(de)聲(sheng)(sheng)(sheng)(sheng)源(yuan)對象，并(bing)(bing)將其送入基(ji)于對象的(de)(de)(de)(de)相(xiang)關沉(chen)浸聲(sheng)(sheng)(sheng)(sheng)處理器，依據制(zhi)作場地監聽(ting)的(de)(de)(de)(de)聽(ting)感進(jin)行再(zai)制(zhi)作，以獲(huo)(huo)取(qu)(qu)更(geng)符合創作者期望(wang)或者具(ju)備(bei)更(geng)好(hao)聽(ting)覺(jue)效果的(de)(de)(de)(de)聲(sheng)(sheng)(sheng)(sheng)音(yin)。

　　2.在制作環節構建聲源的空間特征

　　如果拾(shi)(shi)音(yin)時(shi)未采取(qu)沉(chen)浸(jin)式(shi)拾(shi)(shi)音(yin)制(zhi)(zhi)式(shi)，或者使用(yong)了電子(zi)合成(cheng)類聲(sheng)(sheng)(sheng)(sheng)源(yuan)，那(nei)么所得到的(de)(de)(de)(de)(de)信號(hao)雖(sui)然具(ju)(ju)有(you)(you)一定的(de)(de)(de)(de)(de)聲(sheng)(sheng)(sheng)(sheng)源(yuan)特征(zheng)，但(dan)其空間特征(zheng)卻不(bu)明確(que)，尤其是(shi)前(qian)述的(de)(de)(de)(de)(de)通過(guo)近距離單點拾(shi)(shi)音(yin)拾(shi)(shi)取(qu)的(de)(de)(de)(de)(de)信號(hao)，這(zhe)一點與之前(qian)關于耳機重(zhong)放(fang)(fang)的(de)(de)(de)(de)(de)相(xiang)關論述完全相(xiang)同(tong)。因此，這(zhe)部分信號(hao)的(de)(de)(de)(de)(de)沉(chen)浸(jin)聲(sheng)(sheng)(sheng)(sheng)處(chu)理(li)(li)(li)(li)，需要以(yi)創作者的(de)(de)(de)(de)(de)視(shi)角來進行(xing)相(xiang)關制(zhi)(zhi)作(無論是(shi)錄(lu)音(yin)制(zhi)(zhi)作還是(shi)擴聲(sheng)(sheng)(sheng)(sheng)制(zhi)(zhi)作)，即給它們人(ren)為地 “加載”空間特征(zheng)并適當匹配調(diao)整聲(sheng)(sheng)(sheng)(sheng)源(yuan)特征(zheng)。具(ju)(ju)體(ti)的(de)(de)(de)(de)(de)處(chu)理(li)(li)(li)(li)方法(fa)依據(ju)沉(chen)浸(jin)聲(sheng)(sheng)(sheng)(sheng)處(chu)理(li)(li)(li)(li)設備的(de)(de)(de)(de)(de)不(bu)同(tong)而不(bu)同(tong)。不(bu)過(guo)，當前(qian)的(de)(de)(de)(de)(de)各種沉(chen)浸(jin)聲(sheng)(sheng)(sheng)(sheng)處(chu)理(li)(li)(li)(li)器(qi)(qi)(qi)幾乎(hu)全部都可(ke)以(yi)提供三維(wei)聲(sheng)(sheng)(sheng)(sheng)像電位器(qi)(qi)(qi)或三維(wei)空間視(shi)圖，用(yong)以(yi)調(diao)控聲(sheng)(sheng)(sheng)(sheng)源(yuan)對象的(de)(de)(de)(de)(de)空間位置或運動(dong)軌(gui)跡，同(tong)時(shi)，個別產品還可(ke)以(yi)同(tong)步伴隨(sui)聲(sheng)(sheng)(sheng)(sheng)源(yuan)對象音(yin)色的(de)(de)(de)(de)(de)變化(hua)及空間混響的(de)(de)(de)(de)(de)變化(hua)，當然，有(you)(you)的(de)(de)(de)(de)(de)處(chu)理(li)(li)(li)(li)器(qi)(qi)(qi)則(ze)需要人(ren)為調(diao)整空間混響和音(yin)色。所有(you)(you)這(zhe)些，都需要混音(yin)師在(zai)良好的(de)(de)(de)(de)(de)沉(chen)浸(jin)式(shi)監(jian)聽條(tiao)件(jian)下依據(ju)監(jian)聽效果來進行(xing)。處(chu)理(li)(li)(li)(li)完畢的(de)(de)(de)(de)(de)成(cheng)品信號(hao)，如果以(yi)聲(sheng)(sheng)(sheng)(sheng)道方式(shi)輸出(chu)(chu)，則(ze)需要之后的(de)(de)(de)(de)(de)重(zhong)放(fang)(fang)場地按制(zhi)(zhi)作時(shi)的(de)(de)(de)(de)(de)監(jian)聽條(tiao)件(jian)配置同(tong)樣數(shu)量、同(tong)樣布局(ju)的(de)(de)(de)(de)(de)揚(yang)聲(sheng)(sheng)(sheng)(sheng)器(qi)(qi)(qi);而如果以(yi)聲(sheng)(sheng)(sheng)(sheng)源(yuan)對象元(yuan)數(shu)據(ju)(包括空間位置、聲(sheng)(sheng)(sheng)(sheng)源(yuan)大小等(deng))的(de)(de)(de)(de)(de)方式(shi)輸出(chu)(chu)，則(ze)可(ke)以(yi)兼(jian)容更多的(de)(de)(de)(de)(de)重(zhong)放(fang)(fang)揚(yang)聲(sheng)(sheng)(sheng)(sheng)器(qi)(qi)(qi)布局(ju)方式(shi)，這(zhe)種信號(hao)格式(shi)在(zai)最(zui)終重(zhong)放(fang)(fang)時(shi)，會(hui)首先(xian)在(zai)現場用(yong)的(de)(de)(de)(de)(de)沉(chen)浸(jin)聲(sheng)(sheng)(sheng)(sheng)處(chu)理(li)(li)(li)(li)器(qi)(qi)(qi)中建立重(zhong)放(fang)(fang)場地的(de)(de)(de)(de)(de)揚(yang)聲(sheng)(sheng)(sheng)(sheng)器(qi)(qi)(qi)布局(ju)模型，確(que)定所要用(yong)到的(de)(de)(de)(de)(de)揚(yang)聲(sheng)(sheng)(sheng)(sheng)器(qi)(qi)(qi)數(shu)量和位置，之后再以(yi)此為基礎，結合聲(sheng)(sheng)(sheng)(sheng)源(yuan)對象的(de)(de)(de)(de)(de)元(yuan)數(shu)據(ju)進行(xing)渲染計算，從而得到現場每一個揚(yang)聲(sheng)(sheng)(sheng)(sheng)器(qi)(qi)(qi)具(ju)(ju)體(ti)需要重(zhong)放(fang)(fang)的(de)(de)(de)(de)(de)信號(hao)內容。

　　3.揚聲器重放沉浸聲的算法理論基礎

　　利用(yong)揚聲(sheng)(sheng)器重放(fang)沉浸聲(sheng)(sheng)，在(zai)(zai)實際執(zhi)行時，依然需要向三個空間維度的(de)(de)相(xiang)(xiang)關(guan)揚聲(sheng)(sheng)器各自(zi)饋(kui)送不同的(de)(de)聲(sheng)(sheng)音信(xin)號，使(shi)之(zhi)在(zai)(zai)整個聽音空間內合成(cheng)為聲(sheng)(sheng)源對(dui)象(xiang)的(de)(de)位置和相(xiang)(xiang)關(guan)的(de)(de)聲(sheng)(sheng)場(chang)環境。因此(ci)，無論何種沉浸聲(sheng)(sheng)處(chu)理器，其本質(zhi)就是利用(yong)渲(xuan)染(ran)算法，將某一個聲(sheng)(sheng)源對(dui)象(xiang)的(de)(de)元(yuan)數據，運算拆解成(cheng)為不同的(de)(de)揚聲(sheng)(sheng)器通(tong)道信(xin)息并饋(kui)送給相(xiang)(xiang)關(guan)揚聲(sheng)(sheng)器。

　　在當前的(de)(de)技(ji)術(shu)(shu)(shu)發展下(xia)，利用(yong)揚(yang)聲(sheng)(sheng)(sheng)器重(zhong)(zhong)放(fang)沉浸(jin)聲(sheng)(sheng)(sheng)的(de)(de)基(ji)本技(ji)術(shu)(shu)(shu)原(yuan)理主(zhu)要(yao)(yao)分為兩類(lei)，即基(ji)于(yu)(yu)感(gan)知的(de)(de)虛擬聲(sheng)(sheng)(sheng)音場(chang)(chang)(chang)景重(zhong)(zhong)建(jian)(jian)(jian)技(ji)術(shu)(shu)(shu)和(he)聲(sheng)(sheng)(sheng)場(chang)(chang)(chang)物(wu)(wu)理重(zhong)(zhong)建(jian)(jian)(jian)技(ji)術(shu)(shu)(shu)，它們共(gong)同構(gou)成了揚(yang)聲(sheng)(sheng)(sheng)器重(zhong)(zhong)放(fang)沉浸(jin)聲(sheng)(sheng)(sheng)算法的(de)(de)理論(lun)基(ji)礎。其中，基(ji)于(yu)(yu)感(gan)知的(de)(de)虛擬聲(sheng)(sheng)(sheng)音場(chang)(chang)(chang)景重(zhong)(zhong)建(jian)(jian)(jian)技(ji)術(shu)(shu)(shu)主(zhu)要(yao)(yao)包(bao)括基(ji)于(yu)(yu)矢量的(de)(de)幅度(du)聲(sheng)(sheng)(sheng)像控制技(ji)術(shu)(shu)(shu)(Vector-based amplitude panning，VBAP)和(he)基(ji)于(yu)(yu)距離的(de)(de)幅度(du)聲(sheng)(sheng)(sheng)像控制技(ji)術(shu)(shu)(shu)(Distance-based amplitude panning，DBAP)，該類(lei)技(ji)術(shu)(shu)(shu)主(zhu)要(yao)(yao)考慮人耳的(de)(de)感(gan)知特性(xing)，所以(yi)實現起來(lai)相對簡單。而聲(sheng)(sheng)(sheng)場(chang)(chang)(chang)物(wu)(wu)理重(zhong)(zhong)建(jian)(jian)(jian)技(ji)術(shu)(shu)(shu)的(de)(de)重(zhong)(zhong)要(yao)(yao)代表則主(zhu)要(yao)(yao)基(ji)于(yu)(yu)高(gao)階球諧分解(jie)和(he)重(zhong)(zhong)構(gou)的(de)(de)聲(sheng)(sheng)(sheng)重(zhong)(zhong)建(jian)(jian)(jian)理論(lun)(High Order Ambisonic,HOA)和(he)波場(chang)(chang)(chang)合成理論(lun)(Wave field synthesis,WFS)，基(ji)于(yu)(yu)這(zhe)兩種理論(lun)的(de)(de)聲(sheng)(sheng)(sheng)場(chang)(chang)(chang)重(zhong)(zhong)建(jian)(jian)(jian)技(ji)術(shu)(shu)(shu)主(zhu)要(yao)(yao)追求(qiu)對原(yuan)始(shi)聲(sheng)(sheng)(sheng)場(chang)(chang)(chang)的(de)(de)精(jing)確還原(yuan)，因此無(wu)論(lun)是對重(zhong)(zhong)放(fang)設備還是重(zhong)(zhong)放(fang)環(huan)境都有較(jiao)高(gao)的(de)(de)要(yao)(yao)求(qiu)。

　　基于矢量(liang)(liang)的(de)幅度平移技術(shu)最早由芬(fen)蘭赫爾辛基理工大(da)學的(de)Viile Pulkki于1997年提出，它的(de)原理是(shi)(shi)利(li)用2～3個揚(yang)(yang)(yang)聲(sheng)(sheng)器(qi)方(fang)(fang)向(xiang)的(de)單位(wei)向(xiang)量(liang)(liang)線(xian)性組合出虛擬聲(sheng)(sheng)源(yuan)方(fang)(fang)向(xiang)的(de)單位(wei)向(xiang)量(liang)(liang)，即(ji)為不同揚(yang)(yang)(yang)聲(sheng)(sheng)器(qi)分配不同幅度的(de)信號(hao)，利(li)用各揚(yang)(yang)(yang)聲(sheng)(sheng)器(qi)到達人(ren)耳的(de)聲(sheng)(sheng)級差(cha)來控制人(ren)耳對(dui)聲(sheng)(sheng)源(yuan)(聲(sheng)(sheng)像)位(wei)置的(de)感知(zhi)。利(li)用VBAP技術(shu)能(neng)較為準確地恢(hui)復(fu)500～600Hz以下的(de)聲(sheng)(sheng)音的(de)方(fang)(fang)向(xiang)，但前(qian)提是(shi)(shi)各揚(yang)(yang)(yang)聲(sheng)(sheng)器(qi)要(yao)布置在(zai)同一球面，因此基于VBAP的(de)揚(yang)(yang)(yang)聲(sheng)(sheng)器(qi)重(zhong)放只能(neng)在(zai)一定范圍(wei)內(nei)恢(hui)復(fu)聲(sheng)(sheng)源(yuan)的(de)方(fang)(fang)位(wei)。

　　基于距離的(de)(de)(de)幅度平移技術由(you)Lossius和Pascal Baltazar、Kostadinov和Reiss這兩對科(ke)學家提(ti)出，與VBAP不同的(de)(de)(de)是(shi)該技術支持在非球面環境布置揚(yang)聲器(qi)陣列。雖(sui)然DBAP的(de)(de)(de)精確(que)度沒(mei)有VBAP高，但是(shi)DBAP應用起來更靈活，應用過程中不再受揚(yang)聲器(qi)和聽音(yin)者布局的(de)(de)(de)限制。

　　聲(sheng)(sheng)(sheng)場(chang)(chang)物(wu)理(li)(li)重(zhong)建技(ji)術來源(yuan)于(yu)1934年(nian)Steinberg和William Snow提出的“聲(sheng)(sheng)(sheng)音(yin)幕簾(lian)(Acoustic Curtain)”概念。它指出我們可以(yi)(yi)用(yong)(yong)大量的傳聲(sheng)(sheng)(sheng)器在一個(ge)面上(shang)組成一個(ge)緊密的傳聲(sheng)(sheng)(sheng)器網(wang)格(ge)陣(zhen)列，并用(yong)(yong)此陣(zhen)列采集(ji)原(yuan)始(shi)聲(sheng)(sheng)(sheng)源(yuan)的方位(wei)(wei)(wei)信(xin)息和聲(sheng)(sheng)(sheng)場(chang)(chang)形狀(zhuang)，再依據惠更斯(si)原(yuan)理(li)(li)，利(li)用(yong)(yong)同樣結構的揚聲(sheng)(sheng)(sheng)器網(wang)格(ge)陣(zhen)列重(zhong)放對(dui)應位(wei)(wei)(wei)置傳聲(sheng)(sheng)(sheng)器所(suo)拾取的信(xin)號，即可還原(yuan)出聲(sheng)(sheng)(sheng)源(yuan)的方位(wei)(wei)(wei)和聲(sheng)(sheng)(sheng)場(chang)(chang)輻(fu)射信(xin)息。據此，1988年(nian)，Gus Berkhout受地震研(yan)究及原(yuan)油開采勘探的啟發提出了(le)波場(chang)(chang)合(he)成理(li)(li)論。在理(li)(li)想狀(zhuang)態下，利(li)用(yong)(yong)該理(li)(li)論可以(yi)(yi)完全還原(yuan)出原(yuan)始(shi)聲(sheng)(sheng)(sheng)場(chang)(chang)，聽(ting)音(yin)者(zhe)可在由二次聲(sheng)(sheng)(sheng)源(yuan)合(he)成的聲(sheng)(sheng)(sheng)場(chang)(chang)區域中任意走動，且聲(sheng)(sheng)(sheng)像不會隨聽(ting)音(yin)者(zhe)的位(wei)(wei)(wei)置的變化而(er)變化。

　　此(ci)外(wai)，另外(wai)一種聲(sheng)(sheng)場物(wu)理重建技術則為(wei)基(ji)(ji)于(yu)高階球諧(xie)函(han)(han)數分解和(he)重構理論的(de)聲(sheng)(sheng)場重建技術，有關該技術的(de)研究最早(zao)從(cong)二十世紀70年代開始(shi)，它利(li)用球諧(xie)函(han)(han)數作(zuo)為(wei)編(bian)碼(ma)和(he)解碼(ma)的(de)基(ji)(ji)矢(shi)量，通(tong)過逐級增加重放階數來逼近原始(shi)聲(sheng)(sheng)場信息。階數越高，用于(yu)表現(xian)(xian)聲(sheng)(sheng)源(yuan)對(dui)象特征(zheng)的(de)基(ji)(ji)矢(shi)量越多，解析度也越細致，其共同作(zuo)用后的(de)呈(cheng)現(xian)(xian)效果也越接近于(yu)實際。不(bu)過，此(ci)時也帶來了運(yun)算(suan)量和(he)揚聲(sheng)(sheng)器(qi)數量幾何增加、揚聲(sheng)(sheng)器(qi)布(bu)局困難等諸(zhu)多難題。

　　關于上述技術原理(li)的(de)具體細節，目(mu)前已有(you)很多文獻進(jin)行了探(tan)討，本文將不再贅述。但筆者個人認為(wei)，波場合(he)(he)成(cheng)技術最具原理(li)合(he)(he)理(li)性，因而應該(gai)能夠獲得(de)更佳的(de)聲(sheng)音情景重(zhong)構聽感效果。不過，利用波場合(he)(he)成(cheng)技術的(de)重(zhong)放還有(you)很多亟(ji)待解決的(de)問題，比(bi)如(ru)揚(yang)聲(sheng)器間距的(de)控制與頻率混疊的(de)問題、重(zhong)放所需揚(yang)聲(sheng)器數量過多、長(chang)陣列(lie)的(de)時域效應等，同時，還要考慮(lv)緊密排(pai)列(lie)的(de)揚(yang)聲(sheng)器陣列(lie)如(ru)何可以安裝實現(xian)以及其(qi)造價問題。

　　理論上(shang)講，在(zai)采用(yong)其理想(xiang)(xiang)狀態揚聲(sheng)器(qi)(qi)重放(fang)時，上(shang)述技(ji)術原(yuan)理都能夠在(zai)某一(yi)聽音(yin)區(qu)域實現聲(sheng)源對(dui)象(xiang)的(de)(de)(de)較好重構，但(dan)從(cong)實際應(ying)用(yong)的(de)(de)(de)角度來講，基(ji)于以上(shang)每(mei)種(zhong)原(yuan)理的(de)(de)(de)的(de)(de)(de)揚聲(sheng)器(qi)(qi)渲染算(suan)法都還(huan)存在(zai)一(yi)定的(de)(de)(de)問題，且各自的(de)(de)(de)理想(xiang)(xiang)運算(suan)也較為復雜，所以目前絕大(da)多數沉浸聲(sheng)處理器(qi)(qi)大(da)都采用(yong)上(shang)述兩到四項技(ji)術綜(zong)合后的(de)(de)(de)算(suan)法，并分別(bie)進行了適當的(de)(de)(de)簡(jian)化(hua)，從(cong)而在(zai)重構聲(sheng)場(chang)的(de)(de)(de)準確性(xing)和可實現性(xing)中(zhong)予以折中(zhong)。

免責聲明：本文來源于中國傳媒大學，本文僅代表作者個人觀點，本站不作任何保證和承諾，若有任何疑問，請與本文作者聯系或有侵權行為聯系本站刪除。(原創稿件未經許可,不可轉載,轉載請注明來源)

我的位置：

沉浸聲專題討論一：《沉浸聲—聲音情景的重構與創造（上）》

評論comment

【重磅】奇瑞系15.75億入主！鴻合科技控制權或易主

重磅！建碁AOPEN攜ChromeOS OPS電腦BP5130亮相2025年臺北國際電腦展！

光影與文化的交響：奧圖碼投影科技重塑夜游文旅新體驗

建碁 AOPEN 邀請函 | 2025年臺北國際電腦展COMPUTEX 2025！

我的位置：

share

相關閱讀related

評論comment