DAV首頁
數字音視工程網

微信公眾號

數字音視工程網

手機DAV

  • 熱門搜索:
  • 技術風向標
  • LED小間距
  • null
    null
    null
    卓華,
    招商,
    null
    null
    null
    快捷,
    null

    我的位置:

    share

    AVS感知無損壓縮團體標準正式發布

    來源:智能視聽研究院        編輯:ZZZ    2024-10-21 09:56:55     加入收藏    咨詢

    咨詢
    所在單位:*
    姓名:*
    手機:*
    職位:
    郵箱:*
    其他聯系方式:
    咨詢內容:
    驗證碼:
    不能為空 驗證碼錯誤
    確定

    2024年10月14日,中關村視聽產業技術創新聯盟正式批準發布團體標準《信息技術 感知無損壓縮 第1部分:圖像》,標準號:T/AI 129.1-2024。

      2024年10月14日,中關村視聽(ting)產業技術(shu)創新聯(lian)盟正式批(pi)準(zhun)發布團體標準(zhun)《信息技術(shu) 感知無損壓(ya)縮 第(di)1部分:圖像》,標準(zhun)號:T/AI 129.1-2024。

      AVS感知無損壓縮(suo)(Perceptual Lossless Compression,以下簡稱PLLC)標(biao)準制定工作(zuo)自2021年12月(yue)啟(qi)動(dong),中(zhong)國(guo)科研機構(gou)和企業集體創新,專(zhuan)注于解決“8K+”超高(gao)清(qing)視頻(pin)(pin)中(zhong)高(gao)速數(shu)據收發的(de)性能瓶頸(jing)問題。經(jing)過三年的(de)深入研發,AVS視頻(pin)(pin)組研發了一系(xi)列(lie) “超低延(yan)時(shi)、硬件友好、主觀無損”的(de)輕量(liang)級圖像壓縮(suo)技術,并最終形成團體標(biao)準。主觀質(zhi)量(liang)測試表明(ming),PLLC達到了國(guo)際領(ling)先水平,標(biao)志著中(zhong)國(guo)在視頻(pin)(pin)編解碼領(ling)域實現了又一重大突破。

      一、PLLC關鍵技術(shu)特性(xing)

    圖1 PLLC參考(kao)軟(ruan)件平臺(tai)(HIM)流水

      PLLC標準定義了兩個編碼檔(dang)(dang)次(ci),分(fen)別(bie)為接口檔(dang)(dang)次(ci)和幀存(cun)檔(dang)(dang)次(ci)。接口檔(dang)(dang)次(ci)主要面向信號傳輸接口的(de)硬件芯片(Application Specific Integrated Circuit,ASIC)設計,幀存(cun)檔(dang)(dang)次(ci)則可廣泛應用于主觀無(wu)損(sun)或信號無(wu)損(sun)質(zhi)量等級的(de)圖像(xiang)緩存(cun),減輕圖像(xiang)處理系(xi)統中的(de)內存(cun)與帶寬壓(ya)力,提升(sheng)系(xi)統總體性能。

      如圖1所示,PLLC標準的關(guan)鍵技術可(ke)分為信號處理、模式預測、量化、系數編碼和碼率控制五個部分組成。下面簡(jian)要介(jie)紹(shao)每(mei)部分的實現方案(an)和設計目(mu)的:

      1. 信號處理: PLLC支持將信號切(qie)分(fen)為等尺(chi)寸的矩形(xing)片進行并行處(chu)理(li),編(bian)碼過程中(zhong)最小的單元為16×2的一(yi)組(zu)像素。這種處(chu)理(li)方式使(shi)得(de)PLLC在(zai)保持高壓縮(suo)效率的同時(shi),能夠實現超低延時(shi)的數據傳輸。

      2. 模式預測: PLLC包含(han)點預測(ce)、普通(tong)(tong)幀(zhen)內(nei)預測(ce)和(he)塊復(fu)制幀(zhen)內(nei)預測(ce)三類預測(ce)模式,通(tong)(tong)過(guo)比特代價和(he)重構失真的綜合(he)評估,獲(huo)得編碼單(dan)元的最優編碼模式。這一設(she)計(ji)支持了高(gao)度并行的硬(ying)件(jian)處(chu)理(li),提高(gao)了編解碼的效率。

      3. 量化和系數編碼: PLLC使用移位量(liang)(liang)化和半定長系數(shu)(shu)編碼,在(zai)保(bao)證低(di)硬件成本的(de)前(qian)提下實現(xian)對(dui)預測殘差的(de)能量(liang)(liang)聚集。此外,PLLC還(huan)支持在(zai)特(te)定點(dian)位逐像(xiang)素點(dian)的(de)量(liang)(liang)化參數(shu)(shu)微調,顯著優化紋理(li)細節的(de)主觀重建質量(liang)(liang)。

      4. 碼率控制: 碼率控(kong)制(zhi)(zhi)是恒定(ding)碼率壓縮的(de)(de)關鍵模塊,PLLC提出一種(zhong)基于歷史先(xian)驗自(zi)適應更新的(de)(de)碼率估計模型,通(tong)過(guo)對(dui)紋理(li)特(te)征建模導出其(qi)預分(fen)配的(de)(de)編碼比(bi)特(te)數,隨后結合視覺無(wu)損(sun)的(de)(de)比(bi)特(te)下界與位流緩(huan)沖的(de)(de)比(bi)特(te)上界進行適當放縮,最終映射導出實際(ji)的(de)(de)量化步長(chang)。通(tong)過(guo)上述碼率控(kong)制(zhi)(zhi)技(ji)術(shu),實現了穩(wen)定(ding)的(de)(de)恒定(ding)碼率傳(chuan)輸和視覺無(wu)損(sun)的(de)(de)主觀質量。

      二(er)、主(zhu)客觀性能測試

      在(zai)AVS工作組遴選(xuan)的27組測試序列中(zhong),PLLC標準(zhun)參考軟件(jian)表現出(chu)了(le)優秀(xiu)的客(ke)觀(guan)重建質(zhi)量(liang)。如(ru)圖2所示(shi),在(zai)ISO 29170-2國際主(zhu)觀(guan)質(zhi)量(liang)標準(zhun)的判(pan)定中(zhong),PLLC閃爍(shuo)測試有25/27條(tiao)序列達(da)到(dao)主(zhu)觀(guan)無(wu)損的判(pan)定標準(zhun),并(bing)排(pai)測試全部(bu)27/27條(tiao)序列均達(da)到(dao)主(zhu)觀(guan)無(wu)損。

    圖2 客觀(guan)重(zhong)建(jian)數據與(yu)主(zhu)觀(guan)評測結果,序(xu)列(lie)(lie)17為噪聲序(xu)列(lie)(lie)

      在測(ce)(ce)試的(de)(de)27組信(xin)號(hao)中(zhong)(zhong)(zhong),難度最高的(de)(de)10條信(xin)號(hao)被進一(yi)(yi)步用來(lai)進行PLLC與(yu)國(guo)際同類壓縮標(biao)準DSC的(de)(de)主觀(guan)質量對比,其(qi)中(zhong)(zhong)(zhong)PLLC的(de)(de)主觀(guan)質量在閃爍測(ce)(ce)試中(zhong)(zhong)(zhong)與(yu)之(zhi)(zhi)持平(均(jun)為8/10條序(xu)列達到(dao)(dao)主觀(guan)無損),在并排測(ce)(ce)試中(zhong)(zhong)(zhong)更(geng)優(PLLC: 10/10; DSC: 9/10)。這一(yi)(yi)對比結(jie)果證實了PLLC標(biao)準達到(dao)(dao)了國(guo)際領先水平,為中(zhong)(zhong)(zhong)國(guo)在國(guo)際視頻淺壓縮編碼(ma)領域的(de)(de)競爭中(zhong)(zhong)(zhong)贏(ying)得了重要的(de)(de)一(yi)(yi)席(xi)之(zhi)(zhi)地。

      三、系(xi)統產(chan)品部署

      國(guo)內(nei)多家廠(chang)商已開(kai)始基于(yu)PLLC的相關(guan)硬件產品(pin)開(kai)發與(yu)部署(shu)。作為國(guo)內(nei)領先的控制(zhi)臺設計與(yu)制(zhi)造(zao)商,北京鐵(tie)力山科技股份(fen)有限公(gong)司率先基于(yu)現場可(ke)編程(cheng)門陣列(Field Programmable Gate Array,FPGA)實(shi)現了(le)PLLC標準(zhun)的部署(shu),展示了(le)該標準(zhun)在壓縮效(xiao)率與(yu)硬件適配(pei)上的卓越表(biao)現。

      北京大(da)學視頻(pin)(pin)與(yu)視覺技術國家工程(cheng)研究中心與(yu)鐵力(li)山緊密合作,共同(tong)研發了基于PLLC的(de)高(gao)速實時(shi)FPGA編(bian)解(jie)(jie)碼(ma)(ma)系統,如(ru)圖3所示(shi)。該系統能夠處理四(si)路實時(shi)采集的(de)4K視頻(pin)(pin),通(tong)過(guo)PLLC編(bian)碼(ma)(ma)器進行實時(shi)壓縮(suo)后(hou),經由局域網(wang)傳輸(shu)至接收端,隨后(hou)通(tong)過(guo)FPGA實時(shi)解(jie)(jie)碼(ma)(ma)器解(jie)(jie)碼(ma)(ma)并輸(shu)出至。該系統可以實現3倍(bei)無(wu)損壓縮(suo)效果,充(chong)分(fen)展示(shi)了PLLC標準(zhun)在高(gao)速高(gao)分(fen)辨率視頻(pin)(pin)高(gao)效視頻(pin)(pin)壓縮(suo)傳輸(shu)應用(yong)中的(de)強大(da)性能。

    (a)

    (b)

    圖(tu)(tu)3 (a)系統結構(gou)圖(tu)(tu),(b) 播放示意圖(tu)(tu)

      四、未來展望(wang)

      AVS感(gan)知(zhi)無損壓縮團(tuan)體標準的(de)(de)(de)成功發布(bu),不僅為(wei)“8K+”超(chao)高清視(shi)頻(pin)海量信號提供(gong)了超(chao)低延時(shi)傳輸和處理的(de)(de)(de)全新國產化技術(shu)方案,也(ye)為(wei)我國視(shi)頻(pin)行業的(de)(de)(de)自主創新和高效發展奠定了堅實基礎。隨著(zhu)技術(shu)的(de)(de)(de)不斷成熟和應用的(de)(de)(de)不斷拓展,AVS感(gan)知(zhi)無損壓縮技術(shu)將在全球范(fan)圍內(nei)推動超(chao)高清視(shi)頻(pin)產業的(de)(de)(de)快速發展,為(wei)觀眾帶來更加豐富、震撼的(de)(de)(de)視(shi)覺體驗。

    免責聲明:本文來源于智能視聽研究院,本文僅代表作者個人觀點,本站不作任何保證和承諾,若有任何疑問,請與本文作者聯系或有侵權行為聯系本站刪除。(原創稿件未經許可,不可轉載,轉載請注明來源)
    掃一掃關注數字音視工程網公眾號

    相關閱讀related

    評論comment

     
    驗證碼:
    您還能輸入500