【第一參賽人/留學人員】SUN XUEJING(孫學京)
【留學國家】美國
【技術領域】新一代信息技術
【參賽屆次】第10屆
【所獲獎項】入圍
【項目簡介】
聽覺是除視覺外人類感知外界信息的另一個重要途徑。人類的聽覺中,除了對聲音的響度、音調和音色等主觀屬性的感覺外,還包括對聲音的空間聽覺、也就是對聲音空間屬性或特性的主觀感受及進一步的信號處理,涵蓋聲源定位、場景感知與異常音頻事件檢測等。高階聲場三維聲是一種空間音頻技術,在我國,由于技術和播放平臺受限等原因,三維聲采集播放及智慧音頻應用一直以來處于探索階段。主要技術內容:(1)研發開發了三維聲特別是高階聲場的采集渲染技術,基于HOA第一增益和基于VBAP第二增益,通過混合增益完成所述多路音頻的混音處理,在保持聲音平滑運動的情況下更精準定位聲源位置;(2)研究開發了虛擬環繞聲傳輸的方法,使元數據的效率更高,同時使音頻對象在空間里做曲線運動時軌跡更平滑。實現了針對不同場景,不同內容,動態生成最優虛擬環繞聲的音頻技術。(3)研究基于多麥克風陣列的絕對聲源定位方法及音頻事件分類方法。多聲源絕對定位方面,獲得三個麥克風陣列SPR-PATH的計算結果后,通過尋找三條定位線公共垂線中點所組成三角形平面的重心方式進行擬合,所擬合得到的點即看作聲源的具體位置。
【展開】
【收起】