
聲音識別特征參數編碼
在音頻編碼的基礎上,支持識別特征參數編碼,避免編碼失真對語音/聲紋識別的影響;
識別特征參數采用MFCC方案;
識別特征參數編碼支持兩種模式:
1、直接編碼模式:無需計算重建信號,直接編碼原始信號特征矢量,計算復雜度低, 碼率4.8kbps。2、預測編碼模式:原始信號和重建信號分別提取特征,編碼特征殘差矢量,計算復雜度高,碼率3.2kbps。
支持監控專用信息
時間信息通過專門語法與視音頻壓縮數據一起傳輸和存儲,便于檢索查詢、視音頻同步和多路視頻同步,還可以避免在圖像上疊加OSD破壞圖像原始內容;
特殊監控事件類型及參數通過專門語法與視音頻壓縮數據一起傳輸和存儲,便于檢索查詢,對于大規模監控網絡和數據庫更為重要;
支持監控數據加密和認證
利用安全參數集定義加密和認證的方法及保護范圍,可以實現不同級別保護;
利用NAL單元頭中特定標志位標記加密和認證是否生效;
以統一的語法格式支持多種加密和認證算法,具備靈活的可擴展性。
視頻檔次和級別的劃分
SVAC視頻劃分為簡單、主要、3個檔次(profile):
1、簡單檔次支持幀模式編碼、4:2:0數據采樣格式、8-bit數據精度、幀內預測和前向預測(I/P-pic)、VLC編碼、監控專用信息等,滿足監控視頻編解碼的基礎應用;
2、主要檔次增加支持場模式編碼、4:0:0數據采樣格式、9/10-bit數據精度、雙向預測(B-pic)、CABAC編碼、ROI、加密和認證等,滿足典型監控應用的視頻編解碼需求;
3、檔次進一步增加支持4:2:2數據采樣格式、SVC等, 功能更強大。
SVAC視頻主要根據圖像分辨率、數據格式和最大編碼比特率劃分為8個級別(level)
音頻檔次和級別的劃分
SVAC音頻劃分為簡單、主要、3個檔次(profile)
1、簡單檔次支持ACELP和BWE編碼,可滿足一般監控場景對語音信號的編碼需求;
2、主要檔次增加支持識別特征參數的直接編碼,實現復雜度有所增加;
3、檔次進一步增加支持TVC編碼和識別特征參數的預測編碼,實現復雜度高,但編碼效率更高。
SVAC音頻主要根據采樣頻率劃分為3個級別(level)