AOMedia Video 1

本页使用了标题或全文手工转换,现处于繁体转换模式
出自求聞百科
AOMedia Video 1
開發者開放媒體聯盟
初始版本2018年3月28日,​6年前​(2018-03-28
最新版本
1.0.0 Errata 1[1]
2019年1月9日,​5年前​(2019-01-09
格式類型壓縮影片
專門由
延伸自
標準AOM AV1
自由格式
網站aomedia.org/av1-features/

AOMedia Video 1(簡稱AV1)是一個開放免專利影片編碼格式,專為通過網絡進行串流傳輸而設計。它由開放媒體聯盟(AOMedia)開發,該聯盟由半導體企業、隨選視訊供應商和網頁瀏覽器開發商於2015年成立。互聯網工程任務組(IETF)也將這項工作標準化為互聯網視頻編解碼器(NetVC[2]

AV1的目標是取代其前身,即由Google開發的VP9視頻壓縮格式,並與動態圖像專家組(MPEG)領導開發的高效率視訊編碼(HEVC)競爭[3][4]

AV1可以與Opus音頻格式一起封裝在WebM容器格式中,並可用於HTML5網絡視頻和網頁即時通信[5]

歷史進程

開放媒體聯盟(AOMedia)創建AV1主因包括涉及HEVC的高成本專利許可與模糊空間,此外,由MPEG設計之編解碼器有望取代AVC[6][7]。 聯盟最初由七間公司,AmazonCiscoGoogleIntelMicrosoftMozillaNetflix所組成,並宣布技術重點為提供高品質網路影像[8]。於2015年7月21日,HEVC Advance ,現為ACCESS Advance,初始授權被宣布增加對AVC 的權利金[9]。進而促成同年9 月1日,開放媒體聯盟發布AV1的官方公告並宣布成立。除了權利金所增加的成本外,還增加了授權複雜度。與過往MPEG 規範不同,MPEG可以只從MPEG-LA獲得許可,而當完成HEVC 規範時,已經形成了兩個專利池,第三個專利池也即將出現。普遍而言,專利持有人拒絕將專利共享於專利池上,這增添 HEVC 授權的不確定性。據微軟的 Lan LeGrow 所說,開源免版稅可視為不確定性消除的方法[6]

此外,創建 AV1 另一個原因是專利授權對免費開源軟件的負面影響[7]。例如在瀏覽器中實現H.264 ,將被禁止使用,除非向 MPEG-LA 支付權利金[10]。 歐洲自由軟件基金會認為,由於與自由軟體許可證的各種不兼容,公平及合理非歧視條款許可實踐使標準的自由軟體實施成為不可能[11]

AV1 的組成來自聯盟成員過往的研究與工作內容,分別在幾年前就開始實現實驗性平台,如:Xiph 與Mozilla 的Daala,Google實驗性質的 VP9提升為 VP10,並於2014 年9月12日公布[12], 以及Cisco的Thor於 2015年8月11 日發布。AV1以 VP9 的代碼庫為基礎,與其他技術結合產生[13],AV1 編解碼器參考規範初始版本0.1.0,並於2016年4月7日發布。

2017 年 10 月下旬,儘管對於開發的凍結開始生效,但數個重要功能仍在繼續發展。其中一項正在開發的功能──比特流格式,原定於 2018年1月凍結開發,但仍有關鍵錯誤,以及需要對轉換方法、語法設計、運動矢量預測的修改,也有法律的妥善性問題,最終發布日期延期至同年3月28 日,聯盟發布官方 AV1 比特流規範與軟體的編解碼器參考規範[14],2018年6 月 25 日發布經驗證過後的比特流規範 1.0.0 版[15],最終於2019 年 1 月 8 日,發布1.0.0 版附帶的規格刊誤。

據聯盟成員 Bitmovin中Martin Smole表示 ,在比特流格式完成凍結後,計算效率在官方參考編解碼器仍具挑戰[16]。 雖然尚可處理比特流格式,但此並非商用用途,速度優化也未考量。因此,早期版本的 AV1 比現有的 HEVC 編碼器慢幾個數量級。近期,開發者趨於優化官方參考編碼器。 發布後一年的2019 年 3 月,參考編碼器的效率有大幅提升,並且與其他常見的編解碼器在可比擬的效率範圍內[17]

技術

參見:VP9
libaom
開發者開放媒體聯盟
編程語言C語言匯編語言
許可協議FreeBSD 2自由
網站aomedia.googlesource.com/aom

AV1是一種使用傳統的基於區塊編碼但也加入了新技術的頻率變換格式,AV1所使用的編碼技術主要來源於谷歌VP9的下一代視頻壓縮格式VP10,但同時也包含了由Xiph.Org 基金會的主要贊助者Mozilla開發的Daala視頻壓縮格式和由Cisco開發的Thor視頻壓縮格式中所使用的視頻編碼技術。

開放媒體聯盟根據FreeBSD 2許可證發布了一個用C語言匯編語言編寫的編解碼器參考實例libaom。該參考實例的開發接受開放媒體聯盟成員資助並且公開進行。此外還有另一個開源編碼器rav1e,rav1e編碼器以犧牲編碼效率為代價,成為最簡單、最快符合AV1標準的視頻編碼器[18]

分區(Partitioning)

AV1 超區塊分區圖。它展示了如何將 128×128 超區塊連續拆分為 4×4 的分區。其中,128×128 和 8×8 超區塊不能使用 1:4 和 4:1 分割,8×8 超區塊不能使用T形分割。

於此,幀的內容被劃分為相間、相鄰且大小相同的區塊,稱為超區塊。相似於宏區塊的概念,超區塊呈現方形,大小可為 128×128 或 64×64 像素。超區塊可以根據不同的分區模式劃分為更小的區塊。四方分割模式(four-way split pattern)是唯一可以遞歸將分區細分的模式。這允許將超區塊從大區塊劃分為小至 4×4 像素的分區。

AV1引入了「T形」的編碼單元劃分方案,這取自VP10

T 形分區模式是 VP10 開發的一項新功能,水平或垂直拆分超區塊分割為 4:1 和 1:4 長條形分區。分區模式的使用因超區塊大小而有所限制,其中128×128 和 8×8超區塊都不能使用4:1或1:4長條型分區拆分,而只有8×8 超區塊則不能使用T形分割。

在不同區塊空間的部分上使用兩個獨立預測,可以使用平滑的傾斜過渡線(楔形分區預測)。這使得對象得以準確地分割,而無需沿方形邊界的傳統階梯線。

基於瓦形行列之間的可預測的相依性這使得可以實現更多的編碼器平行性[19]

預測(Prediction)

AV1 以更高的精度(10或12位樣本頻率)執行內部處理,由於解析度提高,圖像中的四捨五入的誤差較小,使得壓縮效能改進。

預測可以在一個區塊中以更高級的方式組合成複合預測,包括不同方向平滑與尖銳的楔形分區預測以及基於使用兩個預測器探究兩者之間差異的隱式掩碼,這將比取平均來得優秀。這允許在同一超區塊中使用兩個幀間預測或幀間和幀內預測的組合[20]

於幀間預測時,一個幀可以訪問 8 個可用幀緩衝區中的 6 個而不是 3 個,且可同時為雙向預測,即幀間與幀內預測組合預測[21]

在AV1中的扭曲運動[19]全局運動分析工具,用於藉由識別由相機運動產生的模式,以減少運動向量中的冗餘資訊,如噪音即為冗於資訊[19]。這實現了以往的格式中試圖卻仍未被實現的做法,例如儘管採用適用於三維的新穎方法的MPEG-4 ASP。比特流中提供的幀有一組扭曲參數,隱式區域參數可根據周圍的區塊計算得到並於區塊中使用。

切換幀(S 幀)是一種新的幀間類型,可以使用來自同一影像更高分辨率的已解碼參考幀進行預測以允許切換至低分辨率,於自適性比特串流媒體實例中,無需在開始時使用完整的關鍵幀影像片段。

幀內預測(Intra Prediction)

幀內預測使用當前幀中可用資訊來預測目標區塊的像素。大多數情況下,幀內預測是從待預測目標區塊上方和左側的相鄰像素構建的。 DC預測器藉由平均區塊左側和上方像素進行預測。

根據指定的角度,方向預測器可以推斷相鄰像素。在 AV1 中,以 45 度角開始,每次差距22.5 度,逐步增加至203 度,共計八種模式。每個方向模式中,可以為較大的區塊給予每個3度,共計六組的偏移信號,主角上方與下方各三組,從而產生總共 56 個角。

其中,真實運動預測器被替換為Paeth預測器,這將判別左上角已知像素與新像素的左側與上方的的像素的差異,而後選擇位於較小梯度方向的像素作為預測器。

另調色板預測器可用於較少顏色最多 8 個顏色的區塊,如部分電腦螢幕內容,可使用基於亮度平面樣本的色度塊預測器來利用亮度和顏色信息之間的相關性[19]

為了減少沿幀間預測區塊邊界的可視邊界,可使用重疊塊運動補償(OBMC) 技術,與相鄰區塊重疊 2 到 32 個像素,並混合重疊部分[22]

數據轉換(Data transformation)

為了將預測後剩餘的誤差轉換到頻域,AV1 編碼器可以使用正方形、或2:1/1:2 和 4:1/1:4 矩形進行離散餘弦變換[21],以及非對稱的離散正弦變換[23][24],對來自附近像素,預測左側或上方邊緣具有較低誤差的區塊,或者選擇不進行變換。

這可以複合兩個一維變換,使得水平和垂直維度得以使用不同的變換。

量化(Quantization)

AV1 具有最佳化量化矩陣,每幀可選擇和發送資訊八組量化參數,具有兩個色度平面的單獨參數,並且可以使用空間預測。在每個新的超區塊上,量化參數可以通過發送偏移信號進行調整。

濾波器(Filter)

Thor 的約束低通濾波器和 Daala 的定向去振鈴濾波器,對於環路濾波有卓越的成效:結合二者之約束定向增強濾波器,超過了單獨或一起使用一般濾波器的結果。

這是一種邊緣定向條件替換濾波器,平滑具有可配置強度的區塊沿主要邊緣方向,以消除振鈴效應

還有基於Wiener 濾波器和自引導恢復濾波器的環路恢復濾波器,用於去除由於區塊處理引起的模糊振鈴。

膠片顆粒合成使用參數視頻編碼方法改進了噪聲信號的編碼。由於膠片顆粒噪聲固有的隨機性,該信號分量傳統上編碼成本昂貴,容易遺失與損壞,並可能會留下嚴重的編碼振鈴作為殘留物。使用膠片顆粒合成來規避這些問題,其使用視覺上主觀視覺印象相似的部分替換部分信號而不是客觀相似性。消除從信號中去除顆粒成分與分析其非隨機特徵,取而代之的是僅將描述性參數傳輸到解碼器,解碼器會添加回原始組成成分之後重塑並合成偽隨機噪聲信號。膠片顆粒合成是 AC3、AAC、Vorbis 和 Opus 音頻編解碼器中使用的感知噪聲替代技術的視覺等效項。

熵編碼

Daala 的熵編碼器 ,是一種非二進制的算術編碼器,作為替代原先VP9二進制的編碼器。非二進制算術編碼的有利於避開現有專利,同時也讓比特層級的串列過程增加了平行性,藉而降低硬體實現對於石英震盪器的速率要求。 如前文參考之適應性二元算術編碼之現代二進制算術編碼的有效性,其正在使用比二進制更大的字母表來實現,因此速度更快,就像霍夫曼編碼一樣,雖然仍不及霍夫曼編碼簡單而快速。 AV1 在算術編碼器中擁有按編碼符號而不是按幀調整符號概率的能力[19]

可適性視訊編碼

對於視訊最重要的是,可適性視訊編碼是一種泛用技術而不是由 AV1 獨有,以便可以從更高比特率的影像流中提取質量更好的低比特率視頻流。這與自適應比特率流傳輸差別在於,每個更高比特率適配中的一些壓縮效率被放棄,以獲得整體影像流的效能。編碼過程也較少冗餘與較低的要求。

AV1提供了時間和空間可適性[25],幀速率和分辨率都是定義為低比特流可用的方法。

編碼規範

AV1擁有三種設定供解碼器使用MainHighProfessional。Main允許8、10位元的色彩深度以及4:0:0(灰階)和4:2:0的色度抽樣。High後續會支持4:4:4的色度抽樣。Professional將會完整支持4:0:0、4:2:0、4:2:2、4:4:4的色度抽樣以及8、10、12位元的色彩深度[26]

不同設定下AV1編碼的特性
Main (0) High (1) Professional (2)
色彩深度 8、10 8、10 8、10、12
色度抽樣 4:0:0
4:2:0
4:2:2
4:4:4

軟體支持

採用

YouTube已開始嘗試在部份影片使用AV1影片格式。2020年2月5日,Netflix開始在Android裝置上使用AV1影片格式播放影片,AV1的壓縮效率較原先的VP9提升了20%[44]Facebook表示AV1性能超乎預期,一旦時機成熟將逐步採用AV1影片格式[45]

Twitch計劃在2022年或2023年於關注度較高的影片採用AV1影片格式,並在2024年或2025年全面採用[46]

2020年4月30日,愛奇藝宣佈在電腦瀏覽器和Android設備上支持AV1視頻格式[47]

參考資料

  1. Release AV1 Bitstream & Decoding Process Specification (v1.0.0-errata1). Github.com. 2019-01-09 [2019-03-31]. 
  2. AV1 ist eingefroren und 30 Prozent besser als VP9. [2018-03-23]. 
  3. Zimmerman, Steven. Google’s Royalty-Free Answer to HEVC: A Look at AV1 and the Future of Video Codecs. XDA Developers. 2017-05-15 [2017-06-10]. 
  4. 谁将引领新一代视频编码标准:HEVC、AVS2和AV1性能对比报告 – 北京大学数字媒体研究中心. [2018-04-01]. 
  5. Tsahi Levent-Levi. WebRTC Codec Wars: Rebooted. BlogGeek.me. 2015-09-03 [2017-03-01]. The beginning of the end of HEVC/H.265 video codec 
  6. 6.0 6.1 Staff, Ars. Microsoft, Google, Amazon, others, aim for royalty-free video codecs. Ars Technica. 2015-09-01 [2021-07-01] (美國英語). 
  7. 7.0 7.1 Shankland, Stephen. Tech giants join forces to hasten high-quality online video. CNET. [2021-07-01] (英語). 
  8. Introducing the Industry’s Next Video Codec: AV1. Cisco Blogs. 2018-03-28 [2021-07-01] (美國英語). 
  9. HEVC's Journey in 2015: Going Downhill and Gaining Speed. Streaming Media Magazine. 2015-12-01 [2021-07-01] (美國英語). 
  10. Andreas. OpenH264 Now in Firefox. Andreas Gal. 2014-10-14 [2021-07-01] (英語). 
  11. Why is FRAND bad for Free Software? - FSFE. FSFE - Free Software Foundation Europe. [2021-07-01] (英語). 
  12. Shankland, Stephen. Google's Web-video ambitions bump into hard reality. CNET. [2021-07-01] (英語). 
  13. A view on VP9 and AV1 part 1: specifications. GPAC Licensing. 2016-07-12 [2021-07-01] (美國英語). 
  14. Shilov, Anton. Alliance for Open Media Releases Royalty-Free AV1 1.0 Codec Spec. www.anandtech.com. [2021-07-01]. 
  15. AOMedia AV1 Codec v1.0.0 Appears Ready For Release - Phoronix. phoronix.com. [2021-07-01]. 
  16. Hunter, Philip. Race on to bring AV1 open source codec to market, as code freezes | Videonet. [2021-07-01] (英國英語). 
  17. Good News: AV1 Encoding Times Drop to Near-Reasonable Levels. Streaming Media Magazine. 2019-03-04 [2021-07-01] (美國英語). 
  18. The fastest and safest AV1 encoder.. [2018-04-09]. 
  19. 19.0 19.1 19.2 19.3 19.4 AV1: A Status Update. Streaming Media Magazine. 2017-08-30 [2021-07-01] (美國英語). 
  20. Analysis of the emerging AOMedia AV1 video coding format for OTT use-cases (PDF). 
  21. 21.0 21.1 Mukherjee, Debargha; Su, Hui; Bankoski, James; Converse, Alex; Han, Jingning; Liu, Zoe; Xu, Yaowu. An overview of new video coding tools under consideration for VP10: the successor to VP9. Applications of Digital Image Processing XXXVIII (International Society for Optics and Photonics). 2015-09-22, 9599: 95991E. doi:10.1117/12.2191104. 
  22. Demuxed: A Video Engineer's Nirvana. Streaming Media Magazine. 2017-10-11 [2021-07-01] (美國英語). 
  23. Han, Jingning; Saxena, Ankur; Melkote, Vinay; Rose, Kenneth. Jointly Optimized Spatial Prediction and Block Transform for Video and Image Coding. IEEE Transactions on Image Processing.: 1874–1884. 
  24. R, Bhagyashree. Mozilla shares how AV1, the new open source royalty-free video codec, works. Packt Hub. 2018-11-12 [2021-07-01] (美國英語). 
  25. "Into the Depths:The Technical Details Behind AV1 (PDF). [2018-07-31. Retrieved 21 December 2018]. 
  26. Shilov, Anton. Alliance for Open Media Releases Royalty-Free AV1 1.0 Codec Spec. AnandTech. 2018-03-30 [2018-04-02]. 
  27. Millicast. Millicast demonstrates real-time video broadcasting using AV1 at CommCon 2019. Medium. 2019-07-09 [2021-07-01] (英語). 
  28. Firefox brings you smooth video playback with the world’s fastest AV1 decoder – Mozilla Hacks - the Web developer blog. Mozilla Hacks – the Web developer blog. [2021-07-01] (美國英語). 
  29. Chrome 70 Arrives With Option To Disable Linked Sign-Ins, PWAs On Windows, and AV1 Decoder - Slashdot. slashdot.org. [2021-07-01] (英語). 
  30. Li, Abner. Chrome 90 rolling out: AV1 encoder optimized for video calls, easily hide Reading List. 9to5Google. 2021-04-15 [2021-07-01] (美國英語). 
  31. How to Play AV1 Videos on YouTube in Chrome 70, Firefox, Vivaldi, Opera. Techdows. 2018-10-19 [2021-07-01] (美國英語). 
  32. Opera 57 with smarter news and Netflix recommendations - Blog. Opera Desktop. 2018-11-28 [2021-07-01] (美國英語). 
  33. Microsoft Launches Free AV1 Video Codec For Windows 10 - Slashdot. slashdot.org. [2021-07-01] (英語). 
  34. Ødegaard, Ruarí. Quick Command Parameters – v1v4ld1 br0w53r 5n4p5h07 1337.17. Vivaldi Browser. 2018-10-18 [2021-07-01] (英語). 
  35. Tung, Liam. VideoLAN: VLC 3.0's huge update brings Chromecast support, 360-degree video. ZDNet. [2021-07-01] (英語). 
  36. mpv-player/mpv, mpv, 2021-07-01 [2021-07-01] 
  37. Global Potplayer. potplayer.daum.net. [2021-07-01]. 
  38. Changelog for K-Lite Codec Pack Full. codecguide.com. [2021-07-01]. 
  39. Time to Start Testing: FFmpeg Turns 4.0 and Adds AV1 Support. Streaming Media Magazine. 2018-09-27 [2021-07-01] (美國英語). 
  40. HandBrake: News. handbrake.fr. [2021-07-01]. 
  41. Bitmovin Docs - Encoding Encoder Releases. Bitmovin Documentation. [2021-07-01] (英語). 
  42. GStreamer 1.14.0 Released With WebRTC Support, AV1 Video & Better Rust Bindings - Phoronix. phoronix.com. [2021-07-01]. 
  43. Neowin ·, Razvan Serea News Reporter. MediaInfo 18.03. Neowin. [2021-07-01] (英語). 
  44. Abner, Li. Netflix starts streaming AV1 on Android to save cellular data. 9to5Google. 2020-02-05 [2020-02-05]. 
  45. Baumgartner, Jeff. Facebook: Tests Show AV1 Streaming Performance Is Exceeding Expectations. Multichannel. 2019-02-08 [2019-02-10]. 
  46. Ozer, Jan; Shen, Yueshi. NAB 2019: Twitch Talks VP9 and AV1 Roadmap. YouTube. 2019-05-02. but we're hoping, towards 2024-2025 the AV1 ecosystem's ready, we wanna switch to AV1 a 100%. … this is our projection right now. But on the other hand, as I said, our AV1 release will be, for the head content will be a lot sooner. We are hoping 2022-2023 is we are going to release AV1 for the head content. 
  47. 存档副本. [2020-06-07].