◎智谷趨勢| 王延鶴
只有視頻化才能生存
隨意打開一個APP,最顯眼的位置,放的都是視頻。
花花世界迷人眼。前100位的APP里,69個都有視頻類功能。
想想看,你每天花多少時間刷視頻?
根據(jù)《中國網(wǎng)絡(luò)視聽發(fā)展研究報告(2023)》統(tǒng)計 ,短視頻人均單日使用時長,超過2.5小時。
信息嚴(yán)重過剩,讓我們的注意力也成為一種稀缺資源。
你把時間花在哪里,命運就在哪里。
懂得這個道理的企業(yè)和品牌,紛紛開始做內(nèi)容、做直播,給產(chǎn)品添加視頻功能。
最樸實的想法,就是存量競爭時,通過視頻化吸引用戶。
短短5年,中國短視頻用戶,從6.48億增長到10.12億;
2022年,中國視頻直播帶貨規(guī)模約3.5萬億,在網(wǎng)上零售額占比高達(dá)25.4%;
出門逛街,服裝店老板娘、燒烤攤大爺,都架著手機(jī)在直播;
周杰倫辦線上演唱會,有1億人觀看,大家一起唱“故事的小黃花,從出生那年就飄著”;
就連外賣軟件也在搞直播,看菜品、發(fā)紅包,來段脫口秀。
在注意力經(jīng)濟(jì)時代,只有視頻化才能生存。
8月22日,火山引擎視頻云&AIGC技術(shù)大會召開。
大會主題是“視象新生”,火山引擎作為抖音的技術(shù)底座,要向全行業(yè)展現(xiàn)當(dāng)前視頻創(chuàng)新、變革的源動力。
火山引擎總裁譚待認(rèn)為:
隨著全行業(yè)視頻化的演進(jìn),營銷,知識、商業(yè)和空間的交互體驗也正在被重塑。
意思是說,視頻從一種內(nèi)容形態(tài),變成必不可少的能力。
過去三年的現(xiàn)實困境,讓線上化、視頻化、數(shù)字化,成了必然的選擇。
肉眼可見的,視頻化對辦公、教育、醫(yī)療、汽車、金融等行業(yè),帶去顛覆性的商業(yè)創(chuàng)新。
視頻會議、辦公軟件收獲了億級增長,頭部辦公APP用戶數(shù)突破6億;
遠(yuǎn)程醫(yī)療發(fā)力,醫(yī)生通過視頻通話對患者提供診療,管理患者情況;
智能工廠里,定位、測量、質(zhì)檢、監(jiān)測、安全生產(chǎn)都要用到超高清視頻技術(shù)與5G、人工智能的結(jié)合;
24小時直播的數(shù)字人、大模型定制的AI員工,都開始上線;
視頻技術(shù)打破時空、創(chuàng)造體驗、提升效率、轉(zhuǎn)變商業(yè)思維的能力,在本質(zhì)上,也是數(shù)字化革命的一個切面。
萬物皆可視頻化,轉(zhuǎn)變?yōu)閿?shù)據(jù)流。這是機(jī)遇也是挑戰(zhàn)。
火山引擎提前捕捉趨勢,大會上發(fā)布了自研視頻編解碼芯片、BMF多媒體處理框架等全新技術(shù),以及平行駕駛、虛擬直播間、VR直播等行業(yè)解決方案。
聽起來,有些不明覺厲?別著急。
簡單來說:火山引擎要把抖音的音視頻能力,向全行業(yè)開放了。
極限挑戰(zhàn)往往是最好的倒逼師
數(shù)據(jù)是最直觀的。
視頻在全網(wǎng)數(shù)據(jù)流量中的占比接近70%,增速還在攀升。
龐大的視頻直播需求,把視頻云變成了水電煤一般的基礎(chǔ)設(shè)施。預(yù)計到2024年,就會成為近千億級的大市場。
云計算作為一項商用服務(wù),起源于亞馬遜,電商生意。
至今,亞馬遜還是全球最大的云服務(wù)商,云業(yè)務(wù)是其最賺錢的部門。
像亞馬遜和阿里云,為了應(yīng)對雙十一、黑色星期五期間的流量高峰,儲備了大量冗余算力。
這些服務(wù)器平常閑置時,就可以作為基礎(chǔ)設(shè)施,租借給外部,幫企業(yè)低成本上云,不用自己搞IT。
之后,互聯(lián)網(wǎng)大廠又把自己先進(jìn)的企業(yè)軟件、平臺能力、人工智能,都通過云計算打包成產(chǎn)品和服務(wù),輸出給客戶。
眾多企業(yè)和云平臺綁定,就形成一個具備確定性的生態(tài),也奠定了今天的云服務(wù)格局。
在視頻云的細(xì)分賽道,火山引擎最初也是服務(wù)字節(jié)跳動內(nèi)部,尤其是抖音的視頻需求。
在2018年,抖音的日活用戶數(shù)超過1億。
每天要應(yīng)對視頻播放、傳輸、畫質(zhì)、交互、性能的多重挑戰(zhàn),內(nèi)部必須要組建能力消化、應(yīng)對。
真刀真槍的實戰(zhàn)中,火山引擎視頻云應(yīng)運而生。
現(xiàn)在各路企業(yè)都想通過視頻化,為自己多掙一點確定性。
聽起來容易,但如果企業(yè)自己搭建視頻平臺,首先是成本太高,其次缺乏成系統(tǒng)的成熟經(jīng)驗,技術(shù)門檻也比預(yù)想的高。
有需求,就有服務(wù)。這就是火山引擎視頻云的想象空間。
歷史經(jīng)驗告訴我們,極限挑戰(zhàn)往往是最好的倒逼師。
春晚、奧運會開幕式、世界杯這類大型賽事直播,也會創(chuàng)造短期流量洪峰。
火山引擎視頻云,就在2022年接受了抖音直播卡塔爾世界杯的挑戰(zhàn)。
賽場上,開始射門了。
火山引擎視頻云色彩增強(qiáng)對比示意圖
這1秒鐘,現(xiàn)場的畫面通過衛(wèi)星,從卡塔爾傳輸?shù)街袊?#xff0c;抖音要瞬間將畫面壓縮、美化,傳輸給數(shù)以億計的設(shè)備,變成你手機(jī)上的720p、1080p、4K;
這1秒鐘,如果是4K50幀畫質(zhì),視頻大小接近50M,同時傳給上億人,線路承受不住。抖音將視頻編碼壓縮到10M,傳給你的手機(jī)再解碼,才避免被流量高峰沖垮;
這1秒鐘,工程師要將HDR信號轉(zhuǎn)換為SDR,對畫面上800萬個像素的色彩、亮度、對比度進(jìn)行“美顏”;
這1秒鐘,他們要用自研的RTM直播技術(shù),把直播的延時降到半秒,讓所有人能同步看到比賽結(jié)果;
整場世界杯,火山引擎累計支持了106億人次的直播觀看,決賽觀看人數(shù)高達(dá)2.3億。
射門進(jìn)球,全場歡呼。屏幕上是1秒鐘,火山引擎幕后十年功。
這些在流量高峰中突破的技術(shù),也會逐步開放到視頻云的產(chǎn)品里,變成向外輸出的能力。
今天,抖音的日活已超過6億,2022年抖音電商同比增長了80%??梢哉f,火山引擎每分每秒都在極限測試,不斷解決、試錯、交付、迭代。
火山引擎視頻云想向B端企業(yè)證明,自己的增長飛輪、確定性能力,是可以對外輸出的。
想要開動引擎,讓命運的齒輪轉(zhuǎn)動起來。
火山引擎到底想輸出什么樣的硬實力呢?這要看產(chǎn)業(yè)的需求,以用戶為中心嘛。
大會上提出,視頻技術(shù)面臨三個難以解決的矛盾:
首先,不管視頻要更高清,還是更低延時,核心都需要升級視頻編碼技術(shù)。
視頻標(biāo)準(zhǔn)每升級一代,技術(shù)復(fù)雜度就會提高十倍;視頻編碼每升級一代,質(zhì)量碼率則減少50%,但視頻數(shù)據(jù)量擴(kuò)展卻不止2倍;
編碼的迭代速度,追不上視頻數(shù)據(jù)量的增速,這是第一個矛盾。
其次,摩爾定律變慢了。視頻芯片處理和算力增長的速度,支撐不了大規(guī)模8K/VR直播和視頻數(shù)據(jù)的需求。
算力有上限,需求無極限,這是第二個矛盾。
第三個矛盾,是XR/VR技術(shù)興起,虛擬現(xiàn)實與現(xiàn)實世界融合,將帶來新的沖擊。
面對這三大矛盾,結(jié)合眾多企業(yè)的訴求,火山引擎重新構(gòu)建了“一站式音視頻產(chǎn)品矩陣”。
最底座的算力層,是視頻處理的基礎(chǔ)。
視頻需求的快速膨脹,倒逼火山引擎的算力底座,完成了從通用計算到異構(gòu)計算的轉(zhuǎn)型。什么意思呢?
什么是異構(gòu)計算?
好比一支足球隊,隊員有不同的特長,擅長不同的攻防位置。
算力也一樣,不同的芯片和處理器,擅長不同的任務(wù)。比如說,CPU擅長通用計算,GPU適合圖形渲染、深度學(xué)習(xí),FPGA擅長網(wǎng)絡(luò)加速、數(shù)據(jù)處理。
異構(gòu)計算就是讓不同的芯片組隊,在應(yīng)對視頻任務(wù)時,發(fā)揮更高效率。
火山引擎在大會上發(fā)布的自研芯片,就是一塊擅長視頻編解碼的芯片。
在處理視頻時,1臺搭載這塊自研芯片的服務(wù)器,轉(zhuǎn)碼能力與百臺CPU服務(wù)器相當(dāng);壓縮效率比目前主流的硬件編碼器,提升了30%以上。
并且,這塊芯片提前為未來設(shè)計,具備支持HDR和8K超高清視頻的能力。
對企業(yè)來說,成本大大降低。
而在框架模型層面,火山引擎聯(lián)合英偉達(dá),共同打造了BMF多媒體處理框架。
這又是什么呢?
簡單地說,BMF框架就像一個裝滿工具的工具箱。
裝滿了視頻化需要的所有技術(shù),比如視頻編解碼、智能處理、視頻分析、圖像生成。
它就是火山引擎過去3-4年,沉淀的全鏈路視頻能力,目前已投入使用,每天要處理數(shù)以億計的視頻。
和過去的視頻處理平臺相比,BMF的優(yōu)勢在于:
幫助企業(yè)將各種視頻處理能力和解決方案協(xié)同工作,快速實現(xiàn)視頻化落地;
支持從生產(chǎn)到消費的各種視頻應(yīng)用場景,包括視頻轉(zhuǎn)碼、云編輯、移動端后處理,特別是AI帶來的視頻增強(qiáng)、視頻質(zhì)量分析等功能;
提供多語言開發(fā)支持,使開發(fā)更加方便,提高效率。
這個框架已經(jīng)全面開源了,包括它的框架層,9個開箱即用的案例,以及超過20個API范例。
在應(yīng)用層面,火山引擎的行業(yè)解決方案,就給了開發(fā)者拿來即用、有方法論的視頻化能力。
比如說,已經(jīng)在抖音落地的互動直播營銷解決方案。
就把整個直播鏈路都數(shù)據(jù)化了,這是要教給你,在視頻領(lǐng)域使用數(shù)據(jù)驅(qū)動的增長方法。
讓你一目了然,針對性增加互動、優(yōu)化方式,直接提升直播轉(zhuǎn)化率和營收水平。
今年蘋果推出Vision Pro后,又為VR市場加了一把火;AI大模型的發(fā)展,也為數(shù)字人、虛擬直播的大規(guī)模應(yīng)用,鋪好了路。
火山引擎在Pico VR的實踐基礎(chǔ)上,打造了8K級、360度的VR直播全鏈路解決方案。
這降低了VR內(nèi)容的制作門檻,企業(yè)能在Vision Pro、Pico等設(shè)備里,上線自己的VR應(yīng)用。
而火山引擎專門打造的虛擬直播間解決方案,也能打造數(shù)字人主播、虛擬直播場景和AR場景。
當(dāng)然,直播技術(shù)是火山引擎的老本行了。除了直播,他們在過去幾年也與行業(yè)合作,打造更加產(chǎn)業(yè)級的視頻應(yīng)用。
比方說,自動駕駛的核心技術(shù),其實就是AI、視頻處理、實時傳輸。
火山引擎的視頻處理、高速傳輸技術(shù),就很適合與自動駕駛公司合作。
將音視頻處理速度提升一個量級,這就是火山引擎的遠(yuǎn)程車控方案。
毫末智行與火山引擎共同構(gòu)建的遠(yuǎn)程車控方案,把汽車視頻處理速度提升了一個量級。
在車載視頻監(jiān)控、哨兵模式、遠(yuǎn)程理賠、快遞到車等任務(wù)中,把視頻延時壓縮到90毫秒,幾乎是實時同步了。
這讓自動駕駛、遠(yuǎn)程操控,又突破了一個技術(shù)難點。同樣的技術(shù),也可以用到機(jī)器人、智能制造里,依賴視頻視覺技術(shù)處理的地方。
再比如說,今年火遍全球的AI大模型。
近期,火山引擎首次把AIGC視覺大模型,用來修復(fù)老電影的。
老電影用膠片保存,時間久了都會是“全損”畫質(zhì)。
所謂修復(fù)工作,其實就是把膠片數(shù)字化,再一幀幀畫面“P圖”:清污、補(bǔ)接、處理劃痕、顏色調(diào)整。
一部90分鐘的電影,畫面有十幾萬幀,如果都靠人力P圖,顯然耗時費力、成本高昂。
而通過視覺大模型,對修復(fù)效果實現(xiàn)了大幅度的提升,并且能規(guī)模化、高效率進(jìn)行修復(fù)工作。
火山引擎也宣布,要修復(fù)100部香港老片,將《A計劃》《笑傲江湖》《蜀山·新蜀山劍俠》等經(jīng)典都提升到4K畫質(zhì)。
可以說,圍繞視頻化中臺,火山引擎深入了新一代數(shù)字基礎(chǔ)設(shè)施的底座,并與千行百業(yè)建立了關(guān)系,成為一個扎根視頻技術(shù)的新生態(tài)。
字節(jié)跳動視頻架構(gòu)負(fù)責(zé)人王悅表示:
當(dāng)技術(shù)面臨瓶頸,也許我們可以換一種姿勢奔跑,從算力,體驗和交互不同維度突破;
基于抖音等業(yè)務(wù)大規(guī)模實踐打磨,燃燒沉淀自己,把火種傳遞給更多人。
結(jié)語
現(xiàn)在你知道,火山引擎想輸出什么樣的能力了吧?
在視頻時代的上半場,人們看到了技術(shù)對娛樂、電商、社交、教育帶來的改變。
在如今的下半場,變化的是什么?大家需要什么?? ? ??
是線上化嗎?實時化?體驗感?? ?
本質(zhì),還是效率的提升。
追求效率提升,追求增長,追求穩(wěn)定,這才是大家的共同訴求。
你只要嘗過甜頭,轉(zhuǎn)變了眼界,才發(fā)現(xiàn)原來可能性還有很多。
走出一條數(shù)字化路徑后,火山引擎,也想成為確定性的創(chuàng)造者。
相關(guān)稿件