大廠需要證明,他們投入的數(shù)十億元甚至數(shù)百億資金并沒(méi)有打水漂。
文|《中國(guó)企業(yè)家》記者 閆俊文?
與張一鳴熬夜讀論文、王興收購(gòu)初創(chuàng)公司不同,劉強(qiáng)東帶領(lǐng)京東高管捕捉大模型的方式是在真實(shí)場(chǎng)景中不斷嘗試產(chǎn)品和服務(wù)。
劉強(qiáng)東在2017年就說(shuō)過(guò),AI既是一種技術(shù),也是一種思考方式,他甚至?xí)诚脒^(guò),京東未來(lái)將實(shí)現(xiàn)無(wú)人辦公場(chǎng)景。
技術(shù)大變革期,也是公司興衰交替的關(guān)鍵期。他不可能無(wú)視大模型這種顛覆性技術(shù)所產(chǎn)生的影響,京東將如何參與這場(chǎng)游戲呢?
面對(duì)這場(chǎng)底層沖擊,各家均有不同的應(yīng)對(duì)方式,對(duì)于京東來(lái)說(shuō),它的實(shí)體業(yè)務(wù)基因更濃厚,自1998年創(chuàng)立,已從中關(guān)村的一張柜臺(tái)發(fā)展到如今旗下5家上市公司,還有3家正在尋求上市——京東工業(yè)、京東產(chǎn)發(fā)和京東科技,員工人數(shù)擴(kuò)張至超56萬(wàn),業(yè)務(wù)場(chǎng)景比阿里巴巴、騰訊與字節(jié)跳動(dòng)都要復(fù)雜和多元,覆蓋物流、零售、金融、健康、工業(yè)等等。
產(chǎn)業(yè)場(chǎng)景多元以及天然的to B場(chǎng)景,讓京東對(duì)大模型服務(wù)產(chǎn)業(yè)的渴求更強(qiáng)烈,天然成為了大模型落地產(chǎn)業(yè)最好的“練兵場(chǎng)”。
在京東之前,騰訊、百度以及阿里巴巴都發(fā)布了行業(yè)大模型方案,但一位SaaS行業(yè)人士感慨,只聽(tīng)到雷聲,不見(jiàn)下雨,暗示這些互聯(lián)網(wǎng)巨頭不會(huì)輕而易舉攻下行業(yè)山頭。
京東的雷聲和雨點(diǎn)在哪里?
全集團(tuán)共建
大模型正在變成京東公共環(huán)境的一部分。它以視頻與海報(bào)的形式,出現(xiàn)在總部電梯間電視里、辦公走廊的墻上。
2023年2月份,京東對(duì)外宣布將發(fā)布服務(wù)產(chǎn)業(yè)的大模型。很快,大模型在京東集團(tuán)內(nèi)部也被提升到了更高的優(yōu)先級(jí),并很快成立了大模型項(xiàng)目組,至少已向劉強(qiáng)東匯報(bào)過(guò)5次。
何曉冬博士是京東探索研究院院長(zhǎng)及京東科技智能服務(wù)與產(chǎn)品部總裁,也是京東自研“言犀大模型”的核心科學(xué)家。他說(shuō),以零售為例,人們購(gòu)物的行為是事件驅(qū)動(dòng),以“我要買(mǎi)什么”開(kāi)始,但大模型技術(shù)加入后,可能以“我要干什么”開(kāi)始,這意味著,購(gòu)物行為包括了小紅書(shū)的種草、抖音的內(nèi)容以及京東的貨架,混合了多種形態(tài)。
內(nèi)容以及交互的變革不斷驅(qū)動(dòng)新產(chǎn)品以及巨頭公司的興起。從雅虎的衰落到谷歌的崛起,從淘寶再到抖音的崛起,王座權(quán)力的轉(zhuǎn)移總是伴隨著這條鐵律。如今,大模型為代表的AI則重寫(xiě)這條鐵律。
大模型訓(xùn)練需要大量的產(chǎn)業(yè)數(shù)據(jù)做預(yù)訓(xùn)練,這些數(shù)據(jù)分布在京東零售、健康、物流、金融等各個(gè)產(chǎn)業(yè)線。于是,集團(tuán)協(xié)調(diào),各個(gè)BG(事業(yè)群)和BU(事業(yè)部)都參與大模型項(xiàng)目,最后,大模型項(xiàng)目組的人數(shù)達(dá)到了100人左右。
“他們把零售、物流、健康等業(yè)務(wù)數(shù)據(jù)帶進(jìn)來(lái),也會(huì)把大模型的功能帶回去用。”何曉冬說(shuō)。
這構(gòu)成了京東言犀大模型30%的訓(xùn)練數(shù)據(jù)來(lái)源——京東圍繞著數(shù)智供應(yīng)鏈積累下的高質(zhì)量原生數(shù)據(jù),而剩下70%來(lái)源于通用數(shù)據(jù)。何曉冬形容這個(gè)過(guò)程就像對(duì)大模型進(jìn)行高等教育——學(xué)習(xí)了通用知識(shí)后開(kāi)始在大學(xué)學(xué)習(xí)專(zhuān)業(yè)知識(shí)。
行業(yè)數(shù)據(jù)進(jìn)來(lái)了,對(duì)數(shù)據(jù)還要做脫敏、分類(lèi)以及加權(quán)處理,比如經(jīng)營(yíng)、營(yíng)銷(xiāo)、特有知識(shí)的數(shù)據(jù);針對(duì)不同行業(yè),不同數(shù)據(jù)的加權(quán)系數(shù)是不一樣的,比如金融領(lǐng)域,業(yè)務(wù)數(shù)據(jù)權(quán)重會(huì)多一些,要幫助員工更好地把控風(fēng)險(xiǎn);零售領(lǐng)域,又分倉(cāng)儲(chǔ)、商城、社區(qū)團(tuán)購(gòu)、到家、超市等業(yè)務(wù)單元,不同類(lèi)型數(shù)據(jù)對(duì)細(xì)分的業(yè)務(wù)場(chǎng)景的重要性也是不同的。
何曉冬強(qiáng)調(diào),要做行業(yè)大模型,企業(yè)必須在這個(gè)行業(yè)做到足夠的頭部以及沉浸數(shù)年以上,才能吃透這個(gè)行業(yè),了解行業(yè)發(fā)展的痛點(diǎn)。
在基礎(chǔ)設(shè)施上,京東云此前就建立了一個(gè)1000多張(A100)顯卡的機(jī)房,這是他們?cè)?021年購(gòu)入的,集成了英偉達(dá)最先進(jìn)的計(jì)算和連接設(shè)備,保障大模型的訓(xùn)練和迭代。
京東也在同步采用大模型改造內(nèi)部流程,他們發(fā)起了名為“效能提升”的項(xiàng)目,讓程序員運(yùn)用大模型產(chǎn)品工具,提升敲代碼、寫(xiě)注釋以及測(cè)試案例的效率。綜合評(píng)估下來(lái),業(yè)績(jī)平均估計(jì)提升20%以上。
在產(chǎn)品層面,除了智能客服,京東開(kāi)始內(nèi)部測(cè)試言犀大模型在諸多業(yè)務(wù)場(chǎng)景中的應(yīng)用。比如產(chǎn)品搜索與推薦上,電商將很快從“萬(wàn)事皆搜索”進(jìn)入到“萬(wàn)事皆服務(wù)” 的時(shí)代。
以搜索“帳篷”為例,未來(lái),搜索結(jié)果里不僅僅看到帳篷這個(gè)產(chǎn)品,更能看到露營(yíng)上下游配套的產(chǎn)品和服務(wù),比如上游的旅行地推薦,下游的配套“燒烤”“鞋帽”等產(chǎn)品,加入了類(lèi)似小紅書(shū)或者攜程的功能。它還可以自動(dòng)生成一些文案,用戶(hù)露營(yíng)完之后,可以發(fā)送至朋友圈。
還有金融營(yíng)銷(xiāo),通過(guò)自動(dòng)化營(yíng)銷(xiāo)助手“AI增長(zhǎng)營(yíng)銷(xiāo)平臺(tái)”提升營(yíng)銷(xiāo)活動(dòng)方案生產(chǎn)效率。這種全新的交互模式,讓人機(jī)交互次數(shù)從2000次降低至少于50次,操作效率可提升超過(guò)40倍。
何曉冬認(rèn)為,通過(guò)人機(jī)多輪溝通,機(jī)器能更好地理解用戶(hù)的意圖,將意圖轉(zhuǎn)化為需求。傳統(tǒng)互聯(lián)網(wǎng)領(lǐng)域里有“注意力經(jīng)濟(jì)學(xué)”理論,它主要靠設(shè)計(jì)、折扣、廣告等客觀條件來(lái)吸引用戶(hù),但在“意圖理解”的場(chǎng)景下,通過(guò)多輪對(duì)話(huà),用戶(hù)自己就會(huì)沉浸其中,并產(chǎn)生消費(fèi)以及內(nèi)容。
這是一個(gè)比當(dāng)下垂類(lèi)APP更龐大復(fù)雜的形態(tài)。如果搜索時(shí)代是信息聚合與匹配,那么大模型的時(shí)代則進(jìn)入了內(nèi)容精準(zhǔn)生成,用戶(hù)隨時(shí)隨地 “Ask Me Anything(隨便問(wèn))”。
打磨毛刺
7月,京東推出言犀大模型之后,并沒(méi)有急于推向市場(chǎng),尋求落地,他們的時(shí)間路線圖是今年下半年內(nèi)部錘煉,并針對(duì)重點(diǎn)場(chǎng)景和客戶(hù)進(jìn)行打磨,2024年初對(duì)外開(kāi)放大模型能力。
何曉冬將言犀大模型錘煉的過(guò)程稱(chēng)之為“打磨毛刺”。他以健康問(wèn)診為例解釋,京東計(jì)劃在8月正式上線健康行業(yè)大模型?,F(xiàn)在內(nèi)部更多是Beta(測(cè)試)版本,比如會(huì)遇到如何保護(hù)病人自尊心的問(wèn)題,這涉及到溝通的語(yǔ)速、方式,小概率情況下,會(huì)測(cè)出產(chǎn)品說(shuō)話(huà)不合適的現(xiàn)象。
“技術(shù)和產(chǎn)品之間其實(shí)是有鴻溝的,產(chǎn)品一定是用戶(hù)角度,技術(shù)是創(chuàng)新角度?!焙螘远f(shuō)。技術(shù)體系的人一定要往前走一步,主動(dòng)貼近產(chǎn)品體系的人。
他預(yù)測(cè),現(xiàn)在已經(jīng)到了大模型技術(shù)要通過(guò)產(chǎn)品來(lái)證明自己價(jià)值的階段。AI技術(shù)有點(diǎn)像云業(yè)務(wù)一樣,它是提高生產(chǎn)力的,最后必然為各種各樣的行業(yè)服務(wù),因此一定是往行業(yè)走。
大模型與行業(yè)結(jié)合越深,其產(chǎn)生的價(jià)值也就越大。目前ChatGPT也在摸索對(duì)外的商業(yè)化,包括通過(guò)API(應(yīng)用程序編程接口)訂閱服務(wù)等,就如谷歌在互聯(lián)網(wǎng)時(shí)代基于流量的廣告模式。
API價(jià)值偏低,它的技術(shù)理解門(mén)檻也比較高,需要企業(yè)專(zhuān)人負(fù)責(zé)調(diào)用。而對(duì)于大模型開(kāi)發(fā)企業(yè)來(lái)說(shuō),很容易陷入API價(jià)格戰(zhàn),變成一門(mén)負(fù)向的業(yè)務(wù)。
由此而論,大模型時(shí)代,API接口未必是主流的商業(yè)化路徑,原因在于,它與行業(yè)連接太淺,對(duì)產(chǎn)業(yè)的技術(shù)要求也太高,賣(mài)產(chǎn)品和私有化部署大模型或許才是正路。據(jù)悉,已有人開(kāi)始叫賣(mài)大模型,1000萬(wàn)元就能買(mǎi)到一個(gè)完整數(shù)據(jù)、算法、算力的大模型。
在上海,也有一些“云買(mǎi)手”嘗試用大模型為客戶(hù)服務(wù)。以往,他們通過(guò)人工服務(wù)數(shù)十個(gè)客戶(hù),人均年盈利在二三十萬(wàn)元之間,這就到了天花板。但用上大模型之后,他們?nèi)司?wù)的客戶(hù)量翻了10倍,釋放了大量的生產(chǎn)力以及利潤(rùn)空間。
與業(yè)內(nèi)資深人士的看法類(lèi)似,何曉冬也認(rèn)為生成式人工智能是一個(gè)完全不同于移動(dòng)互聯(lián)網(wǎng)時(shí)代的物種。相較于移動(dòng)互聯(lián)網(wǎng)時(shí)期,京東的探索要更前置,更貼合業(yè)務(wù),更不能回避競(jìng)爭(zhēng)。
事實(shí)上,此次大模型之爭(zhēng),大公司競(jìng)爭(zhēng)的中心點(diǎn)不在資本、地推或者補(bǔ)貼策略,而是各自的研究院或者實(shí)驗(yàn)室以及落地場(chǎng)景。
不管是京東還是阿里巴巴、騰訊,他們都有自己的研究院或者人工智能實(shí)驗(yàn)室,比如2017年成立的阿里達(dá)摩院,2012年成立的騰訊優(yōu)圖實(shí)驗(yàn)室,2014年成立的百度研究院,2017年成立的京東人工智能研究院和2020年成立的京東探索研究院。
當(dāng)前技術(shù)大咖們走到了價(jià)值創(chuàng)造階段,他們需要驗(yàn)證,大公司投入的數(shù)十億元甚至數(shù)百億資金不是泡影。
騰訊成立了專(zhuān)門(mén)的技術(shù)委員會(huì)協(xié)調(diào)各大實(shí)驗(yàn)室。騰訊對(duì)于研發(fā)的態(tài)度是,不會(huì)取消所有冒險(xiǎn)研究,始終會(huì)保留一支小分隊(duì)探索前沿,留下火種。
何曉冬說(shuō),他給了京東探索研究院三個(gè)任務(wù),第一,要在重要的競(jìng)爭(zhēng)激烈的領(lǐng)域做到前沿,不回避競(jìng)爭(zhēng),愿意挑戰(zhàn)和競(jìng)爭(zhēng);第二,對(duì)重要業(yè)務(wù)和產(chǎn)品要形成支撐,對(duì)公司有價(jià)值;第三,要有足夠的前瞻性。
創(chuàng)始人與一號(hào)項(xiàng)目
從2月高舉大旗到6月病退,王慧文的軌跡似乎預(yù)示著此次大模型創(chuàng)業(yè)熱暫告一段落,他創(chuàng)立的光年之外最終被美團(tuán)收購(gòu)。坐到牌桌上的,只剩下大公司。
巨頭公司爭(zhēng)斗往往表面悄無(wú)聲息,但碰撞在一起的剎那,所產(chǎn)生的能量也是驚人的,甚至?xí)品硞€(gè)旁觀者, BAT時(shí)代曾發(fā)生的邊界大戰(zhàn),就如同今日的一個(gè)序章。
外部環(huán)境急劇變化,既有宏觀層面的挑戰(zhàn),也有AI浪潮的興起,這些正在讓大公司的CEO或者創(chuàng)始人重回一線。
張勇將于今年9月卸任阿里巴巴集團(tuán)董事會(huì)主席兼CEO職務(wù),專(zhuān)職擔(dān)任阿里云智能集團(tuán)董事長(zhǎng)兼CEO,他希望在那里再造一個(gè)阿里巴巴。李彥宏、周鴻祎等紛紛出場(chǎng),為自家大模型產(chǎn)品代言和推介。
京東集團(tuán)新任CEO許冉說(shuō):“當(dāng)產(chǎn)業(yè)效率和產(chǎn)業(yè)的邊界拓展得到質(zhì)的提升后,大模型才有更重要的實(shí)際價(jià)值和意義,將不亞于又一次工業(yè)革命?!痹诖饲罢匍_(kāi)的2023京東全球科技探索者大會(huì)上,她提出了京東對(duì)于大模型價(jià)值的公式,大模型的價(jià)值=算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方。
創(chuàng)始人與CEO的關(guān)注,既能讓項(xiàng)目在公司內(nèi)部獲得大量資源支持,但也會(huì)帶來(lái)壓力,那就是盡快產(chǎn)生營(yíng)收、利潤(rùn)回報(bào)。
何曉冬坦言,京東言犀大模型的當(dāng)下還是一個(gè)成本中心,但集團(tuán)對(duì)大模型項(xiàng)目還沒(méi)有盈利要求;具體到自己負(fù)責(zé)的智能服務(wù)板塊,則已經(jīng)實(shí)現(xiàn)了盈利,這也是大模型產(chǎn)業(yè)化應(yīng)用價(jià)值的縮影。
如果說(shuō),AI是一條河,那么各家公司的產(chǎn)品方案有的是架橋,有的是鋪路,有的是造船,各有不同。誰(shuí)最終越過(guò)科學(xué)研究到實(shí)際產(chǎn)品轉(zhuǎn)化鴻溝的這片“達(dá)爾文之?!?#xff0c;只能留給時(shí)間來(lái)驗(yàn)證。
相關(guān)稿件