中國(guó)經(jīng)濟(jì)網(wǎng)北京10月18日訊(記者 李方) 文心大模型4.0昨日在百度世界2023上正式發(fā)布,百度首席技術(shù)官王海峰對(duì)文心大模型4.0背后的關(guān)鍵技術(shù)和最新進(jìn)展進(jìn)行了解讀。他表示,文心大模型4.0的理解、生成、邏輯、記憶四大能力都有顯著提升,9月已開(kāi)始小流量上線,過(guò)去一個(gè)多月效果又提升了近30%。8月31日文心一言面向全社會(huì)開(kāi)放至今,用戶規(guī)模已經(jīng)達(dá)到4500萬(wàn),開(kāi)發(fā)者5.4萬(wàn),場(chǎng)景4300個(gè),應(yīng)用825個(gè),插件超過(guò)500個(gè)。
今年3月16日,百度發(fā)布知識(shí)增強(qiáng)大語(yǔ)言模型文心一言。文心一言從數(shù)萬(wàn)億數(shù)據(jù)和數(shù)千億知識(shí)中融合學(xué)習(xí),得到預(yù)訓(xùn)練大模型,在此基礎(chǔ)上采用有監(jiān)督精調(diào)、人類反饋強(qiáng)化學(xué)習(xí)、提示等技術(shù),具備知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)的技術(shù)優(yōu)勢(shì)。
王海峰表示,相比3.5版本,文心大模型4.0的理解、生成、邏輯、記憶四大能力都有顯著提升。其中理解和生成能力的提升幅度相近,而邏輯和記憶能力的提升則更大,邏輯的提升幅度達(dá)到理解的近3倍,記憶的提升幅度也達(dá)到了理解的2倍多。
此外,文心大模型4.0在輸入和輸出階段都進(jìn)行知識(shí)點(diǎn)增強(qiáng)。一方面,對(duì)用戶輸入的問(wèn)題進(jìn)行理解,并拆解出回答問(wèn)題所需的知識(shí)點(diǎn),然后在搜索引擎、知識(shí)圖譜、數(shù)據(jù)庫(kù)中查找準(zhǔn)確知識(shí),最后把這些找到的知識(shí)組裝進(jìn)Prompt送入大模型,準(zhǔn)確率好,效率也高;另一方面,對(duì)大模型的輸出進(jìn)行反思,從生成結(jié)果中拆解出知識(shí)點(diǎn),然后再利用搜索引擎、知識(shí)圖譜、數(shù)據(jù)庫(kù),以及大模型本身進(jìn)行確認(rèn),進(jìn)而對(duì)有差錯(cuò)的點(diǎn)進(jìn)行修正。
王海峰表示,在強(qiáng)大的基礎(chǔ)大模型的基礎(chǔ)上,百度進(jìn)一步研制了智能體機(jī)制,包括理解、規(guī)劃、反思和進(jìn)化,能夠做到可靠執(zhí)行、自我進(jìn)化,并一定程度上將思考過(guò)程白盒化,讓機(jī)器像人一樣思考和行動(dòng),自主完成復(fù)雜任務(wù),在環(huán)境中持續(xù)學(xué)習(xí)實(shí)現(xiàn)自主進(jìn)化。
目前,文心一言也已應(yīng)用在了更實(shí)用的地方。中國(guó)國(guó)家圖書(shū)館擁有全球最大的古代方志,百度與其展開(kāi)戰(zhàn)略合作,利用文心大模型學(xué)習(xí)古代方志與家譜數(shù)據(jù),幫助全球華人獲取更多尋根線索。此外,中國(guó)國(guó)家跳水隊(duì)與百度從2019年就開(kāi)展了深入的技術(shù)合作,基于文心一言等百度大模型技術(shù),中國(guó)國(guó)家跳水隊(duì)AI輔助訓(xùn)練系統(tǒng)全面升級(jí),對(duì)動(dòng)作實(shí)時(shí)打分、精準(zhǔn)量化分析,提供最有價(jià)值的指導(dǎo)信息,助力中國(guó)國(guó)家跳水隊(duì)高效訓(xùn)練。
在人工智能人才培養(yǎng)方面,王海峰公布,百度在2020年提出5年為全社會(huì)培養(yǎng)500萬(wàn)AI人才,截至目前,百度已經(jīng)培養(yǎng)了420萬(wàn)AI人才。
17日,王海峰發(fā)布了百度人才培養(yǎng)星河計(jì)劃,“我們將與產(chǎn)學(xué)研各界密切合作,深化產(chǎn)教融合,為社會(huì)再培養(yǎng)500萬(wàn)大模型人才,讓人工智能科技的‘創(chuàng)新之花’,結(jié)出更多‘產(chǎn)業(yè)之果’,服務(wù)國(guó)家戰(zhàn)略,服務(wù)社會(huì)發(fā)展,服務(wù)人民福祉?!?/p>
相關(guān)稿件