2022年7月,統(tǒng)信軟件在繼承自由開放的開源精神基礎(chǔ)之上,結(jié)合當(dāng)前操作系統(tǒng)軟硬件產(chǎn)業(yè)鏈的現(xiàn)狀,首次提出了「分層分類」的開源技術(shù)路線。
時(shí)隔一年,統(tǒng)信軟件自研的分層分類算法取得初步成果,并已應(yīng)用于統(tǒng)信UOS服務(wù)器版和統(tǒng)信UOS云原生版等多個(gè)產(chǎn)品。
「分層分類」新思路,使得大家能摒棄細(xì)節(jié),把握大局與關(guān)注核心問題,也能凝聚共識(shí),為下一代操作系統(tǒng)的開發(fā)奠定堅(jiān)實(shí)的理論與技術(shù)基礎(chǔ)。
第一? 統(tǒng)信UOS的分層分類方案
「分層分類」體系架構(gòu)的核心思想是“垂直分層、水平分類、數(shù)據(jù)驅(qū)動(dòng)、算法先行”。
在IT領(lǐng)域中,將軟件包的關(guān)系結(jié)構(gòu)化,可以有效“加速”系統(tǒng)構(gòu)建和維護(hù)。
例如,可以由軟件包的構(gòu)成和位置確定其承上啟下的作用,從而判斷更換軟件包的代價(jià),進(jìn)而為業(yè)務(wù)場(chǎng)景和生產(chǎn)環(huán)境的平滑遷移與升級(jí)提供有力的依據(jù)。
分層方案
根據(jù)軟件包依賴關(guān)系進(jìn)行層級(jí)劃分,每層定義了各自的功能范圍,并向上層提供相應(yīng)的接口:
內(nèi)核層:包含操作系統(tǒng)內(nèi)核和驅(qū)動(dòng)程序,向下屏蔽了硬件差異。
核心層:對(duì)操作系統(tǒng)啟動(dòng)運(yùn)行和使用起關(guān)鍵作用的核心軟件。
系統(tǒng)層:擴(kuò)展內(nèi)核層、核心層功能服務(wù),為客戶和應(yīng)用提供數(shù)據(jù)和服務(wù)的軟件。
應(yīng)用層:供客戶和應(yīng)用使用的各類通用軟件(與各類應(yīng)用場(chǎng)景有交集)。
分類方案
分三個(gè)維度,即形態(tài)、功能和場(chǎng)景:
形態(tài):根據(jù)軟件包中的文件及其描述信息,將其分為庫、工具和服務(wù)。
功能:主要根據(jù)軟件包的描述信息,挖掘出其中的功能。
場(chǎng)景:以用戶的實(shí)際使用場(chǎng)景為依據(jù),并根據(jù)這些場(chǎng)景的典型應(yīng)用及其依賴關(guān)系,進(jìn)行歸并。
第二? 千挑萬選的BERT模型
首次提出「分層分類」技術(shù)路線后,我們做過很多嘗試:將軟件包的依賴關(guān)系組成圖后,對(duì)圖進(jìn)行切割或矢量錨點(diǎn)定位;使用NLP算法的BERT模型,根據(jù)軟件包依賴關(guān)系進(jìn)行分割……
最終,我們選擇了BERT模型方案。
BERT模型是由Google提出的自編碼語言模型,思想是計(jì)算出每個(gè)句子中每個(gè)token與其他token的關(guān)系向量,然后對(duì)關(guān)系向量進(jìn)行正則化,最終得到分類概率。
第三? 統(tǒng)信UOS的分層與分類算法
分層算法是根據(jù)軟件包的描述信息及其上下依賴關(guān)系的描述信息進(jìn)行分層。
上下依賴關(guān)系分為上層依賴和下層依賴,上層依賴即其他軟件包依賴該軟件包,下層依賴即該軟件包依賴其他軟件包。
分類算法,則是根據(jù)軟件包的描述信息進(jìn)行分類。
統(tǒng)信UOS服務(wù)器版汲取國(guó)內(nèi)外主流社區(qū)技術(shù)棧優(yōu)勢(shì),融入「分層分類」的理論和實(shí)踐優(yōu)勢(shì),深入技術(shù)底層結(jié)合國(guó)內(nèi)外設(shè)計(jì)標(biāo)準(zhǔn)與規(guī)范以及各類用戶業(yè)務(wù)應(yīng)用需求,積極開展技術(shù)創(chuàng)新,全面支持國(guó)內(nèi)外主流CPU架構(gòu)和處理器廠商,在各種應(yīng)用環(huán)境中,滿足強(qiáng)安全、高穩(wěn)定、高性能、易維護(hù)以及泛兼容等要求,是一款構(gòu)建信息化設(shè)施環(huán)境的基礎(chǔ)軟件產(chǎn)品:
強(qiáng)安全:
等保四級(jí)GB/T20272-2019認(rèn)證
商密二級(jí)GM/T0028認(rèn)證
全棧生態(tài)鏈支持國(guó)密
國(guó)際知名安全社區(qū)OpenSCAP官方首批支持的中國(guó)操作系統(tǒng)
21天推送一次補(bǔ)丁更新,每周進(jìn)行漏洞修復(fù)推送
高穩(wěn)定:
穩(wěn)定版Linux4.19&5.10雙內(nèi)核
熱補(bǔ)丁升級(jí)機(jī)制
LTP7*24小時(shí)測(cè)試用例通過率超98%
長(zhǎng)時(shí)高負(fù)荷運(yùn)行,卸荷后60秒內(nèi)實(shí)現(xiàn)系統(tǒng)及各應(yīng)用流暢運(yùn)行
高性能:
內(nèi)存拷貝頁技術(shù),拷貝性能提升超70%,滿并發(fā)優(yōu)化提升10%
多種自研性能優(yōu)化成果:文件讀寫性能提升4%、調(diào)度延遲減少10%、多并發(fā)鎖競(jìng)爭(zhēng)場(chǎng)景性能提升5%……
相比同類產(chǎn)品,UnixBench等測(cè)試全面領(lǐng)先
易維護(hù):
提供自研統(tǒng)信有易服務(wù)器遷移軟件
提供自研統(tǒng)信有幄自動(dòng)化運(yùn)維工具
提供面向場(chǎng)景的AI系統(tǒng)調(diào)優(yōu)能力
泛兼容:
歷史版本兼容性>98%,提供平滑升級(jí)方案
組件模塊化設(shè)計(jì),為用戶最大限度解決底層依賴問題
全面通過整機(jī)適配兼容性測(cè)試(多種不同型號(hào)的整機(jī))
統(tǒng)信軟件服務(wù)器操作系統(tǒng)與云計(jì)算產(chǎn)線總經(jīng)理孟杰表示,統(tǒng)信UOS的分層分類研究成果已廣泛應(yīng)用于多產(chǎn)品、多領(lǐng)域,可以更好地協(xié)調(diào)產(chǎn)業(yè)/團(tuán)隊(duì)分工、明確研發(fā)方向、維護(hù)關(guān)鍵軟件、共建共享共治開源新生態(tài)。未來,我們將繼續(xù)深耕技術(shù)方案和架構(gòu),助力中國(guó)開源操作系統(tǒng)角逐世界舞臺(tái)。
相關(guān)稿件