場(chǎng)景應(yīng)用解決方案
IT運(yùn)維應(yīng)急演練平臺(tái)
IT運(yùn)維應(yīng)急演練平臺(tái)
1.平臺(tái)背景及介紹
隨著業(yè)務(wù)系統(tǒng)引入新技術(shù),包括大量開源軟件的引入,導(dǎo)致系統(tǒng)復(fù)雜性不斷增加,系統(tǒng)故障發(fā)生很難避免;企業(yè)對(duì)軟件開發(fā)敏捷、迭代升級(jí)的需求日趨增加,對(duì)基礎(chǔ)設(shè)施的穩(wěn)定性要求越來越高,以往的災(zāi)備方式已經(jīng)跟不上速度;傳統(tǒng)的應(yīng)急演練方式,場(chǎng)景單一、形式固化、效率低下、溝通成本高,無(wú)法覆蓋更多的故障場(chǎng)景和積累更多的故障應(yīng)對(duì)經(jīng)驗(yàn)。
IT運(yùn)維應(yīng)急演練平臺(tái)通過主動(dòng)注入故障,提前發(fā)現(xiàn)潛在問題,不斷演練和復(fù)盤、迭代改進(jìn)和升級(jí),提前找到系統(tǒng)缺陷、盡可能多識(shí)別風(fēng)險(xiǎn),防止其演變成重大故障,從而提高系統(tǒng)在生產(chǎn)環(huán)境的彈性能力和韌性。
滿足潛在領(lǐng)導(dǎo)的業(yè)績(jī)需求
1) 完成信創(chuàng)指標(biāo),代碼自主可控,全面兼容適配 x86/arm 國(guó)產(chǎn)化操作系統(tǒng)平臺(tái),國(guó)產(chǎn)化數(shù)據(jù)庫(kù) CMDB
2) 幫助用戶取得信通院官方認(rèn)證/相關(guān)知識(shí)產(chǎn)權(quán)(軟著/專利)
滿足潛在使用方的業(yè)務(wù)需求
1) 提升業(yè)務(wù)連續(xù)性保障能力(IaaS/PaaS/SaaS 全棧故障注入能力)
2) 提升運(yùn)維團(tuán)隊(duì)能力(通過紅藍(lán)對(duì)抗,督導(dǎo)任務(wù)管理,橫向縱向?qū)Ρ龋菥毶潮P可視化等豐富功能實(shí)現(xiàn))
2.平臺(tái)亮點(diǎn)
IT運(yùn)維應(yīng)急演練平臺(tái)完成多種異構(gòu)數(shù)據(jù)庫(kù)適配和ARM國(guó)產(chǎn)化操作系統(tǒng)適配,開創(chuàng)私有故障編排能力,具有豐富的多樣化故障演練場(chǎng)景,建設(shè)完成個(gè)性化故障能力市場(chǎng),同時(shí)具備多租戶權(quán)限管理及演練時(shí)間軸,可擴(kuò)展性支持等亮點(diǎn)能力。
3.平臺(tái)優(yōu)勢(shì)
故障演練場(chǎng)景多樣化
自動(dòng)化演練平臺(tái),豐富多樣和持續(xù)拓展的故障演練場(chǎng)景庫(kù),包括了各種場(chǎng)景:常見的基礎(chǔ)設(shè)施資源場(chǎng)景,應(yīng)用級(jí)別的故障注入式場(chǎng)景,云原生領(lǐng)域的演練場(chǎng)景。
數(shù)據(jù)支持賦能管理
數(shù)據(jù)賦能運(yùn)維團(tuán)隊(duì)能力,深入挖掘復(fù)雜系統(tǒng)潛在風(fēng)險(xiǎn),持續(xù)提升系統(tǒng)、資源、人員等各方面保障能力,
可管、可控、可視化、可考核、可提升。
混沌能力市場(chǎng)
打造共享、共贏的場(chǎng)景庫(kù)生態(tài), 積累專家實(shí)踐經(jīng)驗(yàn),聚合專業(yè)服務(wù), 并可量化貢獻(xiàn);
提供上傳及下載服務(wù),后臺(tái)審核與驗(yàn)證, 提供專業(yè)可靠安全保障。
自定義腳本能力
提供支持自定義腳本底層故障注入的實(shí)現(xiàn)支持;提供完善故障注入的能力和效率。主機(jī)層/云原生層環(huán)境跨棧(跨架構(gòu))感知, 構(gòu)建服務(wù)間調(diào)用鏈,實(shí)時(shí)顯示服務(wù)間連接狀態(tài),對(duì)攻擊中的故障注入點(diǎn)和故障是否排除實(shí)時(shí)動(dòng)態(tài)可視化展示。
領(lǐng)先雙引擎驅(qū)動(dòng)(chaos blade/chaos mesh)
chaos blade/chaos mesh將故障演練的環(huán)節(jié)分為多個(gè)節(jié)點(diǎn),用戶可以根據(jù)需要添加自己的流程節(jié)點(diǎn)。
同時(shí),靈活的流程編排支持一次演練包含多個(gè)場(chǎng)景,通過不同的策略配置來達(dá)到不同的故障注入效果。
實(shí)驗(yàn)直播監(jiān)看,全局演練沙盤
運(yùn)維人員保障工作量化,并提供可視化直播與回放實(shí)時(shí)記錄,運(yùn)維人員的操作可細(xì)粒度操作記錄。
可擴(kuò)展性支持
以插件方式提供支撐服務(wù), 實(shí)現(xiàn)更多更好得擴(kuò)展性;結(jié)合多方插件, 實(shí)現(xiàn)更多的實(shí)驗(yàn)場(chǎng)景覆蓋。
4. 應(yīng)用場(chǎng)景
快速構(gòu)建模擬演練場(chǎng)景
通過提供從基礎(chǔ)創(chuàng)建到中間件、到微服務(wù)層完善的故障注入能力,以及運(yùn)維專家經(jīng)驗(yàn)積累的故障場(chǎng)景庫(kù),IT運(yùn)維應(yīng)急演練平臺(tái)能夠幫助客戶快速?gòu)?到1建設(shè)起高可用的模擬演練場(chǎng)景。
5.平臺(tái)價(jià)值
(1)容災(zāi)架構(gòu)驗(yàn)證,主備切換、負(fù)載均衡、流量調(diào)度等;
(2)預(yù)案有效性,驗(yàn)證故障發(fā)現(xiàn)和故障恢恢復(fù)的有效性;
(3)監(jiān)控報(bào)警,驗(yàn)證監(jiān)控告警的有效性和整理無(wú)效告警;
(4)服務(wù)依賴治理、治理不合理依賴(強(qiáng)弱依賴、循環(huán)依賴),消除非必要依賴,減少?gòu)?qiáng)依賴;
(5)故障復(fù)現(xiàn)和改進(jìn)方案驗(yàn)收,閉環(huán)曾經(jīng)發(fā)生的故障整改后的效果;
(6)故障檢測(cè)、預(yù)測(cè)、定位和自愈模型訓(xùn)練;
(7)故障突襲、聯(lián)合演練,錘煉團(tuán)隊(duì)面對(duì)故障的應(yīng)急能力,提升DevOps能力;
(8)云原生,部署&編排合理性;
(9)提前避障,系統(tǒng)上線前高可用性驗(yàn)證,避免投入人力、物力處理故障。
科迅華通始終堅(jiān)持誠(chéng)信 敬業(yè) 熱情 卓越的價(jià)值觀,堅(jiān)持客戶至上服務(wù)第一的服務(wù)理念,致力于成為中國(guó)IT業(yè)界的綜合解決方案提供商!