對(duì)于金融而言,宕機(jī)意味金錢損失。據(jù)Qualix Group統(tǒng)計(jì),銀行宕機(jī)一分鐘的代價(jià)是27萬(wàn)美元,通信運(yùn)營(yíng)商損失35萬(wàn)美元,證券業(yè)損失45萬(wàn)美元,制造業(yè)損失是42萬(wàn)美元,應(yīng)該說(shuō),這些損失驚人。但與之相比,醫(yī)療行業(yè)人命關(guān)天,其損失是不能夠用錢來(lái)衡量的。
在2009年國(guó)家《關(guān)于深化醫(yī)藥衛(wèi)生體制改革的意見》,各級(jí)政府預(yù)計(jì)投入8500億元用于醫(yī)保、基本藥物、基層醫(yī)療服務(wù)體系、公共服務(wù)均等化、公立醫(yī)院改革共五項(xiàng)醫(yī)改重點(diǎn)。在新一輪的醫(yī)療改革浪潮中,醫(yī)療系統(tǒng)信息化將成為創(chuàng)新制度的利器。
與金融、電信等信息化領(lǐng)先行業(yè)相比,醫(yī)療行業(yè)信息化在專業(yè)技術(shù)人員規(guī)模、信息化程度以及投資規(guī)模上都存在著比較大的差距。但是對(duì)于信息系統(tǒng)的高可靠性的要求,醫(yī)療行業(yè)不僅不低,甚至對(duì)可靠性的要求更高。筆者就有過(guò)這樣的經(jīng)歷,在XX醫(yī)院,為出生不僅嬰兒化驗(yàn)黃疸,等待采血;但遲遲沒(méi)有辦法進(jìn)行,原因在于診室打印機(jī)不打印了,需要等待技術(shù)人員維護(hù)?;?yàn)原本與打印機(jī)沒(méi)有直接關(guān)系,但是打印單據(jù)出不來(lái),后續(xù)步驟無(wú)法進(jìn)行,醫(yī)護(hù)人員、患者都不得不等待。如果說(shuō)這樣的影響還是局部的,對(duì)于承擔(dān)核心業(yè)務(wù)的服務(wù)器而言,如果宕機(jī),所影響的就是整個(gè)醫(yī)院。如果掛號(hào)、計(jì)費(fèi)無(wú)法進(jìn)行,所關(guān)乎的可是人命關(guān)天的大事情。
為提升醫(yī)療系統(tǒng)可靠性,很多醫(yī)院采用了雙機(jī)冗余方案。表面上看,雙機(jī)解決了可靠性不高的問(wèn)題。用上面例子看,如果該診室,擁有一臺(tái)備用的打印機(jī),問(wèn)題也就解決了。實(shí)際上,問(wèn)題沒(méi)有這么簡(jiǎn)單。對(duì)于醫(yī)護(hù)人員來(lái)說(shuō),既是醫(yī)護(hù)人員知道如何更換打印機(jī),更換也是需要時(shí)間的。類似的,在服務(wù)器雙機(jī)方案中進(jìn)行切換也是需要時(shí)間的,而且更為重要的是,雙機(jī)切換的成功率并不高,一旦切換失敗,恢復(fù)系統(tǒng)就成為了一個(gè)難以量化的事情,運(yùn)氣好可以在10分鐘,半個(gè)小時(shí)內(nèi)恢復(fù),運(yùn)氣不好,花費(fèi)1天時(shí)間也有可能,甚至更長(zhǎng)。
雙機(jī)系統(tǒng)切換成功率不高,對(duì)此,信息技術(shù)人員心知肚明,雖有雙機(jī)保護(hù),但沒(méi)人敢貿(mào)然拔掉“心跳線”(備機(jī)判別主機(jī)故障的一種方式),因?yàn)閭溆脵C(jī)很有可能起不來(lái)。既然如此,醫(yī)療行業(yè)為什么仍然采用雙機(jī)方案,一來(lái)是約定俗成,二來(lái)的確比單機(jī)有更高的可靠性。與雙機(jī)方案相比,容錯(cuò)服務(wù)器方案具有更高的可靠性。
從技術(shù)上原理看,雙機(jī)只能夠保護(hù)數(shù)據(jù),并不夠保持業(yè)務(wù)處理不中斷,因?yàn)閮?nèi)存、I/O緩存中的數(shù)據(jù)沒(méi)有實(shí)施保護(hù),突遇故障時(shí),這些數(shù)據(jù)就會(huì)丟失。備用機(jī)需要重建業(yè)務(wù)流程,期間就會(huì)產(chǎn)生業(yè)務(wù)中斷。與之相比,容錯(cuò)方案不僅對(duì)處理器、磁盤進(jìn)行保護(hù),對(duì)內(nèi)存、I/O都提供了實(shí)時(shí)保護(hù),容錯(cuò)方案中,所有處理和步驟,全部按照時(shí)鐘周期同步。當(dāng)故障發(fā)生時(shí),系統(tǒng)失去同步,進(jìn)入單機(jī)工作狀態(tài),雖然可靠性有所降低,但業(yè)務(wù)并不會(huì)中斷。待故障部件更換之后,系統(tǒng)自動(dòng)恢復(fù)容錯(cuò)狀態(tài)。由于故障部件更換支持熱插拔,因此不會(huì)對(duì)于業(yè)務(wù)產(chǎn)生任何影響。容錯(cuò)方案是當(dāng)之無(wú)愧的高可靠性方案。
容錯(cuò)系統(tǒng)在金融證券行業(yè)普遍采用,但其他行業(yè)使用較少的一個(gè)重要原因是價(jià)格,容錯(cuò)系統(tǒng)價(jià)格比較高。但隨著x86處理器采用,容錯(cuò)系統(tǒng)價(jià)格的高門檻已經(jīng)被打破,這就為其他需要高可靠性的行業(yè)應(yīng)用創(chuàng)造了條件。對(duì)于行業(yè)來(lái)說(shuō),了解容錯(cuò)方案技術(shù),沖破固有觀念,就變得非常重要且迫切。對(duì)于醫(yī)療行業(yè)而言,容錯(cuò)方案其信息化的佳選擇。