隨著大數(shù)據(jù)在醫(yī)療與生命科學(xué)研究過(guò)程中的廣泛應(yīng)用和不斷擴(kuò)展,其數(shù)量之大和種類(lèi)之多令人難以置信。比如:一個(gè)CT圖像含有大約150MB的數(shù)據(jù),而一個(gè)基因組序列文件大小約為750MB, 一個(gè)標(biāo)準(zhǔn)的病理圖則大得多,接近5 GB。如果將這些數(shù)據(jù)量乘以人口數(shù)量和平均壽命,僅一個(gè)社區(qū)醫(yī)院或一個(gè)中等規(guī)模制藥企業(yè)就可以生成和累積達(dá)數(shù)個(gè)TB甚至數(shù)個(gè)PB級(jí)的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。
在中國(guó),2010年,國(guó)家公布的“十二五”規(guī)劃中指出要重點(diǎn)建設(shè)、省級(jí)和地市級(jí)三級(jí)衛(wèi)生信息平臺(tái),建設(shè)電子檔案和電子病歷兩個(gè)基礎(chǔ)數(shù)據(jù)庫(kù)等諸項(xiàng)目標(biāo),也就是推進(jìn)醫(yī)療信息化的“3521”工程。過(guò)去由于缺少統(tǒng)一的電子病歷系統(tǒng)(EMR)標(biāo)準(zhǔn),中國(guó)的電子病歷系統(tǒng)發(fā)展比較緩慢,醫(yī)院之間不能實(shí)現(xiàn)共享病患信息共享,醫(yī)療服務(wù)水平也因此受到影響。為改善這一現(xiàn)狀,國(guó)家會(huì)逐漸加大對(duì)電子病歷的投入,適應(yīng)這一趨勢(shì),各級(jí)醫(yī)院也將加大在數(shù)據(jù)中心,IT外包等領(lǐng)域的投入。而隨著醫(yī)療信息數(shù)據(jù)的幾何倍數(shù)增長(zhǎng),醫(yī)院信息存儲(chǔ)將越來(lái)越受到重視,醫(yī)療信息中心的關(guān)注點(diǎn)也將由傳統(tǒng)“計(jì)算”領(lǐng)域轉(zhuǎn)移到“存儲(chǔ)”領(lǐng)域上來(lái)。
有“弊”就有“利”
對(duì)于許多醫(yī)療和生命科學(xué)機(jī)構(gòu)而言,努力控制大數(shù)據(jù)造成的呈螺旋上漲的成本、復(fù)雜性和風(fēng)險(xiǎn)已經(jīng)成為一個(gè)至關(guān)重要的問(wèn)題。然而,從另一個(gè)角度來(lái)看,醫(yī)療大數(shù)據(jù)能夠帶來(lái)的收益要遠(yuǎn)遠(yuǎn)超出管理它們的成本,如開(kāi)放新的具有醫(yī)療價(jià)值的信息源、提高診斷準(zhǔn)確性和速度、預(yù)測(cè)疾病和健康形態(tài),以及取得生命科學(xué)創(chuàng)新的不同見(jiàn)解。美國(guó)管理咨詢公司麥肯錫全球研究院(MGI)預(yù)測(cè),如果美國(guó)的醫(yī)療行業(yè)能夠有效利用不斷增長(zhǎng)的大數(shù)據(jù)來(lái)提高效率和質(zhì)量,那么每年可創(chuàng)造超過(guò)3000億美元的額外價(jià)值。而且,在歐洲的發(fā)達(dá)國(guó)家中,僅在提高運(yùn)行效率一項(xiàng)上,政府行政管理部門(mén)就可以利用大數(shù)據(jù)節(jié)省1000億歐元以上的費(fèi)用。
對(duì)于大多數(shù)成功的醫(yī)療機(jī)構(gòu)來(lái)說(shuō),利用大數(shù)據(jù)已經(jīng)成為提高生產(chǎn)力、改進(jìn)護(hù)理水平、增強(qiáng)競(jìng)爭(zhēng)力、加快增長(zhǎng)和創(chuàng)新的關(guān)鍵策略。那么,我們?cè)撊绾卧趦煞矫孢M(jìn)行平衡,實(shí)現(xiàn)可觀的效果和利潤(rùn)呢?
答案存在于數(shù)據(jù)經(jīng)濟(jì)學(xué)中,即如何使從數(shù)據(jù)中獲取價(jià)值的成本低于數(shù)據(jù)能產(chǎn)生的效益?如果我們能夠有效地將數(shù)據(jù)存儲(chǔ)、處理和保護(hù)成本降至低,然后利用技術(shù)將數(shù)據(jù)轉(zhuǎn)化成支持臨床需要與業(yè)務(wù)增長(zhǎng)的可執(zhí)行信息,我們就能實(shí)現(xiàn)高的數(shù)據(jù)經(jīng)濟(jì)效益。
醫(yī)療大數(shù)據(jù)的挑戰(zhàn)
然而,如何有效地將大數(shù)據(jù)存儲(chǔ)成本降至低,是企業(yè)和IT,尤其是內(nèi)容驅(qū)動(dòng)的醫(yī)療和生命科學(xué)企業(yè)面臨的根本性挑戰(zhàn)。因?yàn)槌藬?shù)據(jù)數(shù)量和形態(tài)的迅速增加,醫(yī)療數(shù)據(jù)還需要越來(lái)越長(zhǎng)的保留期?;颊叩牟v可能需要保存70或80年,甚至更長(zhǎng)。許多情況下,病歷還必須以原始格式保存,以滿足法規(guī)遵從的要求。同樣,生命科學(xué)研究機(jī)構(gòu)有選擇性的選擇價(jià)值足以保留和維護(hù)數(shù)十年的數(shù)據(jù),以期為新研究提供依據(jù)。
另外,許多醫(yī)療與生命科學(xué)研究機(jī)構(gòu)在竭力應(yīng)對(duì)資源緊張、持續(xù)的業(yè)務(wù)增長(zhǎng)和新醫(yī)療技術(shù)帶來(lái)的挑戰(zhàn)。事實(shí)上,存儲(chǔ)消費(fèi)速度加快,存儲(chǔ)資產(chǎn)未得到充分利用,對(duì)空間的持續(xù)需求以及動(dòng)力和冷卻成本的增加,都推動(dòng)了總體擁有成本的不斷攀升。而且,一旦存儲(chǔ)系統(tǒng)的安全性出現(xiàn)問(wèn)題,導(dǎo)致醫(yī)療數(shù)據(jù)丟失,醫(yī)院會(huì)面臨更嚴(yán)重的局面。對(duì)于研究機(jī)構(gòu)來(lái)說(shuō),數(shù)據(jù)存取是創(chuàng)新和競(jìng)爭(zhēng)力的核心。這樣看來(lái),文件數(shù)據(jù)不斷增長(zhǎng)導(dǎo)致的管理成本提升被認(rèn)為是當(dāng)今全球5000強(qiáng)公司面臨的五大難題之一,這種結(jié)論就不足為奇了。
醫(yī)療行業(yè)應(yīng)對(duì)大數(shù)據(jù)的理想基礎(chǔ)架構(gòu)
要實(shí)現(xiàn)高數(shù)據(jù)經(jīng)濟(jì)效益,關(guān)鍵是能夠?qū)ΠńY(jié)構(gòu)性數(shù)據(jù)和非結(jié)構(gòu)性數(shù)據(jù)在內(nèi)的所有醫(yī)療大數(shù)據(jù)進(jìn)行集成,實(shí)現(xiàn)集中管理和更好的資源配置。為了整合醫(yī)院不同部門(mén)或不同生命科學(xué)系統(tǒng)的大數(shù)據(jù),實(shí)現(xiàn)充分的信息搜索和共享,理想的存儲(chǔ)架構(gòu)必須是一個(gè)適用塊數(shù)據(jù)、文件和內(nèi)容的集成系統(tǒng),并且擁有強(qiáng)大的容量、性能和吞吐量,在處理、移動(dòng)和訪問(wèn)多個(gè)大型數(shù)據(jù)集和大量數(shù)據(jù)(數(shù)量常常達(dá)到數(shù)個(gè)TB甚至是PB)時(shí)能夠保持運(yùn)行的一致性。為了盡量降低存儲(chǔ)成本并滿足臨床業(yè)務(wù)需要,理想的存儲(chǔ)架構(gòu)還必須支持臨床創(chuàng)新的數(shù)據(jù)互操作性,必須能夠智能分層,根據(jù)訪問(wèn)頻率、臨床價(jià)值和實(shí)際存儲(chǔ)成本自動(dòng)完成數(shù)據(jù)分布。這種動(dòng)態(tài)分層功能有助于進(jìn)一步提高容量利用和資源配置水平,從而全面優(yōu)化存儲(chǔ)資源的成本效率。