云計算正在成為生物醫(yī)學(xué)界的“寵兒”。——8月14日,北京貝瑞和康生物技術(shù)有限公司與阿里云共同向外界宣布雙方達成合作,共同打造以海量的中國人群基因組數(shù)據(jù)為核心的數(shù)據(jù)云,實現(xiàn)對個人基因組數(shù)據(jù)的解讀。
此次,雙方共同合作的“神州基因組數(shù)據(jù)云項目”將首先聚焦于基因組大數(shù)據(jù)在云平臺上的批量計算、分析、存儲,進而在基因大數(shù)據(jù)領(lǐng)域共同進行前沿探索。
“打造基因組大數(shù)據(jù),相當(dāng)于建立了一個中國人基因版的《本草綱目》,將記載中國人群核心的基因信息、生命信息,為中國人群重大疾病的預(yù)測、預(yù)防、診斷和治療奠定基礎(chǔ)。它的意義將不亞于《本草綱目》這部東方醫(yī)藥巨典。”貝瑞和康首席生物信息官于福利博士說。
中國是世界出生缺陷率高發(fā)地區(qū)之一。每年1600萬至2000萬的出生人口中,有80萬至120萬出生缺陷兒。1996年到2010年,中國新生兒出生缺陷發(fā)生率增幅達70.9%,每一萬名新生兒中就有149.9人患有先天性缺陷。
這一不利的局面將隨著“神州基因組數(shù)據(jù)云”項目的實現(xiàn)得到改觀。據(jù)了解,貝瑞和康自主構(gòu)建的中國人群基因組大數(shù)據(jù)庫目前已包含超過四十萬份基因組數(shù)據(jù)。通過對該數(shù)據(jù)資源的深入挖掘,能夠進一步揭示中國人群遺傳突變分布,這將極大助益于提升中國人遺傳疾病診斷的效率和程度。
貝瑞和康作為國際領(lǐng)先的基因測序技術(shù)臨床轉(zhuǎn)化服務(wù)商,致力于為臨床醫(yī)學(xué)疾病篩查和診斷提供“無創(chuàng)式”整體解決方案,是無創(chuàng)DNA產(chǎn)前檢測和針對腫瘤循環(huán)DNA的腫瘤個體化醫(yī)療基因檢測的行業(yè)。
基因測序是一種新型基因檢測技術(shù),能夠從血液或唾液中分析測定基因全序列,預(yù)測罹患多種罕見疾病的可能性,如地中海貧血病。
業(yè)內(nèi)人士指出,隨著下一代基因測序、生物質(zhì)譜和醫(yī)學(xué)成像等醫(yī)學(xué)技術(shù)的迅猛發(fā)展,大數(shù)據(jù)浪潮為生物醫(yī)學(xué)帶來了前所未有的機遇,將根本性的改變生物醫(yī)學(xué)基礎(chǔ)研究和醫(yī)療實踐,但同時生物醫(yī)學(xué)領(lǐng)域數(shù)據(jù)爆炸式的增長也對海量數(shù)據(jù)的存儲和分析提出新的挑戰(zhàn)。云計算將大量計算資源、存儲資源和軟件資源虛擬化,形成規(guī)模龐大的共享資源池,可以有效解決生物醫(yī)學(xué)對IT資源的彈性需求。
目前,新一代基因測序技術(shù)要得到比較準(zhǔn)確的信息,一般認(rèn)為30X 的基因測序深度是必須的,所以一個人的基因組檢測大約需要產(chǎn)生 90Gb 的數(shù)據(jù)。如此大的數(shù)據(jù),在一般的電腦或小型服務(wù)器上運行起來非常困難。
阿里云是全球領(lǐng)先的云計算服務(wù)平臺??蛻敉ㄟ^阿里云,用互聯(lián)網(wǎng)的方式即可遠(yuǎn)程獲取海量計算、存儲資源和大數(shù)據(jù)處理能力。根據(jù)IDC調(diào)研報告,阿里云是國內(nèi)大的公共云計算服務(wù)提供商。
此次,阿里云與貝瑞和康達成合作,正是基于阿里云批量計算服務(wù)的強大能力,利用云計算的優(yōu)勢降低成本,提高數(shù)據(jù)分析的速度。
阿里云批量計算服務(wù)是一種適用于大規(guī)模并行批處理作業(yè)的分布式云服務(wù),適用于生物基因分析、渲染、多媒體轉(zhuǎn)碼、科學(xué)計算、金融保險分析等多個行業(yè)領(lǐng)域。
阿里云專家林河山介紹說,“借助批量計算服務(wù),用戶可以調(diào)動海量計算資源快速完成基因大數(shù)據(jù)的處理。批量計算服務(wù)提供簡單易用的API,允許用戶通過有向無環(huán)圖的方式靈活組建工作流,計算資源管理、作業(yè)調(diào)度和數(shù)據(jù)分發(fā)由系統(tǒng)自動完成。同時,批量計算服務(wù)支持自定義鏡像,并允許應(yīng)用通過網(wǎng)絡(luò)文件系統(tǒng)(NFS)協(xié)議高效訪問阿里云對象存儲(OSS)上的數(shù)據(jù),使得用戶原有分析流程可以輕松上云。結(jié)合阿里云對象存儲,批量計算服務(wù)能夠幫助生物信息分析專家在云上快速構(gòu)建大規(guī)?;蚪M學(xué)應(yīng)用。”
他進一步說,“此次與貝瑞和康的合作,阿里云將不斷優(yōu)化基于基因組學(xué)的云解決方案,以契合醫(yī)學(xué)時代發(fā)展的需求。”
業(yè)內(nèi)專家預(yù)計,雙方合作完成的基因組數(shù)據(jù)云將對中國臨床醫(yī)學(xué)的診斷,預(yù)防和治療的發(fā)展產(chǎn)生深遠(yuǎn)的推動力。
無疑,借助阿里云的批量計算服務(wù),用戶將更便捷、更簡單、更迅速完成基因大數(shù)據(jù)計算,大大降低客戶的成本。同樣,因為云計算的賦能,為研究人員開展大規(guī)模的基因組學(xué)研究大開“方便之門”,將催生一批影響人類健康相關(guān)的變革性成果。