【日經BP社報導】美國總統歐巴馬(Barack Obama)於2015年1月提出了“Precision Medicine Initiative”。這是根據每個人的遺傳資訊等實現精密(個性化)醫療的國家計畫。受其推動,正在加速個性化醫療的美國在進入2016年後,啟動了新的醫療項目:“National Cancer Moonshot”。
National Cancer Moonshot是以開發新的癌症診斷法和治療法,以最終攻克癌症為目標的項目。由副總統拜登(Joe Biden)主導,總投入為10億美元。是堪比歷史上的登月計劃“Moonshot”的大項目。
該項目的支柱主題之一是基因組分析。美國目前正在為癌症患者的基因組分析及結果的應用而疾速推進基礎構建。其關鍵詞是“Data Sharing(數據共用)”。這是一項在雲端構建癌症基因組資料庫,以便讓醫療界、產業界等各方人士都能訪問的措施。由此可大幅削減分析、利用基因組數據分析結果所需要的時間和成本,意在使基因組醫療早日普及。
2016年7月6日於東京大學舉辦的“第5屆健康長壽迴圈會議”(主辦:東京大學COI機構)上,以利用超級電腦開展癌症基因組研究等而聞名的東京大學醫科學研究所的井元清哉(該研究所健康情報中心健康醫療數據科學領域教授)登臺演講,以“基因組分析的最前沿”為題,介紹了構建基因組分析基礎的最新趨勢。
“數據共用”是趨勢
美國在2016年6月建立了新的癌症基因組資訊資料庫,就是NCI(美國國家癌症研究所)的“Genomic Data Commons”。過去,美國比較著名的癌症基因組資料庫是“Cancer Genomics Hub(CG Hub)”,而Genomic Data Commons是其後繼資料庫。
井元說Genomic Data Commons的一大特點,是該資料庫建立在美國芝加哥大學(University Of Chicago)的私有雲上。估計會成為可與美國亞馬遜(Amazon, AMZN-US)、美國微軟(Microsoft, MSFT-US)等雲端平台相容的資料庫。
美國生物初創企業Foundation Medicine預定向該資料庫提供2萬人份的癌症基因組數據。計劃成為國家級癌症基因組數據的共用基地。
支撐Genomic Data Commons的雲端平台,由超過1.2萬個CPU內核和約5PB的存儲空間組成。井元引用了美國要儲存100萬人份的基因組數據(即便是壓縮數據)也需要100PB的存儲空間的見解,說基因組分析中“充滿了海量的數據”。他舉例說,井元所在的東京大學醫科學研究所的基因組分析用超級電腦“shirokane3”於2015年3月正式投入運轉後,在1年多的時間裡,已經用掉了儲存容量的一半以上。
在雲端創建基因組分析環境
美國民間也不乏共用癌症基因組數據的行動。比如說,美國Human Longevity正計劃向英國阿斯利康(AstraZeneca)擁有的50萬人份臨床試驗資料庫,提供100萬人份的基因組數據。Human Longevity擁有多臺最尖端的新一代測序儀,據稱1年可以分析10萬人的基因組。
除此之外,美國Genomics Personalized Health提供著全基因組測序,但不分析結果(解釋),而是經由雲端直接返回給客戶的服務。客戶要使用第三方的基因組分析軟體,對返回的結果進行分析。
開發這種雲端基因組分析軟體的企業“在美國已經湧現出了許多家”。最大的基因組測序儀生產商——美國Illumina創辦的新創企業美國Helix OpCo就是其中之一。
跨國數據共用
隨著新一代測序儀的面世與進化,基因組分析的成本急劇降低。井元援引美國的報導,指出全基因組測序的成本已經降低到了與全外顯子組測序相同的水準。全外顯子組測序只測定全基因組中3%左右的基因區,過去多因其成本優勢而採用。井元說,隨著二者的成本拉平,“我感到全基因組測序時代已經到來了”。
作為全基因組測序有效發揮作用的例子,井元舉出了遺傳病——家族性腺瘤性息肉病。他說,全外顯子組測序發現不了可能致病的變異,而全基因組測序則發現了APC基因的啟動子區存在缺損。
關於全基因組測序,跨國共用數據的活動已經開始。國際癌症基因組聯盟(International Cancer Genome Consortium)開展的“PCAWG(Pan-Cancer Analysis of Whole Genomes)”項目就是如此:使多座數據中心的跨國合作,在虛擬機的相同環境下實施全基因組分析。目前世界各地的10座數據中心已經連接起來,東京大學醫科學研究所也加入其中,主要負責癌症免疫的分析。
井元在這些政策的基礎上,作為“基因組分析的未來”的展望,提到了雲端基因組資料庫、人工智慧等分析引擎和分析工具等一應俱全,研究者無需將數據下載到本地,就能各自進行分析的情形。企業和醫療機構通過將基因組分析委託給平台,還能夠以比自主測序更低的成本,獲得需要的基因組分析數據。可以將之用作創制新藥和優化治療的措施。井元表示,在構建這樣的機制時,兼顧個人資訊保護法也會成為一個重要的課題。
《日經技術在線》授權轉載