13種類のがんを1回の血液検査で発見できる次世代診断システム 「がんの種類」を高精度で区別 がん研究センターなど
がんの早期診断法の実現を目指して マイクロRNAを腫瘍マーカーに
がん(悪性新生物)は、日本人の死因の第1位になっており、全死亡者の25%以上を占める。がんを早期発見し、治療を開始できるようにするため、簡便ながんの早期診断技術の開発が待望されている。
各臓器のがんについては、それぞれ特化した診断技術が着実に進歩している一方で、単一の低侵襲の検査システムにより多種の悪性腫瘍を1度にスクリーニングできる「多がん早期検出(MCED)」技術を実用化するための研究も進められている。
近年、新たながん検診の戦略として、MCED検査への期待は高まっており、血中マイクロRNA検査が有望とられている。
MCED検査は、血液など採取が容易な単一サンプルから複数の種類のがんを発見する手法。MCEDにより網羅的にチェックすることで、がんにかかっているかどうか、どの臓器からがんが発生したかを予測できると考えられている。MCED検査が陽性であれば、診断を確定させるための画像検査などが必要になる。
また、血中マイクロRNAは、ヒトの細胞にある22塩基長程度の小さなRNAで、血液や唾液、尿などの体液にも含まれる。近年の研究で、がんなどの疾患にともない、血液中でその種類や量が変動することが明らかになっている。
血液はMCEDの検出対象物としてもっとも期待されており、そこに含まれる細胞外DNA(cell-free DNA; cfDNA)、細胞外RNA、エクソソームなど細胞外小胞、血小板中のRNAなどによる検査技術の開発が行われている。
このうちマイクロRNA(miRNA)は、血中の細胞外RNAでもっとも量が多く含まれている。miRNAは細胞外小胞に包含されるなどのかたちで細胞外へ分泌され、他の細胞に取り込まれることにより、細胞間のコミュニケーションツールとしての役割をになうことがある。
腫瘍サイズが小さい段階から、腫瘍細胞やその周辺の細胞などが、通常とは異なるmiRNAの分泌を自律的に開始することから、従来の腫瘍マーカーよりもその変化が早く血中にあらわれやすく、がん早期診断に適していると考えられている。
90%の予測精度 血中miRNA診断に最適なアルゴリズムを開発
研究グループは今回の研究で、国立がん研究センターバイオバンク、国立長寿医療研究センターバイオバンクなどを活用し、13種類の固形がん9,921例と非がん対照5,643例、および各種良性疾患626例の血清マイクロRNAプロファイルを一斉に解析した。
全体の5分の4に相当するサンプル数で機械学習モデルにmiRNAデータを学習させ、残りの5分の1のデータによってがんの種類を予測した。
その結果、診断予測の精度は、全ステージで0.88(95%信頼区間0.87~0.90)、とくに早期診断の意義が高いステージ0~IIに限っても、精度は0.90(95%信頼区間0.88~0.91)と高い性能が得られた。
なお、この性能は機械学習アルゴリズムによって大きな差異があり、機械学習の最適化という課題も明らかとなっていた。
そこで研究グループは、血中miRNA診断に最適なアルゴリズムとして、深層学習を含む階層的アンサンブルアルゴリズム(HEADモデル)を構築し、上記の診断予測精度を達成した。
さらに、作成したデータベースに加えて、公開されているmiRNA情報も活用することで、予測精度を向上させる「転移学習」が活用できることや、この統合情報より、がんの種類を予測するために重要なmiRNAの絞り込みを行った結果も示した。
研究で得られたデータと機械学習コードをすべて公開
研究は、慶應義塾大学薬学部の松﨑潤太郎准教授、東京医科大学医学総合研究所の落谷孝広教授らを中心とした、国立がん研究センター、国立長寿医療研究センター、東レ、Preferred Networksなどの研究グループによるもの。
日本医療研究開発機構の次世代治療・診断実現のための創薬基盤技術開発事業の支援を受け、「体液中マイクロRNA測定技術基盤開発プロジェクト」(プロジェクトリーダー:落谷孝広教授)として、国立がん研究センターを拠点に実施された。
「本研究の成果は、バイオバンクに保管された血清を用いて得られたものです。新たに収集した血清検体でもこの結果が再現されるかどうか、検証を進めています」と、研究グループでは述べている。
「また本研究で見出した、とくに注目すべきmiRNAの血中での含有量が、どのようなメカニズムで調節されているのかを引き続き追究しています。本研究で得られたmiRNAデータと、解析に用いた機械学習コードはすべて公開しており、この研究領域のさらなる活性化を促進するためのリソースとしての活用が期待されます」としている。
なお、解析した血清マイクロRNAプロファイルの内訳は、固形がん9,921例[乳がん675例、膀胱がん399例、胆道がん402例、大腸がん1,596例、食道扁平上皮がん566例、肺がん1,699例、胃がん1,418例、肝細胞がん348例、膵がん851例、前立腺がん1,027例、卵巣がん400例、骨軟部肉腫299例、脳腫瘍241例]と非がん対照5,643例、および各種良性疾患626例となった。
体液中マイクロRNA測定技術基盤開発プロジェクト (新エネルギー・産業技術総合開発機構)
Prediction of tissue-of-origin of early-stage cancers using serum miRNomes (JNCI Cancer Spectrum 2022年11月25日)
[miRNA データ | 機械学習コード]