まめトーーク!

バイオマーカー開発やパスウェイ解析のための統計解析・インフォマティクス技術に関するメモ。

2008-05-11

Biomarker Discovery, Validation and Applications

今年の2月に国際シンポジウム"Biomarker Discovery, Validation and Applications"に参加してきました。バイオマーカー研究/開発に関係する欧米の大学・公的研究機関・企業等が集参加し、研究開発成果、バイオマーカー開発における問題点、規制側の取り組み等など、幅広い内容で構成されているシンポジウムでした。現在の主流はゲノムマーカーですが、シンポジウムではタンパク質マーカーに関する議論が主流でした。技術的な側面では特に革新的なトピックはなく、分析面では質量分析や抗体アレイが中心、統計・インフォマティクスは検定の多重補正等、退屈な内容でした。※ちなみに抗体アレイはまだまだ発展途上なイメージでした。ただ、製薬会社等の演題で、度々"Systems Biology"がキーワード的に使われていました。バイオマーカー開発においてもバイオマーカーの機序をシステムとして理解する必要があり、特に“がん”領域のバイオマーカーにおいては、シグナル伝達パスウェイを中心とした機序を踏まえたバイオマーカーの開発が今後の主流となる印象を受けました。創薬を意識したバイオマーカー開発においてテキストマイニングを積極的に用い、網羅解析によるデータを過去に報告された生物学的知見と統合し、システムとしての整合性を検証するような試みが行われており、予想以上に"Systems Biology"に対する意識が強い印象をうけました。今は、まだ地味なインフォマティクス技術が今後より重要になっていくと思います。
ところで、シンポジウムはアメリカのレイク・タホで行われました。有数のスキー・リゾート地だそうです。なので参加者の多くはスキーを楽しんでいたようです (スキーウェアで参加している人もいました笑) 。写真はレイク・タホの桟橋から撮ったものです。

laketahoe.jpg

帰りの飛行機が飛ばずサンフランシスコで足止めくらいました。いつも思いますがいい加減なシステムですね。日本のシステムの優秀さが再認識されます。SFでは山中で食べられなかったシーフードをScoma'sで食べました。※地元で有名な店のようです。いい雰囲気でした。写真はSFのフィッシャーマンズ・ワーフ。

fisher.jpg
2008-05-08

がんマーカーに求められる精度

前回、バイオマーカーの評価法として陽性予測値(PPV)について書きました。同じ感度・特異度でも対象疾患の事前確率(有病率)の違いで、臨床における実用性が大きく異なることを示しました。下表は主要ながんに対するスクリーニング目的のバイオマーカーに要求される特異度を計算したものです。

cancerppv.png

罹患率は国立がんセンター"がんの統計 ’07"を参照しました。罹患率とは同部位別がん罹患率です。この罹患率は10万人に対するものなので、1人あたりに換算したものを有病率としました。総じて低い有病率なので感度よりも特異度が要求されます (前回の検討参照) 。感度を0.9としたときの1.PPV=0.1即ち、10人の陽性判定のうち1ががんであるようなときの特異度、2.PPV=0.5、2人の陽性判定のうち 1ががんであるようなときの特異度を示しました。総じて、非常に高い特異度が要求されます。もっとも、有病率は専門病院においてはもっと高いことが推定されますが、あくまでも統計から大まかに計算を試みました。とはいえ、多様な背景を持つ対象群から高感度検出ねらうスクリーニングマーカーに要求される特異性はとてつもなく大きなものになると考えられます。次回は、実用化されている腫瘍マーカーについて検討してみたいと思います。
2008-05-02

バイオマーカーの切れ味

例えば、ある疾患を有する人と健常人を識別するようなスクリーニング目的のバイオマーカーの性能は以下のように評価します。

2x2.png

> TP (True Positive):真陽性:病気の人を正しく陽性と判定
> TN (True Negative):真陰性:健常人を正しく陰性と判定
> FP (False Positive):偽陽性:健常人を誤って陽性と判定
> FN (False Negative):偽陰性:病気の人を誤って陰性と判定

TP・TNがなるべく大きく、FP・FNがなるべく小さいマーカーが優秀といえます。この優秀さの指標として以下が使用されます。

sensitivity.gif
specificity.gif

> Sensitivity:感度:病気の人の中で陽性と判定される割合
> Specificity:特異度:健常人の中で陰性と判定される割合

どちらも0〜1を示し、ともに1のとき完全な判定が可能なマーカーといえます。
一般的に、バイオマーカーは臨床背景をコントールした上で限られた検体数を用いて開発されます。マーカーには高い感度と特異度が要求されますが、マーカーが適用される疾患の状況によっては、感度と特異度だけでマーカーの性能を議論することは危険です。以下の指標を評価する必要があります。
ppv.gif
npv.gif

> PPV (Positive Predictive Value):陽性予測値:検査が陽性のとき、実際に病気である割合
> NPV (Negative Predictive Value):陰性予測値:検査が陰性のとき、実際に健常である割合

PPV は1に近いほど優れ、検査で陽性判定を受けた1/PPV人に1人が、実際に疾患を有することになります。このPPVには疾患に関する"事前確率"が多大な影響を与えます。スクリーニングの場合、この"事前確率"とは疾患の有病率となります。例えば感度が1・特異度が0.95の高性能なマーカーを開発したとします。感度が1なので病気の人を100%陽性判定し、健常人の95%を陰性判定します。このマーカーの適応疾患は有病率が1万人に1人(0.00001)の疾患だとします。仮に100万人(※何人でもいいのですが)にテストしたとすると結果は以下の表になります。

2x22.png

PPVが0.00020なので、1/0.0002=5001人に1が実際に疾患を有しています。よって、5001回テストしたとき5000回は、本当は病気でないのに陽性と判定されてしまいます。日々の検査では、ほとんどが偽陽性判定となるでしょう。

予測対象の疾患の有病率によって、感度と特異度の影響は異なります。下図は有病率0.01, 0.50, 0.99のときの感度(紫)・特異度(青)に対応する陽性予測値PPVの値です。

> 有病率:0.01
R001_PPV.png

予測が難しいことがわかります。PPVは感度(縦軸)の影響は低いですが、特異度(横軸)に鋭敏です。元々、有病率が低いので、多くの健常人を正しく陰性判定するマーカーが要求されます。

> 有病率:0.5
R050_PPV.png

有病率が50%の場合、PPVは感度・特異度ともに鋭敏です。

> 有病率:0.99
R099_PPV.png

有病率が高い場合、PPVは特異度の影響は低いですが、感度に鋭敏です。既に判定対象は、ほぼ疾患を有しているので、その中から正しい陽性判定を下すマーカーが要求されます。

以上の結果をみる限り、レアな疾患をスクリーニングすることは (当然ですが) 容易でないことがわかります。がんの早期発見等を目論んで、血中マーカーの開発が行われていますが、血中タンパク質はダイナミックレンジが非常に大きく、微量のマーカータンパクの検出限界の問題が発生します (A) 。特殊な技術を用いてこれをクリアしたとして、次の問題は特異度です。いかに、対象がんを特異的に検出できるかです (B) 。これをクリアしたとして、最後に立ちはだかる問題が、上述した有病率です。レアながんの場合、いかなる高精度なマーカーを持ってしても、実際の検査で役に立たない可能性もあります (C) 。私が参加しているプロジェクトでは、術後(あるいは生検)組織に対して実施するマーカーを開発しています。腫瘍組織を対象としますので血中に比べると安定的に検査でき、感度も担保できる可能性が高いと考えます。※ (A) に対する優位性。 (B) 特異性については、血中マーカーに比べるとダイバーシティの次元が低く、はるかにハードルが低いと考えます。スクリーニングの特異性は、健常人や様々な疾患等の背景を持つ多様性に対して要求されるのに対して、がん組織マーカーの特異性は、予後の良/不良等のシンプルなものだからです (それでも十分難しいですが) 。 (C) に関しては、有病率という事前確率を1にできます。なぜなら、検査対象は腫瘍組織であり診断が確定済みだからです。要求されるのは高い感度です。これらの考察から、スクリーニング目的の血中マーカーは実現すれば、非常に強力ですが、実現は困難を極めます。一方、術後組織マーカーは、使用方法はフォーカスされていますが、実現可能性が高いと考えられます。いかがでしょうか?

※陽性・陰性予測値はこちらで計算できます。
2008-04-30

バイオマーカー候補

タンパク質のがんマーカーに関する興味深いレポート。

A List of Candidate Cancer Biomarkers for Targeted Proteomics
Malu Polanski and N. Leigh Anderson Biomarker Insights 2: 1-48 (2006)

がんのバイオマーカー開発が始まっておよそ160年間でFDA承認を得たものは、9つしかない。特に近年のオミクス解析技術によりがんのバイオマーカー候補は数多と報告されているが、その臨床的評価は十分とはいえない。筆者らはPubMedのキュレーションにより1261のタンパク質をがんマーカー候補としてリストしている。それらの候補タンパク質群に対して、引用の状況やabundnce、GeneOntologyの全タンパクとの分布の違いを検討しています。GOの解析はそれほど明確な結果にはなっていませんが、Biological Processではapoptosis, cell cycle, proliferation関連タンパクがマーカー候補で増加し、metabolism, catabolism, transport proteinsが減少しているとしています。まあ、それらしいですね。Cellular Componentではやはりextracellularが明らかにマーカー候補で増加しています。1261の候補タンパク質には市販抗体があるタンパクも複数存在し、臨床で評価するための叩き台としてリストを整備したという意図があります。私のお仕事:バイオマーカー探索でも発現解析で得られたリストに対して、この候補タンパク質群のマッピングを行っています。
2008-04-27

DIGE道場

共同研究でバイオマーカー開発を行っている国立がんセンター研究所近藤先生がGE Helthcare社のサイトに"DIGE道場"なる2次元電気泳動法の指南道場を開設された。先生のラボは2次元電気泳動に関して世界でもトップクラスの技術レベルにある(プロトコールはNature Protocolsに掲載されている)。プロトコールは秀逸で数ヶ月のトレーニングで高品質の解析が可能になる。私の少ない経験からみてもプロテオームデータでここまで高品質のデータをみた事がない。しかし、技術は完成ということは無い、目的に応じて測定系はリファインする必要がある。網羅的プロテオームデータから臨床での実用化を目指して微力ながら貢献したいと考えています。

 | HOME |  »


PROFILE

CALENDAR

MONTHLY

RECENT ENTRIES

にほんブログ村 科学ブログへ にほんブログ村 科学ブログ 自然科学へ

CATEGORIES

OTHERS


ホームページ アフィリエイト レンタルサーバーFC2ブログ 専門学校

検索エンジン登録.com

検索エンジン Mono Search