要旨
独立行政法人理化学研究所(野依良治理事長)と、理研オミックス※1基盤研究領域(OSC、林崎良英領域長)が主催する「国際FANTOMコンソーシアム※2」(統括:林﨑良英、科学コーディネーター:鈴木治和)は、文部科学省ゲノムネットワークプロジェクト※3と連携し、大規模データ解析により細胞の分化状態(表現形質)を支配している一群の転写因子※4と、その制御関係を解明し、解析のパイプラインの基礎の構築に成功しました。本成果は、FANTOM4の活動と文部科学省ゲノムネットワークプロジェクトの活動による研究成果です。
理研OSCでは、マウスエンサイクロペディアプロジェクト※5で収集した完全長cDNAのアノテーション(機能注釈)を行うことを目的に、2000年に国際FANTOMコンソーシアムを結成しました。これまでにFANTOM1~3の3つの段階※6の活動を行い、新たなFANTOM4※6では、転写因子のネットワークを解明することを目指しました。
研究グループは、白血病由来のヒト免疫細胞株(THP-1)が、単芽球※7様から単球※7様の状態に分化する過程を、時間を追ってゲノムワイドなデータを収集しました。特に、OSCが独自に開発した技術 (CAGE法※8)と次世代シーケンサー※9を組み合わせ、転写因子の発現データを収集し、新たな概念に基づき汎用的な方程式を構築し、コンピュータで解きました。その結果、解析した約200種類の転写因子の中で、単芽球から単球への分化の過程を支配している30種類の転写因子を抽出し、それらのネットワークを明らかにしました。本成果は、既存の情報を用いることなく、実験データのみに基づいて分子ネットワークの全体像を解明した初めての例となりました。今回の成果により、細胞の分化状態をつかさどる分子ネットワークを解明するには、「どのようなデータを集め、どのように処理・解析すればよいのか」という、解析のパイプラインの基礎が構築されたことになります。
海外では、米国のENCODEプロジェクト※10などを中心に、ゲノム上の機能単位を詳細に解明するプロジェクトが進んでいますが、大規模な分子ネットワークの解明の試みはなされていません。わが国のユニークな発想と技術力に加えて、国際共同研究が結実した今回の成果は、特定の細胞の状態を支配している一群の重要な遺伝子の抽出に応用できるため、今後のライフサイエンスに不可欠な研究基盤になると考えられます。
今回の成果は、この解析のパイプライン構築の成果と、新たな種類のRNA発見の成果を含め、3報が米国の科学雑誌『Nature Genetics』の特集号に同時掲載されるに先立ち、4月19日(日本時間4月20日)にオンライン掲載されます。さらに米国の科学雑誌『Genome Biology』のFANTOM特集号にも、同時に多数の関連論文が掲載されます。
背景
FANTOMとは、理研のマウスエンサイクロペディアプロジェクトで収集した完全長cDNAのアノテーション(機能注釈)を行うことを目的に、2000年に結成された国際研究コンソーシアムで、参加国数が15カ国、参加機関が51機関に上ります。 FANTOMは、これまでにFANTOM 1~3の3つの段階の活動を行ってきました。アノテーションパイプラインの確立を目指したFANTOMの活動は、急速に発展・拡大し、FANTOM3では、トランスクリプトーム解析からRNA新大陸※11の発見をもたらし、大きな反響を与えました。RNA新大陸の発見は、FANTOM3の活動と文部科学省ゲノムネットワークプロジェクトの活動で得た成果です。
今回、FANTOMコンソーシアムは、DNAやRNA、タンパク質などの生体分子が細胞内で、どのような分子ネットワークにより生命現象を成立させているのか、の解明を最終目標として研究を進めてきました。しかし、これまで分子ネットワークを描く方法は、一つ一つの遺伝子に関する研究を、過去の論文などの情報と合わせるだけで、複数の転写因子を同時に解析する技術や、得られた実験データからネットワークを読み解くインフォマティクス手法がありませんでした。
新たなFANTOM4では、細胞分化にかかわる転写因子の網羅的な解析を行うとともに、ゲノムワイドな実験データのみから、大規模な分子相互作用のネットワークを描く方法を示すことを目指しました。
研究手法と成果
今回の研究では、「Attractor Basin」という概念を提案し、細胞の状態と分子ネットワークの解析に取り組みました。これは、「細胞の分化とは、ある安定状態から別の安定状態への遷移で決められており、そこでは分子ネットワークが、特定の安定状態を維持したり、あるいは変化させたりするカスケード(相互作用の連続)を制御するために働いている」とするものです(図1)。具体的には、分子ネットワークのうち最も基本的な「転写制御ネットワーク※12」に着目しました。これを解析することで、細胞の状態を規定する中心的な分子ネットワークが明らかになると考えられます。
研究グループは、白血病由来のヒト免疫細胞株(THP-1)を 転写制御ネットワークの解析のモデルとして採用しました。この細胞は、PMA(Phorbol Myristate Acetate)という試薬で刺激すると、単芽球(丸い形状)から単球(扁平な形状)へと分化します。そこで、単芽球の状態の細胞を、PMAで刺激した時点から96時間後までの間の10回の時点で、発現しているmRNAやタンパク質などのさまざまなデータを測定しました(図2)。その際、CAGE法と次世代シーケンサーを組み合わせることによって得た、全ゲノムにわたる遺伝子プロモーターの発現頻度を調べたデータが、重要な役割を果たしました。この方法では、約10個の細胞の中で1分子しか発現していないような、極めてまれな遺伝子プロモーターも、99.995%の確率でとらえることができました。
こうして得たデータを解析するため、新たな概念を導入し、転写因子の発現を定量的に説明する方程式を構築しました。この方程式に実測データをあてはめてコンピュータで解いたところ、約200種類の転写因子の中で、単芽球から単球への分化の過程で重要な役割をしている30種類の転写因子を抽出し、互いにどのように制御しているかを明らかにすることに成功しました(図3)。その結果、細胞の分化状態の変化や維持において、多くの転写因子が協奏的に働き合っていることが分かりました。特に、単芽球で支配的な転写因子が制御する遺伝子には、細胞分裂など分化に関係する遺伝子が多く、一方、単球で支配的な転写因子が制御する遺伝子には、細胞の接着や免疫応答など細胞の機能にかかわる遺伝子が多いことが分かりました。
この成果は、「どのようなデータをとり、どのような方針で解析すれば、信頼できる分子ネットワークが描けるか」という解析のパイプラインを構築したという意味で重要なものです。理研OSCでは、このパイプラインをライフサイエンスアクセラレーター(LSA)※13の基礎と位置付けています。また、これまで転写因子について記述するには、「強い」、「弱い」など定性的に表現するしかありませんでした。しかし今回、これを定量的に記述する汎用的な方程式が導かれたことで、細胞状態でどの転写因子がどれだけ支配力を持っているかを数値で示すことができるようになりました。
加えて、今回の報告のように、次世代シーケンサーによるRNA発現データなど、大規模なデータの網羅的な解析によって、細胞を支配する重要な転写因子とその分子ネットワークの全体像を明らかにしたのは世界で初めてです。
さらに、今回の一連の実験から、tiRNA※14という新しい種類の非タンパクコードRNA(Non-coding RNA; ncRNA)※15など数々の新しい発見を同時に得ました。
今後の期待
現在、バイオ医学研究分野では、インフォマティクス手法の開発や次世代シーケンサーの高度化を目指した競争が世界中で激化しています。特に、次世代シーケンサーの活用という観点では、単にシーケンスを読み取るだけでなく、理研独自のサンプル調製技術と解析技術を含めたパイプラインの一環として活用することで、高次の情報を抽出するというわが国の強みを顕著に示すことができました。
今回構築した分子ネットワーク解読のパイプラインは、細胞について分子レベルで理解する基礎となることから、研究分野に不可欠の研究基盤になると期待できます。
今後、ある分化状態にある細胞を規定する重要な一群の遺伝子を抽出し、その遺伝子を細胞に導入することにより、目的とする状態に分化させる技術への展開が期待されます。例えば現在、iPS細胞により、病気などで機能を失った細胞を再生する研究が、わが国の重要研究分野として推進中ですが、分子ネットワークの情報が得られると、試行錯誤に多くの時間を費やすことなく、iPS細胞を目的とする細胞に、効率よく誘導することが可能になると期待されます。オミックス基盤研究領域では、今回の成果をもとに、iPS細胞や皮膚の細胞を、目的とする細胞に分化させる技術の開発に着手し、日本の研究開発力を世界にアピールしていきたいと考えています。
文部科学省では、2009年4月から次世代シーケンサーを活用して、生命の基本単位である細胞について、増殖・分化、機能制御などの細胞・生命プログラムの解明を目指す新規プロジェクト「革新的細胞解析研究プログラム(セルイノベーション)」を開始し、理研OSCも密接に連携しています。本成果は、文部科学省ゲノムネットワークプロジェクトとFANTOM4との連携による研究成果であり、文部科学省革新的細胞解析研究プログラム(セルイノベーション)につながる最初のものとなります。今後、本研究で構築した分子ネットワーク解読のパイプラインをさまざまな細胞へ応用し、同プログラムへ貢献していきたいと考えます。