2011年、計算性能世界1位を2期連続で獲得したスーパーコンピュータ「京(けい)」の共用が、今年9月末から開始された。
文部科学省委託事業「次世代生命体統合シミュレーションソフトウェアの研究開発(ISLiM)」の研究開発拠点となっている理研社会知創成事業 次世代計算科学研究開発プログラム(CSRP) 分子スケール研究開発チームの木寺詔紀(あきのり)チームリーダー(TL)たちは、タンパク質などの生体分子の機能を「京」を駆使して精度よく再現するためのソフトウェアの開発を進めてきた。そのうちの一つ、全原子分子動力学シミュレーションソフトウェア「MARBLE(マーブル)」を用いて、第一三共(株)と共同で創薬のための新しい手法の開発を進めている。
「京」は創薬にどのような変革をもたらそうとしているのか。木寺TLとISLiMのサイエンス・アウトリーチ担当・田村栄悦(えいえつ)氏に聞いた。
従来は解けなかった問題を解くグランドチャレンジ
―ISLiMでは、どのような研究を進めてきたのですか。
木寺:2006年度から理研を拠点に国内の大学・研究機関の研究者たちが集結し、ライフサイエンス分野におけるグランドチャレンジとして「次世代生命体統合シミュレーションソフトウェアの研究開発(ISLiM)」を進めてきました。「京」を最大限に活用して生命現象のシミュレーションを行うソフトウェアを開発する国家プロジェクトです。このようなオールジャパンのプロジェクトは、この分野では初めてのものです。
―グランドチャレンジとは。
田村:「京」のようなスーパーコンピュータにしか解けない問題を国家プロジェクトで解こうという取り組みです。このような取り組みは米国が先行しましたが、日本ではライフサイエンスとナノテクノロジーのプロジェクトが、文部科学省の委託事業として2006年度から進められてきました。
木寺:生命現象にはタンパク質など分子スケールから細胞、臓器・全身スケールに至るまで、さまざまな階層があります。ISLiMは、理研の6チーム(図1)と大学・研究機関の研究者が連携し、各階層のソフトウェアを開発しています。その数は全部で30本近くになります。
―木寺TLが担当する分子スケール研究で、これまで解けなかった問題とは何ですか。

図1 次世代計算科学研究開発プログラム
開発したソフトウェアを下記URLで公開している。
http://www.islim.org/islim-dl_j.html ![]()

図2 「MARBLE」によるシミュレーション例
細菌の多剤排出トランスポーターというタンパク質の運動を、周囲の細胞膜や水分子を含め、50万個もの原子同士に働く力を長時間計算して再現し、その機能メカニズムを解明する研究を進めている。
木寺:その一例を紹介しましょう。生命現象を支えるタンパク質はたくさんの原子から成る巨大分子です。その機能を再現しようとすると、分子量に応じて計算量が増えていきます。
しかも、分子量の小さな化合物などの時間スケールはピコ(1兆分の1)秒レベルですが、分子量の大きなタンパク質になるとそれより10億倍も長いミリ(1000分の1)秒レベルに達するので、計算量はさらに増えていきます。
「京」以前のスーパーコンピュータで計算できるのは、タンパク質の機能発現に要する時間の1万分の1、せいぜい100ナノ(1000万分の1)秒程度でした。
私たち分子スケール研究開発チームでは、「京」をフルに活用することで、タンパク質の機能発現の始めから終わりまで再現することを目指すソフトウェア「MARBLE」の開発を、池口満徳 准教授(横浜市立大学)を中心に進めてきました。
―「MARBLE」はどのようなソフトウェアですか。
木寺:分子スケールもいくつかの階層に分かれますが、「MARBLE」は分子を構成する原子を単位とするモデルを用います。目的のタンパク質だけでなく、周囲にあるほかのタンパク質や水分子など、機能に関わるすべての原子間に働く力を計算して、タンパク質の運動をシミュレートするのです。タンパク質は形を絶えず変化させながらほかの生体分子と相互作用します。そのような現実に起きている状態を、可能な限りそのまま再現しようとしています(図2)。
なぜ「京」のためのソフトウェアが必要なのか
―従来の計算機のソフトウェアをそのまま「京」で使えないのですか。
木寺:それは困難なのです。「京」は、なぜ計算速度が速いのか。計算の基本単位であるプロセッサコアの速度は、パソコンとそれほど変わりません。ただし「京」は、プロセッサを約70万コアも搭載しています。ある計算をするとき、この部分はこのプロセッサ、こちらは別のプロセッサと割り振り、それぞれの計算結果を効率よくやりとりさせ、たくさんのプロセッサを同時に使いこなすことで、初めて高速に計算することができるのです。そのような極めて複雑な指示を行う必要があるので、従来の計算機のソフトウェアをそのまま使って高い性能を出すことはできせん。
―「京」は70万コアのプロセッサをすべて使いこなすことで、1秒間に1京回(1兆の1万倍)、10ペタフロップスの速度で計算できるのですね。
木寺:そうです。ただし、通常のソフトウェアでは100%のスピードを達成することは現実的には難しく、実際の計算速度は10%を超える程度です。それでも、従来のスーパーコンピュータと比べて最大で1000倍の速度に相当します。
「京」を活用した創薬のオープンイノベーション
―第一三共株式会社 (以下、第一三共)と創薬に役立つ新しい方法論を開発しているそうですね。
田村:グランドチャレンジのような研究開発プロジェクトでは、決まった期間で成果をはっきりと出す必要があります。もちろん学術論文発表という成果も重要ですが、同時に具体的な社会への貢献も求められます。
私たちは、開発した30本近いソフトウェアのソース・プログラム公開を進めており、利用マニュアルを整備しています。さらに、産業界に活用していただくための活動も進めています。特に2010年から、「次世代スパコンの創薬産業利用促進研究会」と協力して、製薬メーカーの創薬研究を担当している研究者の方々にお集まりいただき、開発したソフトウェアを紹介したり、訪問して個別に創薬におけるニーズを伺ったりしています。その中から、木寺TLたちと第一三共との共同研究の話がまとまり、今年6月にその契約締結の発表をしました。
―「京」をどのように創薬に役立てるのですか。
木寺:病気の原因となるタンパク質(標的タンパク質)に結合して、その機能を阻害するような化合物が薬となります。ただし、その化合物がほかのタンパク質に結合すると、副作用が出てしまうので、標的タンパク質だけに結合する化合物をつくる必要があるのです。
そのために、たくさんの化合物をつくり、その中から標的タンパク質だけに強く結合するものを絞り込んでいきます。そのとき、化合物と標的タンパク質が、どれくらいの強さで結合するのかを調べる必要があります。その結合の強さを「MARBLE」を使って「京」で計算する研究を、第一三共と進めています。
―これまでも創薬に計算機が利用されてきましたね。
木寺:小規模の計算機を使って簡易な計算により、標的タンパク質と結合するかどうか、たくさんの化合物の中から候補を絞り込む、いわゆる「インシリコ・スクリーニング」が行われています。その後、絞り込んだ候補化合物と標的タンパク質との結合の強さを実験によって調べます。
私たちは、現在のインシリコ・スクリーニングで用いられる方法よりも精度よく候補化合物を絞り込むことのできる手法の開発を、第一三共と行っているのです。
田村:「京」を使うことで、現在、大手製薬メーカーでは数百人体制で行っているといわれる実験的手法よりも、速く、安く、候補化合物と標的タンパク質との結合の強さを調べることができるかどうかがポイントです。
実はこれまで、製薬メーカーと大学や公的研究機関との共同研究は、あまり活発ではありませんでした。自社内で閉じて研究開発を行う傾向が強かったのです。それが最近、流れが大きく変わりました。ベンチャー企業や大学・公的研究機関などの技術を積極的に取り込んで技術革新を図る「オープンイノベーション」が、医薬品業界を含む多くの先端産業で世界的に広まっています。
木寺:特に計算科学の分野では、日本の製薬メーカーとの関係がこの1〜2年で大きく変わってきたような気がしますね。
―その背景には何があるのでしょうか。
田村:「京」のようなスーパーコンピュータの登場により、実験的手法より速く、安く、候補化合物と標的タンパク質の結合強度を計算できる可能性が出てきました。数年後にスーパーコンピュータによる創薬手法が世界の主流になり得る可能性を見越して、「京」が使える今がチャンスだ、という意識が各製薬メーカーで出始めてきたものと推察しています。理研と第一三共だけでなく、国内の大学と製薬メーカーとの間で、複数の共同研究プロジェクトが進行しています。
木寺:私も企業の本気度をひしひしと感じています。
田村:オープンイノベーションの流れは、「京」の成果を産業界に役立てる絶好のチャンスです。欧米でも創薬・医療分野にスーパーコンピュータを用いる取り組みが進んでいます。日本も「京」の共用開始を契機に、この分野に戦略的に取り組んでいくべきです。
予測する生命科学で医療・創薬に貢献する
―2012年度に終了するISLiMの後継となるHPCI計算生命科学推進プログラムが昨年4月、理研神戸研究所に発足しました(図3)。木寺TLはその副プログラムディレクターを兼務していますね。
木寺:「京」をはじめとする国内のスーパーコンピュータを活用して具体的な成果を出すための新たな国家プロジェクト「HPCI(ハイパフォーマンス・コンピューティング・インフラ)戦略プログラム」が始まりました。その五つの戦略分野のうち、「予測する生命科学・医療および創薬基盤」を、私たちのプログラムで推進しています。名前に示されているように、医療や創薬へ貢献することを目指しています。それには、“予測する生命科学”を実現できるように、「京」を駆使して計算科学を発展させなければいけません。
―予測する生命科学とは。
木寺:薬の候補化合物と標的タンパク質の結合に関していえば、結合の強さを定量的に、実験でなく計算で求めることが予測です。実験の単なる説明ではなく、実験では知ることのできない情報をシミュレーションによって得ることが目的です。さらに、化合物やタンパク質を構成するそれぞれの原子が、結合力にどのように影響を及ぼしているのかという情報から、化合物をどのように改変すれば結合力を強くできるのかを予測することにつなげることができます。そのような予測する生命科学を実現できることが、計算機を用いた手法の最大の利点です。
―HPCI計算生命科学推進プログラムでは、どのように創薬に貢献しようとしているのですか。
木寺:「予測する生命科学・医療および創薬基盤」の戦略課題2「創薬応用シミュレーション」では、できる限り高い精度で候補化合物と標的タンパク質の結合の強さを計算することを目指して、すでに実績のあるソフトウェアを「京」でも使えるようにして、大規模な計算を行っています。
―実際には、投与した薬剤が標的タンパク質にたどり着かなければいけませんね。
木寺:その通りです。薬剤が標的タンパク質のある部位までたどり着けるか。また、ほかの部位に副作用を与えないか、余分な薬剤が体内に蓄積せずに肝臓できちんと分解されて体外へ排出されるか……、さまざまな部位・階層にわたり確認しなければいけません。
創薬の課題は、分子スケールだけで議論できるわけではありません。第一三共との共同研究は、創薬の長い道程の一部を計算機によって加速化しようという取り組みです。医療や創薬に貢献するには、生命現象を、分子スケールだけでなく細胞、臓器、全身スケールに至るまで、さまざまな階層においてシミュレーションを行い、それらを統合する必要があります。
「予測する生命科学・医療および創薬基盤」の戦略課題1「細胞内分子ダイナミクスのシミュレーション」では、細胞を丸ごとシミュレートすることで、創薬や医療に貢献しようとしています。
戦略課題3「予測医療に向けた階層統合シミュレーション」では、血管や心臓、筋骨格、脳神経系などこれまで別々に開発してきた各階層のシミュレーションを統合して、心筋梗塞(こうそく)やパーキンソン病など、さまざまな疾患の複雑な病態を再現して、病態の予測や治療の支援を行うことを目指しています。
そして戦略課題4「大規模生命データ解析」では、ゲノム情報をもとに生体分子の相互作用ネットワークを解析することで、標的タンパク質の同定から薬効や副作用を予測することが目標です。
―将来、ある人が特定の薬剤を摂取したときの薬効や副作用を、人体丸ごと、各階層にわたり予測することができるようになるでしょうか。
木寺:それはまさに究極の予測の一つですね。私たちは「京」を用いて、そのような究極の予測へ向けた第一歩を踏み出したところです。
(取材・構成:立山 晃/フォトンクリエイト)



