生命の設計図であるゲノムを解読し、その機能を見つけることは、生命現象そのものを知るばかりか、がんなどの病気の発症メカニズムの解明や、新たな作物の開発など、さまざまな夢をかなえる基盤となります。わが国では、理研ゲノム科学総合研究センターが、ゲノム解読の中核的な機関としての使命を果たしていますが、世界でも新たなゲノム解読が続き、遺伝子情報のデータ蓄積量はすさまじい勢いで激増しています。
将来的には、この遺伝子情報を活用して人工的に遺伝子をデザインする「ゲノム設計」を行うことで、バイオエタノールなどの植物由来の燃料や、健康を促進する機能性野菜などを作ることができるかもしれません。しかし、この実現のためには、膨大な量の遺伝子データを使いこなすことが必要となります。
理研ゲノム科学総合研究センターのオミックス情報統合化研究チームは、数10万種類の分散データベース群をキーワードで横断的に検索し、必要とする関連情報を多く含んでいるデーターベースを統計的に選び出して、データーベース単位で高速にランキングする技術「GRASE」を開発しました。さらに、文献やゲノムデータベース群の検索にこの技術を適用して、任意のキーワードで「機能」と「遺伝子」のつながりを推論的に調べることができる強力なウェブ検索サイト「PosMed」を公開しました。ここでは、医学用語に限らずあらゆるキーワードでの検索が可能で、例えば、疾患感受性遺伝子の候補をデータベースの中からランキングづけしたり、変異が見つかった遺伝子の機能解釈を行なうことができます。また、大勢の研究者の中から、必要な専門分野で活躍している人、論文の査読ができる人を探索することに役立つウェブ検索サイト「Researcher Finder」も公開しました。
「GRASE」技術は、バイオ分野だけでなく、あらゆる分野のデータベース統合検索サイトとして活躍することが期待できます。
|