要旨
独立行政法人理化学研究所(野依良治理事長)は、世界で初めてダイズ※1の完全長cDNA※2を大規模に解析し、約23,000種のcDNAの全データを公開しました。これは、理研植物科学研究センター(篠崎一雄センター長)機能開発研究チームの梅澤泰史研究員および篠崎一雄チームリーダー、ゲノム情報統合化ユニットの櫻井哲也ユニットリーダーおよび秋山顕治技師、植物ゲノム発現研究チームの関原明チームリーダーらを中心としたグループの研究成果であり、独立行政法人国際農林水産業研究センター、文部科学省ナショナルバイオリソースプロジェクトのほか、国内の複数の研究グループで構成したダイズ完全長cDNA解析コンソーシアム※3の協力によるものです。
ダイズは、世界的なマメ科の主要作物で、極めて有用な特徴を数多く備え、食用、搾油用、飼料用、工業原料などに欠かせず、需要は年々増加しています。日本でも、豆腐、味噌、醤油、納豆など身近な食品に利用されています。すでにダイズの生産性向上や有用形質の改良などを目指した研究が進み、一部では除草剤に強い組み換え遺伝子を導入した品種が開発されるなど、食糧の増産、エネルギー問題の解決などを可能にするダイズの重要性はますます高まっています。特に米国は、ダイズを穀物の戦略的基幹作物と位置づけ、ダイズの全ゲノム配列を解読するプロジェクトを展開しており、2008年12月に全ゲノム情報を公開しました。今後は、このゲノム情報を基にして、ダイズ遺伝子の解析が進められるポストゲノム研究※4が盛んになると予想されます。
完全長cDNAは、DNAから転写されたmRNAの完全なコピーで、タンパク質の翻訳に必要な情報をすべて備えています。すなわち、遺伝子の機能情報がすべて保持されているため、ポストゲノム研究になくてはならないものです。今回の研究では、日本の代表的なダイズ栽培品種のルーツである「農林二号※5」の約40,000種のcDNAクローンを解析した結果、約23,000種のcDNAの部分塩基配列情報(EST)※6を決定し、その中から約4,700種のcDNA全長配列を決定しました。また、国際的に活用することができるようにオープンなデータベースを構築し、2008年10月20日に全データを公開しました。すでに、日本におけるDNAマーカー※7の開発、米国や日本のダイズゲノムシークエンスプロジェクト※8に利用され、実際にダイズ研究に貢献しています。
本研究成果は、日本の学術雑誌『DNA Research』に2008年12月号に掲載され、取得された完全長cDNAの全クローンは、ナショナルバイオリソースプロジェクトに寄託、公開し、2008年12月5日より世界中の研究者に配布を始めました。
背景
ダイズ(図1)は、日本人にとってとてもなじみの深い作物で、食生活になくてはならないものとなっています。日本人は古くからダイズを食し、豆腐や味噌、醤油、納豆などをはじめとするさまざまな独自の加工食品に利用してきました。一方、世界的に見てもダイズの重要性は際立っており、主要農産物の中で最近の生産量増加率が最も高い作物となっています(図2)。ダイズは、作物として極めて有用な特徴を数多く備えています。例えば、種子中のタンパク含量が全作物中で最も高く、「畑の肉」と称されるほど栄養価の高い食品として知られています。また、油脂含量が高いのも特徴で、食用油の原料として広く利用され、その絞りかすが家畜の飼料として使われるなど、用途は枚挙にいとまがありません。さらに近年では、環境問題への配慮からバイオ燃料※9や工業用インクの原材料としても、ダイズが有望視されています。
昨今の食糧事情や環境問題の観点から、さらにダイズの需要は高まるものと予測され、ダイズの生産性や有用形質を改良するための研究はますます重要になると予想されています。また、ダイズには根粒菌との共生による窒素固定※10という、ほかの主要作物にない大きな特徴があります。そのためダイズ研究は、窒素固定のモデルとしても重要で、今後さらにダイズ研究を推進していくためには、モデル植物であるシロイヌナズナやイネで達成されているような、充実した遺伝子情報の整備が不可欠です。実際に主要生産国の米国は、ダイズの発現遺伝子の部分塩基配列情報(EST)を大量に収集して公開しています。さらに、ダイズの全ゲノム配列の解読を進めており、2008年の12月には米国エネルギー省の共同シークエンスプログラムからダイズゲノム配列の正式版(Ver.1)を公開しました。こうして、世界のダイズ研究は新たな局面を迎えようとしています。
研究手法と成果
全ゲノム配列が決定された後のポストゲノム研究では、個々の遺伝子がどのような機能を持っているかを解析することが研究の中心となります。このときに重要になるのは、個々の遺伝子の場所やタンパク質をコードしている領域の正確な位置情報と、遺伝子がタンパク質に翻訳された後の機能情報です。完全長cDNAはそのどちらの情報も提供できるため、ポストゲノム研究にとって不可欠なリソースとして評価されています(図3)。
研究グループは、日本の代表的なダイズ栽培品種の特徴を有する「農林二号」を材料として選択しました。ダイズ完全長cDNAを作製するために、さまざまな生育条件で育てたダイズや、花や種子などの器官から合計10種類の試料を準備しました。集めた試料からRNAを抽出して完全長cDNAライブラリーを作製し、そこから約40,000種の完全長cDNAを単離しました。その後、cDNAの両端から部分塩基配列を解読して得られた配列を、類似性に基づいて分類し、重複を除いたところ、約23,000種のダイズ完全長cDNAを決定し、さらにその中から約4,700種のcDNAを選び、全長配列を決定しました。
本研究で得たデータを解析したところ、研究グループが作製した完全長cDNAライブラリーの約9割がタンパク質の全領域を含んでおり、良質なライブラリーであることが確認できました。また、シロイヌナズナやイネ、ミヤコグサなどの遺伝子と比較した結果、ダイズ特異的な遺伝子を約1,000個検出できました。今後、ダイズの特性を遺伝子レベルで解明するための有用なリソースとなることが期待されます。
さらに研究グループは、ダイズの完全長cDNAの全データを閲覧できるデータベースを構築して、すべての研究者に利用可能な形で2008年10月20日から公開しました(図4)。また、すべての完全長cDNAクローンを文部科学省ナショナルバイオリソースプロジェクト(NBRP)に寄託しており、2008年12月5日よりNBRPのホームページ上にてクローンの配布を開始しました。本研究で得た完全長cDNAの塩基配列は、日本DNAデータバンク(DDBJ)へ2008年11月に登録を完了しました。
今後の期待
ダイズ完全長cDNAの大規模収集は今回が初めてで、世界のダイズ研究に大きく貢献する成果といえます。さらに今回の成果は、日本のダイズ品種から初めて大規模に遺伝子情報を取得したものであり、国産ダイズの研究にとって有利な特徴を有しています。これらの情報を用いることによって、日本のダイズ品種を解析するためのDNAマーカーの開発や、有用遺伝子の解析が進むことが期待されます。
兵庫の丹波黒豆や山形のだだ茶豆など、日本にはさまざまなダイズ遺伝資源が維持されています。これらの日本のダイズ研究が進むことによって、遺伝資源を品種改良の素材として効率的に利用することが可能になります。
また、米国やブラジルなどの海外では、ダイズを戦略的な基幹作物として位置づけ、研究基盤の整備が急速に進められています。今後のポストゲノム研究において、今回の完全長cDNAの情報は世界的にも大きな役割を持つことが期待されます。
現在、研究グループは、米国のダイズゲノムシークエンスプロジェクトに参画し、今回の完全長cDNA配列の情報を、ゲノム配列上の注釈情報に提供しています。今後、ダイズのゲノム情報が充実し、DNAマーカーの開発が進むことにより、ダイズ育種研究のスピードが飛躍的に高まるのではないかと予測されています。
ダイズは、マメ科植物に属しますが、マメ科にはアズキ、インゲン、エンドウ、レンズマメなどの重要な作物が数多く存在します。今回のダイズ完全長cDNA収集の成果は、ダイズ研究のみならず、ほかのマメ科作物の研究や比較ゲノム研究などに役立つことが期待されます。