> 研究一覧 >アミノ酸配列からタンパク質の二次構造を予測する
2009年7月20日更新

アミノ酸配列からタンパク質の二次構造を予測する

 タンパク質はアミノ酸配列とそのおかれている環境が決まれば、自発的に折れたたまって固有の立体構造を形成します。Anfinsenのドグマとよばれているこのことは、アミノ酸配列からタンパク質の立体構造を導出できることを意味します。ところが、タンパク質立体構造予測問題には多くの研究者が今まで挑戦してきましたが、予測に成功した例は、ほんのわずかです。近年は立体構造予測国際コンテストのおかげで、成功例が増えているのは事実ですが、まだまだ確実な予測方法があるとはいえません。タンパク質は膨大な数の原子で構成されていますので、どの原子配置が自由エネルギー最小なのかを見いだすのが大変難しいのです。

 タンパク質の立体構造予測は難しいとしても、タンパク質の部分構造である二次構造(αヘリックス、βストランド)程度ならば、うまくいくのではないでしょうか?タンパク質の構造には階層性があり、全体の構造を三次構造とよびます。その一段階下の構造が二次構造です。アミノ酸配列のことは一次構造とよびます。一次構造はゲノム塩基配列により規定されています。ゲノム塩基配列とアミノ酸配列の対応関係を記しているのがコドン表です(正確にいうと、核酸3個とアミノ酸1個の対応です)。二次構造はアミノ酸配列に沿って近くにあるアミノ酸残基の相互作用で構築されると考えられますので、三次構造(全体構造)の予測よりは、関与する原子の数がずっと少なく、そのために予測が容易だろうと考えられます。そんなわけで、今までに様々な二次構造予測方法が提唱され、いくつかはかなり高い精度で予測できるが故に一般的に用いられるようになっています。しかし、現在でも立体構造予測国際コンテストの一部として、二次構造予測の競争が行われています。このことは、二次構造予測ですらまだ十分な精度とはいえないことを意味しています。アミノ酸配列が与えられたときに、70%ぐらいの精度で、どのアミノ酸残基がαヘリックスを構成し、どのアミノ酸残基がβストランドを構成するかを言い当てることができる場合もありますが、50%ぐらいしか言い当てることができない場合もあります。どんなアミノ酸配列でも90%ぐらいの精度で予測できれば、その二次構造予測の方法は十分信頼して利用することができるでしょう。

 由良敬教授は、生命情報学の研究を二次構造予測から始めました。輪湖-齊藤の島モデルにしたがって、アミノ酸配列のいずれかの場所で二次構造の核が形成され、それがアミノ酸配列に沿って拡大していくモデルを先輩と考えました。Wako-Saitoの島モデルは近年タンパク質のフォールディング理論で再発見され、再び有名になっている理論です。当時の二次構造予測の研究では、二次構造の位置を60%程度の精度で予測することができました。当時は世界中でいろいろな方法が試されており、現在の二次構造予測では、その熾烈な競争を生き抜いた機械学習による方法が主流になっています。

 機械学習による予測によって、二次構造の予測精度はたしかに高くなりましたが、タンパク質の二次構造はどのようにして形成されるのかを理解するに至ったとは言えません。あるアミノ酸配列があったときに、どのアミノ酸残基がどのように他のアミノ酸残基と相互作用することで、αヘリックスやβストランドができてくるのかを叙述してくれた例は、今までにないのです。由良研究室ではぜひともここの部分をやってみたいと思っています。

 しかし、いきなりはやっぱり難しそうな問題です。そこで今は、一般的に用いられている二次構造予測法のクローン生命情報学教育研究センターのツール群に作っています。これらのツールをそろえながら、現在用いられている二次構造予測の方法をよく研究し、どのようにすればより高い精度を得ながら物理的な叙述ができるかを考えていこうとしています。関心のある大学生・大学院生の方はぜひご連絡ください。


English
お問い合わせ