生物個体差を生みだすSNPはタンパク質構造にどのような影響をもたらすのか?
いろいろな生物のゲノム塩基配列が読み取られました。ゲノム塩基配列にはその生物を構成するタンパク質やRNAの全設計図が書き込まれていますので、その生物がどのような分子から構成されているのかが原理的にはわかります。ヒトゲノムは2001年にほぼ読み取りが完了しましたが、その後も読み取り精度の向上が続けられています。
それでは読み取りが完了したヒトゲノムは誰のゲノムなのでしょうか?よく考えてみると疑問が生じます。もう一歩進んで考えると、ヒト皆のゲノム塩基配列は同じなのでしょうか?同一生物種でも個体間のゲノム塩基配列は完全には一致しません。少しずつ異なっています。わずかな違いによって、いろいろなところに個人差が生まれてくると考えられています。ゲノム塩基配列のどの違いが、生物表現型のどの違いに対応するのは、理学的に興味ある問題です。またゲノム塩基配列のわずかな違いが薬の効きかたの違いと関係していることも指摘されています。塩基配列の個人差を調べることはいろいろな面で重要な感じです。
塩基配列の個人差の中でも、一塩基の違いによる影響がよく研究されています。一塩基多型(Single Nucleotide Polymorphism (SNP))は同じ生物種の集団の中で、ゲノム塩基配列のある塩基部位が全員同一というわけではなく、ある割合で異なる塩基をもつ集団がいることを意味します。例えば、ゲノム塩基配列のある1カ所が人口の半分でグアニン、もう半分ではアデニンになっている場合です。ヒトをはじめとする生物ではSNPがたくさんあることがわかっています。調べられたSNPはデータベースにまとめられており、誰でも見ることができます。
SNPがなぜ薬の効き方の違いなどを含む個人差を生みだすのでしょうか?生体内で実際に代謝などで働いている分子はDNAではなくタンパク質やRNAです。DNAで起こっているSNPは、タンパク質やRNAの配列に変化を及ぼし、その結果タンパク質やRNAの構造を変化させ、機能に何らかの影響を及ぼしているに違いありません。SNPはタンパク質をコードしている部分にのみ起こっているわけではありません。タンパク質の発現を制御している領域にもSNPは存在します。そのようなSNPは、たぶんタンパク質が仕事をするタイミングに微妙な変化を生みだしていると考えられています。
それでは、タンパク質のコード領域に存在するSNPは、タンパク質の形にどのような影響をおよぼし、その結果としてタンパク質の機能はどのように変化するのでしょうか?このことを知るために日本原子力研究開発機構の河野グループと由良研とが協力して、タンパク質の立体構造情報とSNP情報を融合したデータベースcoliSNPを開発しています。
SNPはタンパク質の様々なところで起こっている様子です。上の図にあるスプライセオソームを構成するタンパク質では、比較的表面に近い2個のアミノ酸残基がSNPによって別のアミノ酸残基に置き換わっています。右側で起こっているLysからSerへの変化は、タンパク質表面の電位を変えます(正電荷をもつアミノ酸残基が減る)。また左側で起こっているThrからArgへの変化もタンパク質表面の電位を変えます(正電荷をもつアミノ酸残基が増える)。このSNPが同時に起こると、タンパク質の正電荷部分布が上図の右側から左側に変わることになります。その結果他の分子(たぶんRNA)との相互作用に何らかの影響をおよぼすと思えます。
多くのタンパク質立体構造で調べていくと、上記のように機能に直接影響をおよぼすと思えるSNPの他に、タンパク質の構造形成に重要なタンパク質構造コア部分に影響をおよぼすSNPがたくさんあることがわかってきました。この場合は、タンパク質が不安定になり、場合によってはタンパク質が構造形成できなくなるかもしれません。SNPによってタンパク質の構造形成に影響がおよび、不安定になったタンパク質は機能発現の効率が悪くなるでしょうし、立体構造を形成できないタンパク質では、機能を発現することができなくなると思われます。SNPによりもたらされるタンパク質の変化は、かなり多様な様子です。
発表論文:
Kono, H., Yuasa, T., Nishiue, S., Yura, K. (2008) coliSNP database server mapping nsSNPs on protein structures. Nucleic Acids Research, 36, D409-D413.