構造を取りそうもないペプチドにみられるアミノ酸残基種の出現頻度は、構造を取るペプチドのアミノ酸残基種頻度とは異なっている。 この傾向を数値化することで、あるペプチドが構造を取るか取らないかを推定することができるかもしれない。どのように数値化すればよいのだろうか?
Vladimir N. Uverskyらは、ペプチドを構成するアミノ酸残基の化学組成と構造/非構造の性質とに関係があることを2000年に見いだした。
(Uversky, V.N., Gillespie, J.R., and Fink, A.L. (2000). Why are "natively unfolded" proteins unstructured under physiologic conditions? Proteins 41, 415-427.)
上のグラフの横軸はペプチドの平均疎水性、縦軸はペプチドの平均電荷である。濃い青色の四角は275個の定まった構造をもつペプチド、赤丸は91個の非構造ペプチド、シアンの丸は非構造ペプチドと共通祖先を持つ242個のペプチド、緑丸は130個の予測非構造ペプチドを意味する。「平均疎水性」とはKyteとDoolittle (1982)の疎水性指標(規格化)の平均値、「平均電荷」とはLys = 1, Arg = 1, Asp = -1, Glu = -1,他の残基は0としたときの平均値を意味する。
この分布を見ながら、Uverskyらは、構造を取るペプチドと取らないペプチドを以下の式で分けることができることを見いだした。
Jaime Priluskyらは上の式を変形することで、あるペプチドが構造を取るかどうかを予測する方法を考案した (Prilusky, J., Felder, C.E., Zeev-Ben-Mordehai, T., Rydberg, E.H., Man, O., Beckmann, J.S., Silman, I., and Sussman, J.L. (2005). FoldIndex: a simple tool to predict whether a given protein sequence is intrinsically unfolded. Bioinformatics 21, 3435-3438)。
このプログラムはフリーフォーマット(以下の問題にあるアミノ酸配列のフォーマット)のファイルを入力として、そのアミノ酸配列をもつペプチドが構造を取るか取らないかを出力してくれる。
MQGSVTEFLKPRLVDIEQVSSTHAKVTLEPLERGFGHTLGNALRRILLSSMPGCAVTEVEIDGVLHEYSTKEGVデータ2:
ILAEQLEAFVDLRDVRQPEVKEEKPEFDPILLRPVD