氏 名 池田 修己 本籍(国籍) 北海道
学位の種類 博士 (農学) 学位記番号 連研 第268号
学位授与年月日 平成16年3月23日 学位授与の要件 学位規則第4条第1項該当 課程博士
研究科及び専攻 連合農学研究科 生物資源科学専攻
学位論文題目 膜貫通トポロジーデータベース構築とコンセンサス予測法の開発
(A database of experimentally-characterized transmembrane topologies and a consensus transmembrane topology prediction method)
論文の内容の要旨

 膜貫通タンパク質の機能は、膜貫通トポロジー(膜貫通セグメントの本数と位置、そして 膜貫通方向)から大まかに推定できることが分かってきており、精度・信頼性の高い膜貫通トポロジー予測法の 開発の必要性が高まってきている。

 本研究では、これまでに提案されている10種類の膜貫通トポロジー予測法(KKD,TMpred,TopPred Ⅱ,DAS, TMAP,MEMSAT2,SOSUI,PRED-TMR2+OrienTM,TMHMM2.0,HMMTOP2.0)の性能評価を行なった。

 このために、論文から膜貫通トポロジー(膜貫通セグメントの本数と残基位置、膜貫通方向)情報を抽出し、 それに実験情報やアミノ酸配列情報などを付加したデータベースTMPDB(transmembrane protein database)を構築した。 膜貫通トポロジー情報を抽出した論文は、[1]MEDLINEの抄録をチェックして収集した895論文、[2]直接収集した46論文、 [3]SWISS-PROTのRP(reference position)ラインを手掛かりとして収集した133論文の、計1,074論文である。 これらから、実験的根拠をもつ膜貫通トポロジーモデルのみを採用した。このTMPDBに含まれるαヘリックス型 膜貫通セグメントをもつnon-redundant(アミノ酸配列類似度30%未満)な原核生物種138、真核生物種93配列を 評価用データセットに用いた。

 10予測法のうち最も高い精度は、[膜貫通セグメント本数+位置]に関しては、66.7%(原核、HMMTOP2.0)、 64.5%(真核、MEMSAT 2)、[膜貫通トポロジー]に関しては、原核と真核でそれぞれ60.1%(HMMTOP2.0)、51.6%(HMMTOP 2.0)であり、 既存の予測法の精度はあまり高くはないことが分かった。上記10予測法の中からデータセットに対して最高精度を 与える予測法の組み合わせによるコンセンサス法(ConPred_all)を見いだし、予測精度を大きく向上させることに成功した。 ([膜貫通セグメント本数+位置]:原核76.8%、真核69.9%;[膜貫通トポロジー]:原核71.0%、真核55.9%)。

 本研究で構築したTMPDBはインターネット上
(http://bioinfo.si.hirosaki-u.ac.jp/~TMPDB/)で公開しており、テキスト形式でダウンロード可能である。 TMPDBは膜貫通トポロジー予測法開発や、既存の予測法の改良のためのトレーニングあるいはテストデータセットとして 有用である。また、ConPred_allは
http://bioinfo.si.hirosaki-u.ac.jp/~ConPred/ から利用することができる。