バイオインフォマティクスの基礎実習
次のページへ進む
前のページへ戻る
トップページへ戻る

2.6. PDBを用いた立体構造データベースの検索

生体分子の立体構造情報は、酵素の基質特異性や他のタンパク質との相互作用などを原子レベルで理解するための大きな知見となり、学術的な観点のみならず、酵素の基質特異性の人工的な改変、薬剤や食品の設計を支援するといった応用面からも非常に重要である。立体構造データベースには、立体構造データそのものを登録した一次データベースと、構造を分類・比較して類似のものを階層的にグループ化した二次データベースがある。前者の代表的なものはPDB(Protein Data Bank)である。

PDBには、タンパク質のX線結晶構造解析、NMRなどで得られた3次元座標データ、アミノ酸配列と二次構造の情報、文献情報、そのほか、熱ゆらぎに関する情報や解像度などが記載されている。またDNA、RNAなどの核酸の立体構造や、複数の分子の複合体の立体構造なども登録されている。

では、PDB(Protein Data Bank)にアクセスして、c-Cblの立体構造情報を検索してみよう。
  1. PDB(http://www.rcsb.org/)にアクセスする。

  2. Swiss-Protの検索結果から、c-CblのPDB IDの1つが「1FBV」であることがわかったので、これを検索することにする。画面上のボックスで「PDB ID or Text」が選択されていることを確認し、その右のテキストボックスに「1FBV」と入力して「Search」ボタンを押す。


    1FBVの検索結果


    Jmolを使った立体構造の簡便表示

    PDBの検索結果の最初のページから、立体構造表示用のオプションをクリックすると、PDBの立体構造データを簡便に可視化することができる。この中の、JAVAを使った立体構造表示ツールJmolを利用して、立体構造を表示してみよう。分子のグラフィックス絵の下にある「View in Jmol」をクリックすると、Jmol画面に切り替わる。


    モチーフデータベースPROSITEの検索結果から、zinc finger ringモチーフではZn原子の結合に必須のCysおよびHis残基が強く保存していることがわかった。以下の手順で、立体構造の上でこのことを確認してみよう。

    1. 画面の黒いところを右クリック
    2. 「Console...」を選択
    3. 「Jmol Script Console」という名前のウィンドウが開く。2分割されているうちの下のウィンドウに以下のコマンドを入力し、Returnキーを押すと、入力したコマンドが実行される。
    4. select zn.zn ←Zn原子が選択される
    5. spacefill ←Zn原子がspacefill表示される
    6. center zn.zn ←Zn原子を画面の中央にもってくる
    7. restrict within(10.0,zn.zn) ←Zn原子から10.0Å以内の原子のみに表示を限る
    8. (Shiftキーを押しながら左ドラッグしてZn原子付近にズームする)
    9. select (cys or his) and within(10.0,zn.zn) ←CysまたはHisを選択
    10. wireframe 50 ←側鎖を含めたwireframe表示を追加
    11. select *.ca and (his or cys) and within(10.0,zn.zn) ←Cys, HisのCα原子を選択
    12. labels %n ←残基名ラベルを表示

    この手順を行うと、以下のような画面が表示されるはずである。マウスでドラッグして分子を回してみよう。CysおよびHisの側鎖がZn原子との結合に深く関わっている様子がよくわかるはずである。

    再び分子全体を表示するには、select all、さらにribbonsと実行すればよい。


  3. 時間に余裕のある人は、PDBの登録数、新規フォールド発見数が年代とともに、どのように増加してきたか調べてみよう。PDBのトップページで、右上の方の「PDB Statistics」クリックし、「Content Growth」の中の「Growth of Released Structures Per Year」をクリックしてみるとよいだろう。

2.7. SCOPを用いたタンパク質立体構造分類情報の検索

タンパク質の立体構造はタンパク質によって多種多様であるが、とくにアミノ酸配列が似ていれば構造同士も多くの場合よく似ており、フォールド(主鎖の折れたたみのパターン)に着目すると、階層的にタンパク質立体構造のグループ分けをすることができる。このような構造分類は、タンパク質の機能を予測・解析するのに重要である。
  1. SCOPhttp://scop.mrc-lmb.cam.ac.uk/scop/
    英国MRC Laboratory of Molecular Biology and Centre for Protein Engineeringが1994年から公開している、タンパク質の進化上、構造上の関係を記述したデータベース。ファミリー、スーパーファミリー、フォールド、クラスの各レベルにおける分類が行われている。
  2. CATHhttp://www.cathdb.info/
    University College Londonが公開しているタンパク質構造分類データベース。アミノ酸配列にクラスタリングを適用して、ファミリー分類を行うことにより、構築している。
  3. Dali Databasehttp://ekhidna.biocenter.helsinki.fi/dali
    EBIが公開しているタンパク質構造分類データベース。タンパク質の構造上の分類を自動的に行った結果を掲載している。ここで用いられているDalihttp://ekhidna.biocenter.helsinki.fi/dali_server)というプログラムは、新規にタンパク質の立体構造を決定したとき、ほかに似た立体構造をもつタンパク質が存在するかどうかを検索するのによく用いられる。
SCOPにアクセスして、上で立体構造データにアクセスした PDB ID: 1FBVの分類結果を検索してみよう。
  1. SCOP(http://scop.mrc-lmb.cam.ac.uk/scop/)にアクセスする。

  2. Access Methods」の「Keyword search of SCOP entries」 をクリックして「1FBV」を入力し、「Retrieve information」ボタンを押す。

  3. Cblタンパク質および1FBVの中でCblタンパク質と複合体を形成しているUbcタンパク質が、複数のエントリに分類されていることがわかる。以下は、このうちの「a.39.1.7」をクリックした結果である。1FBVのエントリが含まれていることを確認してみよう。

    1FBVの検索結果


    (途中省略)


SCOPの分類
CATHの分類

次のページへ進む
前のページへ戻る
トップページへ戻る
生物情報工学研究室
ご意見・ご感想などはlecture2012@bi.a.u-tokyo.ac.jpまでお願い致します