LSDB外部リンク - アーカイブトップ外部リンク - ヘルプ外部リンク
Please turn your javascript on

Gclust Server

データベースの説明

# 項目 説明
1 名称 Gclust Server
2 別名
3 作成者(所属)(*は代表者) *佐藤 直樹(東京大学大学院 総合文化研究科 広域科学専攻生命環境科学系)
4 データベース運用場所 東京大学大学院 総合文化研究科 広域科学専攻生命環境科学系
5 連絡先 東京大学大学院 総合文化研究科 広域科学専攻生命環境科学系
佐藤 直樹
E-mail: gclust
6 オリジナルサイト http://gclust.c.u-tokyo.ac.jp/
7 統括サイト
8 一覧表示 無し
9 クエリ検索 有り
10 Webサービス 無し
11 ユーザ登録 無し
12 データのファイルダウンロード http://gclust.c.u-tokyo.ac.jp/Gclust_Download.html
13 説明 95生物種のタンパク質の総当たりBlast検索の結果得られたクラスタのデータベース
14 データベース分類 タンパク質配列データベース
15 生物種 Taxonomy Name:11 plants, 9 Other bikonts, 25 cyanobacteria, 15 photosynthetic bacteria, 31 non-photosynthetic bacteria, 8 Opistokonts (animals and fungi), total 95 species
16 参照先 NCBI , JGI(http://www.jgi.doe.gov/) , CGP(http://merolae.biol.s.u-tokyo.ac.jp/)
17 運用開始年月日 2006/6
18 最終更新年月 2008/4
19 背景・プロジェクト 相同タンパク質を多数の生物について比較することは,比較ゲノム研究のもっとも基本となるところであるが,従来の方法では, ゲノムを1対1で比較したデータを集めるのが普通であった。 タンパク質の種類によって,類似度には大きな差が有り,非常に保存性の高いタンパク質グループもあれば,かなり保存性が低いオルソログも存在する。 こうした点を考慮しながら,ゲノム特定の公募研究として,自動的にオルソログクラスタを作る手法を開発し,光合成生物特有のタンパク質群の機能解析に応用した。
20 データベースの特長・有用性・活用方法 比較する全生物種の全タンパク質の総当たりBLASTの結果に基づいて,類似度の閾値を自動的に設定しながら, 相同タンパク質の分類を行うのがGclustの特徴である。また,機能未知タンパク質についても相同クラスタができるため, 注目する生物群に特有の相同クラスタを見つけることにより, それら生物群に固有の生理機能にかかわるタンパク質を発見する手がかりを与えることができる(系統プロファイリング)。 Gclustデータベースは系統プロファイルによる検索を可能にした相同タンパク質データベースである。
21 論文等 文献名 Gclust: trans-kingdom classification of proteins using automatic individual threshold setting.
著者名 Naoki Sato
雑誌名/掲載年月/号 Bioinformatics 2009 Mar 1;25(5):599-605.
Pubmed ID 19158159

Gclust Server | データ内容

データ1
# 項目 説明
1 データ内容 95生物種の予測されたタンパク質のアミノ酸配列、及びそれらのアノテーション
2 データソース 公共DB
3 データ取得方法 NCBI, JGI, CGPから全95生物種のタンパク質アミノ酸配列を取得
4 解析方法
5 登録件数 698,557件

データ2
# 項目 説明
1 データ内容 95生物種のタンパク質アミノ酸配列間の類似度比較に基づくクラスター
2 データソース データベース内のデータ
3 データ取得方法 上記配列データ
4 解析方法 上記アミノ酸配列データを総当たりでBLASTP検索し、E-valueとオーバーラップスコア(相同な領域の割合)をクラスタリングの条件として用い、 クラスター毎に最適なE-valueとオーバーラップスコアの領域を求める方法 (Bioinformatics 2009 Mar 1;25(5):599-605.) でクラスタリングを行った。
5 登録件数 206,764件
データ3
# 項目 説明
1 データ内容 95生物種のタンパク質アミノ酸配列の各クラスターに対して類似性はあるが、クラスター形成には用いなかったタンパク質アミノ酸配列
2 データソース データベース内のデータ
3 データ取得方法 上記配列データ
4 解析方法
5 登録件数 14,444,047件