2006年10月03日

Cluster 3.0

クラスタリングは、遺伝子発現データの解析に必須の技術の1つですね。Cluster 3.0は、階層型クラスタリングだけではなく、k-Means, SOMs, PCAも含まれており、また、汎用性も高くとても便利だと思います。解析結果の視覚化にはJava TreeViewが使えます。また、Pyclusterが提供されており、Pythonからも利用できます。

Cluster 3.0を利用して、化合物のFingerprintなどをクラスタリングしたい場合は、類似度(距離)の計算法に注意が必要だと思います。Cluster 3.0ではPearson correlation, Euclidean distance, City-block distanceなどが選択可能ですが、Tanimoto coefficientは利用できないようです。

Pyclusterだとこの辺りも解決できるかな?


banner_02.gif
人気ブログランキング(クリックして応援してね)


posted by わばのり at 08:56| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。