2006年10月03日

Cluster 3.0

クラスタリングは、遺伝子発現データの解析に必須の技術の1つですね。Cluster 3.0は、階層型クラスタリングだけではなく、k-Means, SOMs, PCAも含まれており、また、汎用性も高くとても便利だと思います。解析結果の視覚化にはJava TreeViewが使えます。また、Pyclusterが提供されており、Pythonからも利用できます。

Cluster 3.0を利用して、化合物のFingerprintなどをクラスタリングしたい場合は、類似度(距離)の計算法に注意が必要だと思います。Cluster 3.0ではPearson correlation, Euclidean distance, City-block distanceなどが選択可能ですが、Tanimoto coefficientは利用できないようです。

Pyclusterだとこの辺りも解決できるかな?


banner_02.gif
人気ブログランキング(クリックして応援してね)




posted by わばのり at 08:56| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

広告


この広告は60日以上更新がないブログに表示がされております。

以下のいずれかの方法で非表示にすることが可能です。

・記事の投稿、編集をおこなう
・マイブログの【設定】 > 【広告設定】 より、「60日間更新が無い場合」 の 「広告を表示しない」にチェックを入れて保存する。