2006年10月25日

Molecular Similarity Search

分子のSimilarity Searchは、Substructure Searchと同様によく利用するのですが、分子をどのようなDescriptorで表現するか、またどうのような尺度で比較するかによって検索結果に大きな差が生じてしまいます。利用するDescriptorの算出法や距離の計算法を深く理解しなければいけないなと思ってます。

さて、cheminformatics.orgにSimilarity Searchに関するreviewや簡単な概説があり、なかなか便利です。またMOLPRINT 2Dも利用できるようです。


banner_02.gif
人気ブログランキング(クリックして応援してね)

posted by わばのり at 08:56| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年10月05日

PowerMV

PowerMVは、NISSで開発されたソフトウェアで、分子の描画、descriptorの生成、similarity search、統計処理などができるようです。統計処理にはRが利用されているみたい。
詳細は、J. Chem. Inf. Model.で発表されています。

 J. Chem. Inf. Model., 45 (2), 515 -522, 2005

分子の描画をX行×5列という感じでグリッド表示できるようで、これだけでも便利だなと思います。


banner_02.gif
人気ブログランキング(クリックして応援してね)




posted by わばのり at 22:53| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年10月03日

Cluster 3.0

クラスタリングは、遺伝子発現データの解析に必須の技術の1つですね。Cluster 3.0は、階層型クラスタリングだけではなく、k-Means, SOMs, PCAも含まれており、また、汎用性も高くとても便利だと思います。解析結果の視覚化にはJava TreeViewが使えます。また、Pyclusterが提供されており、Pythonからも利用できます。

Cluster 3.0を利用して、化合物のFingerprintなどをクラスタリングしたい場合は、類似度(距離)の計算法に注意が必要だと思います。Cluster 3.0ではPearson correlation, Euclidean distance, City-block distanceなどが選択可能ですが、Tanimoto coefficientは利用できないようです。

Pyclusterだとこの辺りも解決できるかな?


banner_02.gif
人気ブログランキング(クリックして応援してね)


posted by わばのり at 08:56| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

広告


この広告は60日以上更新がないブログに表示がされております。

以下のいずれかの方法で非表示にすることが可能です。

・記事の投稿、編集をおこなう
・マイブログの【設定】 > 【広告設定】 より、「60日間更新が無い場合」 の 「広告を表示しない」にチェックを入れて保存する。


×

この広告は1年以上新しい記事の投稿がないブログに表示されております。