2006年10月25日

Molecular Similarity Search

分子のSimilarity Searchは、Substructure Searchと同様によく利用するのですが、分子をどのようなDescriptorで表現するか、またどうのような尺度で比較するかによって検索結果に大きな差が生じてしまいます。利用するDescriptorの算出法や距離の計算法を深く理解しなければいけないなと思ってます。

さて、cheminformatics.orgにSimilarity Searchに関するreviewや簡単な概説があり、なかなか便利です。またMOLPRINT 2Dも利用できるようです。


banner_02.gif
人気ブログランキング(クリックして応援してね)

posted by わばのり at 08:56| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年10月05日

PowerMV

PowerMVは、NISSで開発されたソフトウェアで、分子の描画、descriptorの生成、similarity search、統計処理などができるようです。統計処理にはRが利用されているみたい。
詳細は、J. Chem. Inf. Model.で発表されています。

 J. Chem. Inf. Model., 45 (2), 515 -522, 2005

分子の描画をX行×5列という感じでグリッド表示できるようで、これだけでも便利だなと思います。


banner_02.gif
人気ブログランキング(クリックして応援してね)




posted by わばのり at 22:53| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年10月03日

Cluster 3.0

クラスタリングは、遺伝子発現データの解析に必須の技術の1つですね。Cluster 3.0は、階層型クラスタリングだけではなく、k-Means, SOMs, PCAも含まれており、また、汎用性も高くとても便利だと思います。解析結果の視覚化にはJava TreeViewが使えます。また、Pyclusterが提供されており、Pythonからも利用できます。

Cluster 3.0を利用して、化合物のFingerprintなどをクラスタリングしたい場合は、類似度(距離)の計算法に注意が必要だと思います。Cluster 3.0ではPearson correlation, Euclidean distance, City-block distanceなどが選択可能ですが、Tanimoto coefficientは利用できないようです。

Pyclusterだとこの辺りも解決できるかな?


banner_02.gif
人気ブログランキング(クリックして応援してね)


posted by わばのり at 08:56| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年09月12日

Epydoc

mmlibのAPI Documentをよく見ると、"Generated by Epydoc"という文字がありました。早速、Epydocをインストールして、MMTKのAPI Documentを作成してみました。

1. Epydocのサイトからepydoc-3.0alpha3.win32.exeを取得し、インストール。

2. MMTKのAPI Documentの作成
 
 > cd C:\Python23\Scripts
 > python epydoc.py --html MMTK -o mmtk_docs

この操作で、C:\Python23\Scriptsの下にmmtk_docsができます。その下にあるindex.htmlを開くと以下の画面が表示されます。


epydo.png

epydocすばらしい!


banner_02.gif
人気ブログランキング(クリックして応援してね)
posted by わばのり at 08:50| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年09月11日

The Python Macromolecular Library (mmLib)

mmlibというPythonの拡張ライブラリがあります。APIを見るとmmCIFとPDBのparserだけではなく、重ね合わせや、TLS modelsによる解析ができるみたいです。TLS modelsについては以下の論文で報告されています。

Acta Cryst. D61,465-471

このようなPythonのAPI Referenceってどうやって作っているのでしょう?Javadocみたいなツールがあるのかな?調べてみます。


banner_02.gif
人気ブログランキング(クリックして応援してね)
posted by わばのり at 08:12| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年09月06日

MSDChem

EMBL-EBIで公開されているMSDChemはPDB中の低分子を検索できるサービスです。この中で使われている部分構造検索はJavaで実装されているらしく、以下のサイトでライブラリとそのAPIが公開されています。Oracle cartrigeとしても利用できるようです。便利ですね。

http://www.ebi.ac.uk/msd-srv/docs/moldoc/help.html


banner_02.gif
人気ブログランキング(クリックして応援してね)

posted by わばのり at 07:49| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年08月30日

EclipseでGroovy

GroovyのEclipse Pluginのインストールメモです。

Eclipse Pluginのインストール:
1. Eclipse(3.2)を起動し、[Help]→[Software Updates]→[Find and Install]

2. Search for new features to installを選択し、Nextボタンを押す。

3. New Remote Siteボタンを押し、新しく開くダイアログに以下の情報を入力し、Finishボタンを押す。

Name : Groovy Site
URL: http://dist.codehaus.org/groovy/distributions/update/

4. Groovy Siteをチェックし、Nextボタンを押す。

5. 後は、ライセンスに関する質問などに答え、進んでください。

実行例:
1. [File]→[New]→[Project]でJava Projectを選択しNextボタンを押す。

2. Project name(ここでは、TestGrPro)を入力しFinishボタンを押す。

3. Package Explorer内のTestGrProを選択し、右クリックする。そして、[New]→[Other]→[Groovy]→[Groovy Class]を選択し、Nextボタンを押す。

4. Name:(ここでは、TestGr)を入力し、Finishボタンを押す。そうするとTestGr.groovyファイルに以下のようなclassの雛形が作成されます(青字は私が追加したもの)。

 class TestGr {

  static void main(args) {
   print "Hello World!"
  }

 }

5. [Run]→[Run]→[Groovy]を選択し、Newボタンを押す。

6. Main classをSearchし、Runボタンを押す。

 Hello World!

と無事実行されました。


banner_02.gif
人気ブログランキング(クリックして応援してね)












posted by わばのり at 08:08| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年08月15日

BioMOBY

MOBYのクライアントの1つであるRemoraを使ってみました。通常では様々なWebサービスを個々に使って解析しなければならないタスクを、下図のようなワークフローを構築することにより、一度に解析することができます。

mocli.png

MOBYのように複数のWebサービスを連携して利用できる仕組みがあるとRemoraのFrequently Asked Workflows (FAW)のように利用頻度の高いワークフローをテンプレートとして再利用しやすいですし、研究の効率化にも繋がると思います。

ただ、サイトを見る限りでは、MOBYを使いこなすのは、私には大変そうだなという印象を受けました。日本にもユーザーグループが設立されているようですし、使いこなせれば便利なのは間違いないと思いますので、これから学んでいこうと思ってます。


banner_02.gif
人気ブログランキング(クリックして応援してね)


posted by わばのり at 07:42| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年07月31日

Vigyaan

Vigyaanは、CD-ROMのみでブートできるKNOPPIX(Linux)に以下の様なbio/chemical software群を含めたもので、ISOイメージとして公開されています。

Ghemical, Jmol, MPQC, Open Babel, PSI3, Rasmol, XDrawChem, Artemis, Bioperl, ClustalX, Cn3D, EMBOSS, Garlic, Glimmer, GROMACS,GP/Arka, MUMmer, NCBI tools, NJPlot などなど

利用法:
Vigyaanのサイトから、VigyaanCD-v1.0.isoをダウンロードし、CD-ROMを作成します。ISOイメージからCD-ROMの作成方法は以下のサイトが参考になります。

http://pocketstudio.jp/win/iso/cdrom.html

CD-ROMが作成できれば、あとは、CD-ROMからブートするだけです。上記ソフトウェアはメニューから使える状態になっています。Screenshotsを見るとVigyaanの概要がイメージできると思います。

インストールが苦手な方やソフトウェアを試しに使ってみたい方などにお勧めです。


banner_02.gif
人気ブログランキング(クリックして応援してね)
posted by わばのり at 14:12| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年07月29日

Cheminformatics.org

利用されている方も多いと思いますが、Cheminformatics.orgではQSAR, QSPR BBB penetration等のdatasetsが公開されています。sdfとして公開されたいるdatasetもあり、とても便利だと思います。これらは、論文でPublishされたものですので、論文の結果を見ながら先日紹介したSNNSでのモデリングの練習にも利用できると思います。また、Cheminformatics Linksもよくまとまったリンク集だと思います。


banner_02.gif
人気ブログランキング(クリックして応援してね)
posted by わばのり at 08:39| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年07月28日

Stuttgart Neural Network Simulator その2

実際にJavaNNSを動かしてみます。C:\Java\JavaNNS-Win以下にexamplesフォルダがあると思いますが、このフォルダの中に様々な例となるファイルが置かれています。今回は、manualでも取り上げられていますが、exampleファイルを使ってXOR回路の構築を試してみたいと思います。
XORの真理値表は以下のとおりです。

 X Y Z
 0 0 0
 0 1 1
 1 0 1
 1 1 0

1. JavaNNSを起動し、[File]->[Open]からexamplesフォルダにあるxor.netをOpenすると以下の画面が表示されます。同様に、xor.patもOpenします。ここで、xor.netには、NN自体の情報が保存されており、xor.patには、入力/出力データが保存されています。

SNNS_2.png

2. 解析に重要ないくつかのWindowを開きます。
 NNの構築等を制御するパネル:[Tools]->[Control Panel]
 学習過程(誤差)を確認できるグラフ:[View]->[Error graph]
 Logの出力:[View]->[Log]

3. 学習を始めます。[Control Panel]の[Init]ボタンを押しWeightの初期化を行います。次に、[Learning]タブを開き、[Learning function]リストからBackpropagationを選択し、Cyclesを4000とします。そして、[Learn All]ボタンを押します。

SNNS_3.png

おお!2500 cycleあたりから急激に誤差が少なくなっています。

4. NNでモデリングされた入力と出力の関係を見てみます。Networkが表示されている画面上でCtrlキーを押しながら2つの入力素子と1つの出力素子を選択します。次に、[View]->[Projection]を選択すると以下の結果が表示されます。

SNNS_4.png

確かに、入力と出力の関係が学習されています。なんか実際のアナログ回路でXORを作ったような入力と出力の関係でおもしろいです。

4.[File]->[Save data]で結果を保存します。保存の時に"Saving details"というダイアログがでますが、[Include input patterns]と[Include output patterns]にcheckを入れることにします。また、[FIle]->[Sava]で構築したnetworkも保存します。

最後に、結果を見てみます。今回学習には4つのデータが使われているのですが、NNの出力と合わせて出力されています。

#1.1
0 0 ← 入力(学習用データ)
0  ← 出力(学習用データ)
0.14919 ← NNの出力
#2.1
0 1
1
0.88629
#3.1
1 0
1
0.83977
#4.1
1 1
0
0.13761


banner_02.gif
人気ブログランキング(クリックして応援してね)
posted by わばのり at 08:19| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年07月27日

Stuttgart Neural Network Simulator その1

Stuttgart大学で開発されたニューラルネットワークシミュレータであるStuttgart Neural Network Simulator (SNNS)についてメモしたいと思います。

QSARを行うにあたり、MLR,PLS等の多変量解析だけではなくNNも有効なモデリング手段ですね。SNNSはQSARモデルの作成にも利用されており、論文でも多く見かけます。最近では、SNNSのJava GUI版(JavaNNS)が登場し、インストール作業も楽になったと思います。

それでは、JavaNNSをWindowsにインストールし、実際に起動してみます。
まず、SNNSのJavaNNSからJavaNNS-Win.zipをdownloadします。次に、ここでは、JavaNNS-Win.zipをC:\Java以下で解凍します。するとC:\Java\JavaNNS-Winが作成されます。

JavaNNSの起動ですが、コマンドプロンプトで、C:\Java\JavaNNS-Winに移動し、"java -jar JavaNNS.jar"で起動できます。一回目の起動時にSNNS_jkr.dllのインストール先が問われますが、通常は、デフォルトのPathで問題ないと思います。

問題なく起動できれば以下のような画面が現れます。

SNNS1.png


banner_02.gif
人気ブログランキング(クリックして応援してね)


posted by わばのり at 08:10| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年07月24日

Blue Obelisk

Blue Obeliskは、Chemoinformaticsに関連するアルゴリズム、データ等の共有/相互運用を目的とした組織で、Bioclipse, CDK, JOELibなど様々な開発グループが参加しています。

例えば、Cheminformatics関連のアルゴリズムを調べたい場合、Blue ObeliskのAlgorithm Dictionaryにアクセスすると、主なアルゴリズムはほとんど見つかると思います。基本的には、そのアルゴリズムの実装されているクラス名が示されていますので、ソースコードを読むことで理解を深めることができます。原著論文を読むよりも実装レベルで理解できるので便利です。
他にもBlue Obeliskの参加メンバーのBlogへのリンクもあり、このBlogもなかなかおもしろいと思います。

Blue Obeliskに関する論文もPublishされていますので、以下に挙げておきます。
 J. Chem. Inf. Model.; 2006; 46; 991-998


banner_02.gif
人気ブログランキング(クリックして応援してね)
posted by わばのり at 08:01| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年07月21日

BKChem

IronPythonという.NET上のPython処理系があるのですね。今まで.NETを利用する機会がなかったのですが、Pythonでなら書いてみたくなります。

さて、BKchemは、Pythonで書かれた分子エディタです。InChIやSMILESをサポートしています。SMILESから2次元構造を生成させる機能もあり便利です。下図の分子構造はSMILESから生成させたものです。

screen.png

PDFでExportもできますよ。


banner_02.gif
人気ブログランキング(クリックして応援してね)

posted by わばのり at 08:33| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年07月07日

Virtual Computational Chemistry Laboratory

Virtual Computational Chemistry Laboratory (VCCLAB)は、様々なQSARに関連するソフトウェアをWebアプリケーションとして提供しています。

ソフトウェアのインストール作業は、RPMなどのパッケージ管理システムの普及で楽になりましたが、それでも自力でコンパイル/インストールする機会は多くあると思います。この作業に不慣れだと、ソフトウェアを使って計算結果がほしいだけなのに、コンパイルが通らず挫折となってしまいます(私もいまだに挫折を味わいますが)。
VCCLABの目的の1つは、このあたりの解決にもあるようです。

現在、以下のon-line softwareが提供されています。
・ALOGPS 2.1 is the most accurate program to predict lipophilicity and aqueous solubility of molecules
・ASNN calculates highly predictive non-linear neural network models
・BABEL is molecular structure information interchange hub
・PNN produces clearly interpretable analytical non-linear models
・PCLIENT generates more than 3000 descriptors
・E-DRAGON calculates DRAGON molecular indices
・PLS implements original two-step descriptors selection procedure
・UFS produces a reduced data set that contains no redundancy and a minimal amount of multicollinearity

QSAR関連のソフトウェアが一通り提供されていますね。
このように、各ソフトウェアが単独で提供されているのではなく、ある目的を達成するための手段として、系統的に提供されているのがVCCLABの大きな特徴だと思います(VCCLAB Servers: http://www.vcclab.org/servers/ )。
このような形態でのアカデミアのコラボレーションはすばらしいと思います。


banner_02.gif
人気ブログランキング(クリックして応援してね)
posted by わばのり at 07:48| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年07月03日

Ligand.info

ネット上で公開されている化合物データは、以前に少し取り上げたZINC以外にもLigand.infoというサイトから取得できます。Ligand.infoでは、ChemBank, ChemPDB, KEGG, NCI, AKos GmbH, Asinex Ltd, TimTecの化合物データを集めて、提供しています。また、類似化合物の検索もJava Appletで行うことができます。
日本でもJSTが提供している有機化合物辞書データベース「日本化学物質辞書」は有名ですね。

今後、取得可能な化合物データ数が数千万と増えてくると、管理するのも大変になるでしょうが、技術的にはおもしろい課題が多く含まれていると思いますので、楽しみにしています。


banner_02.gif
人気ブログランキング(クリックして応援してね)
posted by わばのり at 08:31| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年07月02日

PubChem

PubChemは低分子情報を提供しているデータベースであり、NCBIにより開発されたものです。
"PubChem Comound","PubChem Bioassay","PubChem Substance"の3つのカテゴリーから構成されています。

PubMedを利用されている方は、検索Wordを入力するBoxの左側にあるSearchのList Boxを見ると、上記3つが選択可能であることが分かると思います。

例えば、生薬成分の1つであるbaicaleinについて、その構造式、物性、生理活性などをPubmedを使ってabstractベースに調べるのは、時間のかかる作業だと思います。この作業を全て代替してくれるわけではありませんが、PubChemを利用すると、構造式,IUPAC,Mw,XLogP値などを簡単に調べることができます。さらに、baicaleinのassayの結果として、以下の4つのassay結果が登録されており、このうち3つでActiveであると記載されております。

 NCTR Estrogen Receptor Binding Database (NCTRER)
 Compound Screen Assay, Human AKR1C4
 Compound Screen Assay, Human CLK1
 NCI AIDS Antiviral Assay

あとは、化合物名を入力しなくとも、部分構造検索も可能ですので、興味のある化合物(骨格)及びその類似体の生理活性を調べる用途にも使えると思います。ユーザーインターフェースはPubMedユーザには、お馴染みのものですので、使いやすいと思います。

さすがに生物医学分野の利用者を対象としているだけあって、ユーザの要求分析がしっかりなされたデータベースだなと思います。


banner_02.gif
人気ブログランキング(クリックして応援してね)
posted by わばのり at 15:21| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年06月27日

Chemical MIME

MIME(Multipurpose Internet Mail Extension)とは、従来電子メールで半角英文字といくつかの記号しか利用できなかった規格を画像データなど文字以外のデータを扱えるように拡張した規格です。現在では、Webサーバーとブラウザ間においてもMIMEを用いてデータタイプの判別が行われています。
MIMEタイプは「タイプ名/サブタイプ名」の文字列で表されています。

分子データファイルにもMIMEタイプが存在し、Chemical MIMEと呼ばれているようです。いくつかの例を示してみます。

chemical/x-pdb
chemical/x-mdl-molfile
chemical/x-xyz
chemical/x-gaussian

ここで、x-は正式なサブタイプ名が与えられていないことを示しています。

MozillaのPluginDocを見てみますと、以下のような対応になっていました。

MIMEタイプ プラグイン   
chemical/x-cdx CambridgeSoft ChemDraw
chemical/x-chemdraw CambridgeSoft ChemDraw
chemical/x-csml MDL Chime
chemical/x-gaussian-cube MDL Chime
chemical/x-gaussian-input MDL Chime
chemical/x-jcamp-dx MDL Chime
CambridgeSoft ChemDraw
chemical/x-mdl-molfile MDL Chime
chemical/x-mdl-rxnfile MDL Chime
chemical/x-mdl-tgf MDL Chime
chemical/x-mopac-input MDL Chime
chemical/x-pdb MDL Chime
chemical/x-spectra CambridgeSoft ChemDraw
chemical/x-xyz

分子データファイルを自分のサーバ上に置く場合などにChemical MIMEの設定に注意しようと思っています。


banner_02.gif
人気ブログランキング(クリックして応援してね)
posted by わばのり at 08:46| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年06月20日

PDBの二次データベース

現在、Protein Data Bank(PDB)には、約37000の立体構造が登録されているようです。年ごとの登録数をみると指数関数的に増加していますね。PDBの成熟に伴い、多くの二次データベースが派生していると思いますが、私自身は低分子とタンパク質の複合体構造に興味があるので、これに関連しそうなデータベースをメモしておきます。

MSDChem
 PDB中のLigandを部分構造,Fragments,Fingerprintなどで検索ができる。

The PDBbind Database
 Protein-ligand複合体の実測binding affinityデータが収められている。

Computed Ligand Binding Energy(CLiBE) Database
 コンピュータで計算したprotein-ligand複合体の相互作用エネルギーが収められている。

HIV Protease Database:
 HIV-1,HIV-2,SIVの立体構造が整理されて収められている。

Protein Ligand Database (PLD):
 Protein-ligand複合体のbinding affinityデータが実測/計算値共に収められている。



banner_02.gif
人気ブログランキング(クリックして応援してね)









posted by わばのり at 08:21| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

2006年06月04日

Tinkerで配座探索

FFEからのTinkerの操作がなかなか便利でしたので、FFEを使った分子の配座探索についてメモすることにしました。
配座解析には様々な方法が提案されていますが、今回は、Tinkerに含まれるDynamicを用いた分子動力学法(MD)により行いたいと思います。

例として、シクロヘキサンの配座解析を行ってみます。
1. 適当なソフトウェアでシクロヘキサンの三次元座標のmolファイルを準備する(cyclo.mol)。そして、babelを使ってtinker入力ファイルを作成する。
$ babel -imol cyclo.mol -otxyz cyclo.xyz

2. FFEを起動し、cyclo.xyzを読み込む。力場はmm2。
tin1.png

3. [Modeling Commands]タブをクリックし、[Optimize]をリストから選択し、[ロケット]ボタンを押す。
これにより、初期配座の最適化を行います。

4. 次に、[Dynamic]をリストから選択し、[Number of Steps]に100000を設定、[Temperature]に1000を設定、[Dump]に1を設定(あとはデフォルト値)する。そして、[ロケット]ボタンを押す。
ここでは、1000Kで100psのMDを行い、配座のサンプリングを1psごとに実施しています。

5. [Archive]をリストから選択し、[ロケット]ボタンを押す。
これで、cyclo.arcファイルが生成されます。これをFFEで開くとアニメーション表示で見ることができます。さらに、[Format]タブを選択し、ラジオボタン[X]を選択し、[ロケット]ボタンを押す。これにより、100個の配座が含まれるcyclo.xmolが生成されます。

6. cyclo.xmolをbabelによりsdf形式に変換する。
$ babel -ixyz cyclo.xmol -osdf cyclo.sdf
シクロヘキサンの配座を解析するために、ねじれ角(C1-C2-C3-C4)を計算します。ここでは、OELibを使った自作プログラム"torsion"を使って計算します。
$ torsion cyclo.sdf 1 2 3 4 > result.out
(torsionの詳細は、近々紹介しますね)

結果を下図に示します。横軸にシミュレーション時間、縦軸にねじれ角を示しています。複数のパターンがサンプリングされています。図右に代表的な2つのパターンを示します。
tin3-2.png

初期配座、シミュレーション時間、アンサンブルの検討など全くやってませんので、結果をまともに解釈はできませんが、FFE(Tinker)の使い方のメモということでご了承ください。
今回は、WindowsでFFEを使ってみましたが、インストールは超簡単ですし、本当に便利だなと思いました。

MDによるシクロヘキサンの配座解析は、下の書籍の中で詳しく紹介されていますので、興味のある方は読んでみてください。
「分子モデリング―基本原理と創薬への応用」江崎俊之訳 地人書館



banner_02.gif
人気ブログランキング(クリックして応援してね)





posted by わばのり at 08:03| Comment(0) | TrackBack(0) | その他ツール | このブログの読者になる | 更新情報をチェックする

広告


この広告は60日以上更新がないブログに表示がされております。

以下のいずれかの方法で非表示にすることが可能です。

・記事の投稿、編集をおこなう
・マイブログの【設定】 > 【広告設定】 より、「60日間更新が無い場合」 の 「広告を表示しない」にチェックを入れて保存する。


×

この広告は1年以上新しい記事の投稿がないブログに表示されております。