2006年07月23日

CDKでMaximum Common Substructure

CDKで最大共通部分構造(Maximum Common Substructure:MCS)を検出する方法をメモしたいと思います。
MCSは、UniversalIsomorphismTesterクラスを用いて検出します。検出の流れを下図に示しています。まずは、getOverlaps(mol1,mol2)を用いて、Common Substructureを取得します。ここではmol1をTarget Structure、mol2をQuery Structureとします。

 List mcs_list = UniversalIsomorphismTester.getOverlaps(mol1,mol2);

次に、Common Substructureの入ったmcs_listの中から原子数が最大のものを検索します。これがMCSとなります。

 AtomContainer mcs_mol = (AtomContainer)mcs_list.get(0);
 int mcs_size = mcs_mol.getAtomCount();
 for(int i=1;i<mcs_list.size();i++){
  AtomContainer tmp_mol = (AtomContainer)mcs_list.get(i);
  if(tmp_mol.getAtomCount()>mcs_size){
   mcs_mol = tmp_mol;
   mcs_size = tmp_mol.getAtomCount();
 }
 mw.write(new Molecule(mcs_mol));

MCS.png



banner_02.gif
人気ブログランキング(クリックして応援してね)
posted by わばのり at 12:19| Comment(0) | TrackBack(0) | CDK | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック