RegExSMILES


 RegExSMILESは、SDF形式で記録された化学データファイルから正規表現拡張SMILESを利用した化学構造検索を行うことができるソフトウェアです。
 正規表現拡張SMILESは、既存の化学構造表記法SMILESを拡張して得られます。
 1.波括弧「{」,「}」によって拡張する部分を指定できます。
 2.波括弧中の縦棒「|」で、選択可能な表記を並べることができます。
 3.波括弧直後のアスタリスク「*」とプラス「+」で、それぞれ、0回以上の繰り返しと1回以上の繰り返しを表すことができます。

 化学構造検索は、以下のような手順で実行されます。
 i) 正規表現拡張SMILESをグラフオートマトンに変換する。
 ii) グラフオートマトンとCBGfinderによって、化学構造検索を行う。
 CBGfinderは同研究室で開発されたグラフ構造探索ソフトウェアです。
 
 Usage: RegExSMILES InputFileName [-ind] [-span] [-min] RegExSMILES
 -ind:誘導部分グラフ検索
 -span:全域部分グラフ検索
 -min:最小部分グラフ検索
 [-min]がない場合、最大部分グラフ検索
 [-ind -span]とした場合、完全一致グラフ検索

 また、芳香族を含んだ検索を行う場合、検索前にのAromaticConvで検索対象のSDFファイルを変換する必要があります。
 

新着情報

 ・2018/11/12 プラス「+」に対応しました。
 ・2019/10/25 Visual Studioおよびg++でコンパイル可能なソースコードを公開しました。
 

1.動作環境

 Windows または g++が動作する環境

 

2.ダウンロード

 RegExSMILES.zip(Windows用実行ファイル)

 RegExSMILES_source.zip(Visual Studioおよびg++でコンパイル可能なソースコード)

3.使い方

芳香族置換基の結合パターン(オルト、メタ、パラ)を含む部分構造を検索する場合

$ RegExSMILES sample.sdf "Oc1c{(O)cc|c(O)c|cc(O)}cc1"

シクロアルカンを含む部分構造を検索する場合

$ RegExSMILES sample.sdf "C1C{C}*C1"

ベンゼンとアセン類を含む部分構造を検索する場合

$ RegExSMILES sample.sdf "c1ccc{c(c1c1)c}*cc1"


SDFファイル表示用推薦ソフト:MarvinView(ChemAxon)