RegExSMILES
RegExSMILESは、SDF形式で記録された化学データファイルから正規表現拡張SMILESを利用した化学構造検索を行うことができるソフトウェアです。
正規表現拡張SMILESは、既存の化学構造表記法SMILESを拡張して得られます。
1.波括弧「{」,「}」によって拡張する部分を指定できます。
2.波括弧中の縦棒「|」で、選択可能な表記を並べることができます。
3.波括弧直後のアスタリスク「*」とプラス「+」で、それぞれ、0回以上の繰り返しと1回以上の繰り返しを表すことができます。
化学構造検索は、以下のような手順で実行されます。
i) 正規表現拡張SMILESをグラフオートマトンに変換する。
ii) グラフオートマトンとCBGfinderによって、化学構造検索を行う。
CBGfinderは同研究室で開発されたグラフ構造探索ソフトウェアです。
Usage: RegExSMILES InputFileName [-ind] [-span] [-min] RegExSMILES
-ind:誘導部分グラフ検索
-span:全域部分グラフ検索
-min:最小部分グラフ検索
[-min]がない場合、最大部分グラフ検索
[-ind -span]とした場合、完全一致グラフ検索
また、芳香族を含んだ検索を行う場合、検索前にのAromaticConvで検索対象のSDFファイルを変換する必要があります。
新着情報
・2018/11/12 プラス「+」に対応しました。
・2019/10/25 Visual Studioおよびg++でコンパイル可能なソースコードを公開しました。
1.動作環境
Windows または g++が動作する環境
2.ダウンロード
3.使い方
芳香族置換基の結合パターン(オルト、メタ、パラ)を含む部分構造を検索する場合
$ RegExSMILES sample.sdf "Oc1c{(O)cc|c(O)c|cc(O)}cc1"
シクロアルカンを含む部分構造を検索する場合
$ RegExSMILES sample.sdf "C1C{C}*C1"
ベンゼンとアセン類を含む部分構造を検索する場合
$ RegExSMILES sample.sdf "c1ccc{c(c1c1)c}*cc1"
SDFファイル表示用推薦ソフト:MarvinView(ChemAxon)