分子の化学構造を文字列で表すSMILES記法まとめ

スポンサーリンク
化学ツール
スポンサーリンク

SMILES (Simplified Molecular Input Line Entry System)は、分子の化学構造を文字列形式で表現する方法です。各要素を文字記号で表し、結合関係を括弧や文字で表すことで分子を表します。SMILESは、分子をコンピュータ上で処理する際に便利な形式であり、化学データベースの検索や計算などに利用されています。

SMILES記法の基本

SMILESは各原子を接点、結合を辺として表現する分子グラフで表現した文字列です。以下が主なルールです。(OpenSMILES拡張を含む)

・一般的に、1つの分子に対して複数の等しいSMILESを記述できる
・原子は角括弧でくくって示す。ただし、B(ホウ素), C(炭素), N(窒素), O(酸素), P(リン), S(硫黄), F(フッ素), Cl(塩素), Br(臭素), I(ヨウ素)は角括弧を省略できる。
・水素原子は不斉中心以外は記載しない。(例:メタノールCO、水O)
・環を形成している場合は切り開き、環を切り開いたところは数字でラベルを付けて、つながっていた節点同士を示す。(例:シクロヘキサンC1CCCCC1)
・丸括弧で分岐構造を示す。(例:2-プロパノールCC(C)O))
・イオンは+や-と数字を組み合わせて、角括弧でくくる。(例:アンモニウムイオン[NH4+]、鉄(Ⅱ)イオン[Fe+2])
・同位体は質量数を原子の前に示し、角括弧でくくる。(例:重水[2H]O[2H])
・結合は一重結合、二重結合、三重結合、四重結合はそれぞれ、-、=、#、$で示し、芳香環は:で示す。一重結合は通常省略する。
・二重結合につながっている一重結合の向きは/と\で示す。(\は右下向き)(例:cis-2-ブテンC/C=C\C、trans-2-ブテンC/C=C/C)
・結合がないことは.で示す。(例:酢酸ナトリウムCC(=O)[O-].[Na+] )
・芳香環を形成する炭素、窒素、酸素、リン、硫黄、ヒ素、セレン、ホウ素は小文字にする。(例:ベンゼンc1ccccc1、またはC1=CC=CC=C1、またはC1:C:C:C:C:C1)
・不斉中心には@、@@で示し、それぞれ左周り、右回りに原子団がついていることを示す。(例:L-乳酸C[C@@H](C(=O)O)O )

SMILESの表記例

以下に4物質のSMILESでの表記例を示します。

コメント