化学分子sdf格式说明

Molfiles是包含单个化合物分子结构信息的文本文件。SDFs (structure data files)由一个至多个molfiles文件连接在一起组成,并含有关于化合物的其他信息。

如下为丙酮的molfile文件的内容:

下面为一个化合物的sdf文件信息: 

标题区(header block)

与molfile文件类似,sdf文件也包含一个三行的标题区。标题区内可能包含以下内容:

1.分子名字

2.生成分子结构的软件信息

3.注释

当然,标题区也可以为空行(除名字外)。

以上图为例,分子名称为"702",由"-OEChem-02271511112D"生成,注释为空。

数量行(counts line block)

该行由12个固定长度的字段组成,前11个字段长度均为3个字符,最后一个字段长度为6个字符。前两个字段最重要,给出了化合物中的原子数与键数:

该化合物有9个原子,8个键。H原子不被包含在内。

原子区(Atoms block)

数量行下面为原子区。

 前三个字段,长度均为10个字符,描述原子的X, Y, Z坐标,然后是长度为3个字符的元素符号字段(示例为氧O),随后为长度为2个字符的字段描述原子与同位素的质量差异(值介于-3到+4之间,除M··ISO性质外),随后为长度为3个字符的字段描述电荷(转换关系如下):

 随后还有其他长度均为3个字符的10个字段,很少用到(使用Progenesis SDF Studio或Progenesis MetaScope时可以为空)。

键区(Bonds block)

前两个字段为与键相关原子索引,第三个字段定义了键的类型,第四个字段为键的立体性质:

上述示例含义为:在原子1和原子2之间存在一个单键,无立体性质。

后面还有3个长度均为3字符的字段,很少用到,可以为空。

性质
电荷(Charge)

M··CHG后的第一个数字为电荷数(最大为8),如果化合物有更多的电荷数量,可以添加其他M··CHG行。每个电荷条目由两个长度为4个字符的字段组成,第一个为带电原子索引(从1开始),第二个为电荷数。示例含义为:添加一个电荷给第一个原子,电荷数为+2。

同位素(Isotope)

M··ISO后的第一个数字定义了改行的同位素数量(最大为8)。如果化合物有更多的同位素数量,可以添加其他M··ISO行。每个同位素条目由两个长度为4个字符的字段组成,第一个为带电原子索引(从1开始),第二个为原子实际质量数。示例含义为:第一个原子的原子质量为2。

 终止符(Terminator)

M··END属性不可缺少,必须位于其他性质之后。 

数据字段(Data fields)

自定义的化合物元数据可以放在此处。数据字段以含有>的标题开始,同一行放置数据字段名称,并放于<>内。标题行也可以包含其他文字(虽然通常略去)。

标题行后,数据字段可以包含长达200个字符的一行或多行作为该数据字段的值。

SDF分隔符(SDF separator)$$$$

位于每个记录(分子)的最后一行,只包含4个$。该分隔符在molfiles中并不需要。

 ref:

What is the correct format for compounds in SDF or MOL files? - Progenesis SDF Studio

2.5: Structural Data Files - Chemistry LibreTexts

https://www.herongyang.com/Molecule/SDF-Format-Specification.html

SDF文件是指“Structure-Data File”的缩写,是一种常用的化学信息存储文件格式SDF文件的语法格式是一种基于ASCII文本的格式,用于存储和交换化学结构和相关数据。 SDF文件的基本语法格式通常由多个数据块组成,每个数据块代表一个化合物。每个数据块由两个部分组成:属性块和属性值块。 属性块由标签(Tag)和属性名(Property Name)组成,标签用于唯一标识一个属性,而属性名则描述了属性的含义。例如,标签可以是“Molecular Formula”,属性名可以是“分子式”。属性块和属性值之间以空格或制表符分隔。 属性值块由属性值(Property Value)组成,属性值可以是单个值或多个值。属性值之间以分号或空格分隔。例如,如果属性块是“Molecular Formula”,那么属性值块可以是“C6H12O6”。 SDF文件还可以包含特定的标记,如“>”和“$$”,用于区分不同的数据类型和结构。例如,以“>”开头的行通常代表一个新的数据块,而以“$$”开头的行通常代表一个子结构或数据记录。 此外,SDF文件还支持注释和嵌入式的数据。注释通常以“//”开头,可以用于提供有关数据的额外解释或说明。嵌入式数据可以是其他格式的数据,如MOL文件、SMARTS等。 总体而言,SDF文件的语法格式简洁易懂,方便数据的存储和交换。通过了解和掌握SDF文件的语法格式,我们可以更好地理解和处理这种化学信息存储文件。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值