Rdkit|SMARTS语言应用

github:地址

Rdkit|SMARTS语言应用

from rdkit import Chem
from rdkit.Chem import AllChem
from rdkit.Chem import Draw
from rdkit.Chem.Scaffolds import MurckoScaffold

mol = Chem.MolFromSmiles("c1ccc(OC)cc1OC")
Chem.Draw.MolToImage(mol, size=(300,300))

子结构搜索HasSubstructMatch(patt)

  • quer:需要检索的片段
  • recursionPossible: (可选)
  • useChirality: 能够在匹配中使用立体化学
  • useQueryQueryMatches: 使用查询-查询匹配逻辑

patt = Chem.MolFromSmarts("OC") # # 导入甲氧基子结构
flag = mol.HasSubstructMatch(patt)
if flag:
    print("molecu m contains group -OCH3")
else:
    print("molecu m don't contain group -OCH3")

得到子结构序列GetSubstructMatch

  • query: 需要查询的分子
  • useChirality: 能够在匹配中使用立体化学
  • useQueryQueryMatches: 使用查询-查询匹配逻辑

smiles_list= ['CCCCC', 'CCNOCC', 'CSCCNC', 'COOCCNS', 'CSNNSP', 'CCCCS']
mol_list = [Chem.MolFromSmiles(x) for x in smiles_list]
Chem.Draw.MolsToGridImage(mol_list)

## 匹配特定模式的分子
query = Chem.MolFromSmarts('C*C')
match_list = [mol.GetSubstructMatch(query) for mol in mol_list]
print(match_list)
Chem.Draw.MolsToGridImage(mols=mol_list, highlightAtomLists=match_list, molsPerRow=3)

删除子结构AllChem.DeleteSubstructs(m,patt)

  • mol: 需要修饰的分子
  • query: 要用作子结构查询的分子
  • onlyFrags: (可选)如果设置了此切换,则只有在查询匹配原子所在的整个片段时,才会删除原子。默认值为0(删除原子,无论整个片段是否匹配)
  • useChirality:(可选)使用手性匹配子结构查询

del_mol = AllChem.DeleteSubstructs(mol, patt)
mols = [mol, del_mol]
Draw.MolsToGridImage(mols, molsPerRow=4, subImgSize=(200,200),legends=['' for x in mols])

取代基替换AllChem.ReplaceSubstructs(m, patt, rep)

  • mol: 待修饰的分子
  • query: 要用作子结构查询的分子
  • replacement: 用作替代物的分子
  • replaceAll: (可选)如果设置了此切换,则所有子结构匹配,查询将被替换为单个结果,否则每个结果都将包含单独的替代品。
  • replacementConnectionPoint: (可选)应该与之建立键的置换中原子的索引。
  • useChirality: (可选)使用手性匹配子结构查询

patt = Chem.MolFromSmarts("OC")
repsmis = ['F','Cl','Br','O']
mols = [mol]

for r in repsmis:
    r_mol = Chem.MolFromSmarts(r)
    res = AllChem.ReplaceSubstructs(mol, patt, r_mol)
    mols.extend(res)
    
smis = [Chem.MolToSmiles(mol) for mol in mols]
mols = [Chem.MolFromSmiles(smi) for smi in smis]
Draw.MolsToGridImage(mols, molsPerRow=3, subImgSize=(200,200), legends=[x for x in smis])

patt = Chem.MolFromSmarts("OC")
repsmis = ['F','Cl','Br','O']
mols = [mol]

for r in repsmis:
    r_mol = Chem.MolFromSmarts(r)
    res = AllChem.ReplaceSubstructs(mol, patt, r_mol, replaceAll=1)
    mols.extend(res)
    
smis = [Chem.MolToSmiles(mol) for mol in mols]
mols = [Chem.MolFromSmiles(smi) for smi in smis]
Draw.MolsToGridImage(mols, molsPerRow=3, subImgSize=(200,200), legends=[x for x in smis])

显示核心结构

Chem.ReplaceSidechains(m1,core) : 我们需要定义分子对象,骨架分子; 然后执行ReplaceSidechains函数,删除侧链就能得到骨架可视化。

  • mol: 需要修饰的分子
  • coreQuery: 用作识别核心的子结构查询的分子
  • useChirality: (可选)使用手性匹配子结构查询

mol = Chem.MolFromSmiles('BrCCc1cncnc1C(=O)O')
core = Chem.MolFromSmiles('c1cncnc1')
tmp = Chem.ReplaceSidechains(mol,core)
Draw.MolToImage(tmp, size=(250,250))

显示侧链结构 Chem.ReplaceCore

  • mol: 需要修饰的分子
  • coreQuery: 用作识别核心的子结构查询的分子
  • matches: mol.GetSubstractMatch(…)返回的类型的匹配向量
  • replaceDummies: 切换替换与查询中的虚设匹配的原子
  • labelByIndex: 切换使用连接到的核心原子的索引标记连接点伪原子。
  • requireDummyMatch: 如果分子的侧链连接在没有用假人标记的点上,它将被拒绝(返回“None”)

m1 = Chem.MolFromSmiles('BrCCc1cncnc1C(=O)O')
core = Chem.MolFromSmiles('c1cncnc1')
tmp = Chem.ReplaceCore(m1, core, labelByIndex=True)
print(tmp)
print(Chem.MolToSmiles(tmp))
Draw.MolToImage(tmp,size=(250,250))

分子拆分

Mol本身为多个分子组成

  • mol: 要使用的分子
  • asMols: 可选)如果提供了这一点并且为真,则碎片将作为分子而不是原子id返回。
  • sanitizeFrags: (可选)如果提供了这一点并且是真的,则碎片分子将在返回之前进行净化。
  • frags:(可选,默认为None)如果asMols为true,并且这是以空列表的形式提供的,则返回时结果将为mol.GetNumAtoms()长,并且将包含每个Atom的片段分配
  • fragsMolAtomMapping: (可选,默认为None)如果asMols为true,并且这是以空列表的形式提供的,则返回时的结果将是numFrags long,并且每个条目都将包含该片段中原子的索引:[(0,1,2,3),(4,5)]

rs = Chem.GetMolFrags(tmp, asMols=True)
print(len(rs))  # 2
smi0 = Chem.MolToSmiles(rs[0])
print(smi0)  # *CCBr
smi1 = Chem.MolToSmiles(rs[1])
print(smi1)  # [5*]C(=O)O

通过分子键拆分骨架Chem.FragmentOnBonds

  • mol:需要修饰的分子
  • bondIndices: 需要破坏键的索引
  • addDummies:切换虚设原子的添加以指示键断裂的位置
  • dummyLabels:用于提供用于假人的标签。每对中的第一个元素是用于替换键的beginAtom的伪元素的标签,第二个元素是用来替换键的endAtom的伪对象的标签。如果未提供,则用原子索引标记假人。
  • bondTypes: 用于提供在片段和虚设原子之间使用的键类型。如果未提供,则默认为单个。
  • cutsPerAtom: 用于返回在每个原子上进行的切割次数。

smi='C=CC(=O)N1CCC(CC1)C2CCNC3=C(C(=NN23)C4=CC=C(C=C4)OC5=CC=CC=C5)C(=O)N'
m = Chem.MolFromSmiles(smi)
Draw.MolToImage(m)

submols = m.GetSubstructMatches(Chem.MolFromSmarts('[!R][R]')) # R表示环上的原子,即匹配环上和非环上的原子
bonds_id = [m.GetBondBetweenAtoms(x,y).GetIdx() for x, y in submols] # 找到这两个原子之间的键
frags = Chem.FragmentOnBonds(m,bonds_id) # 切割得到碎片
smis= Chem.MolToSmiles(frags)
smis = smis.split('.')
mols=[m]
for smi in smis:
    mols.append(Chem.MolFromSmiles(smi))
Draw.MolsToGridImage(mols, molsPerRow=3, subImgSize=(300,300),legends=['' for x in mols], useSVG=True)

Murcho分解MurckoScaffold.GetScaffoldForMol

把分子中环结构提取出来,然后保留连接环结构的最少的键,如果该结构上的原子是双键连接,则保留双键,得到的结构称为Murcho骨架

m = Chem.MolFromSmiles('C=CC(=O)N1CCC(CC1)C2CCNC3=C(C(=NN23)C4=CC=C(C=C4)OC5=CC=CC=C5)C(=O)N')
tmp = MurckoScaffold.GetScaffoldForMol(m)
Draw.MolsToImage([m, tmp])

參考

https://blog.csdn.net/qq_36801966/article/details/106564664

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

发呆的比目鱼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值