人工智能AI系列 - 生物医药 - 分子搜索

官网:

官网链接

分子搜索

本例子提供了分子搜索,支持上传smi文件文件,使用RDKit提取分子特征,并基于milvus向量引擎进行后续检索。

引擎特性

  • 底层使用特征向量相似度搜索
  • 单台服务器十亿级数据的毫秒级搜索
  • 近实时搜索,支持分布式部署
  • 随时对数据进行插入、删除、搜索、更新等操作

分子背景介绍

SMILES(Simplified molecular input line entry system),简化分子线性输入规范,是一种用ASCII字符串明确描述分子结构的规范。 由于SMILES用一串字符来描述一个三维化学结构,它必然要将化学结构转化成一个生成树,此系统采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环打开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。 SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。

分子特征提取

RDKit是一个用于化学信息学的开源工具包,基于对化合物2D和3D分子操作,利用机器学习方法进行化合物描述符生成,fingerprint生成,化合物结构相似性计算,2D和3D分子展示等。将化学与机器学习联系起来的、非常实用的库。可以在很多种化学文件如mol2,mol,Smiles,sdf等之间互相转化,并能将其展示成2D、3D等形式供开发人员使用。

向量引擎索引策略

功能

  • 输入地址: http://localhost:8090
  • 上传数据文件
    1). 点击上传按钮上传文件.
    测试数据100条
    测试数据1万条

    2). 点击特征提取按钮. 等待文件解析,特征提取,特征存入向量引擎。通过console可以看到进度信息。

  • 分子搜索 输入分子smiles,点击查询,可以看到返回的清单,根据相似度排序。
P(=O)(OC[C@H]1O[C@@H](n2c3ncnc(N)c3nc2)[C@H](O)[C@@H]1F)(O)O

帮助信息

  • swagger接口文档:
    http://localhost:8089/swagger-ui.html

Git地址:
http://aias.top/AIAS/indexes/aias_bio.html

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值