- 博客(52)
- 收藏
- 关注
原创 ModelScope1.15下载模型时报错
在ModelScope下载Meta-Llama-3-8B-Instruct模型时报错:1.15版本存在问题 #894。参考github的issue,应该当前版本modelscope 1.15有bug,降级为1.14后,可正常下载模型。
2024-07-04 10:47:20
431
原创 RAG:本地部署Langchain-Ollma(Windows)
RAG,即“Retrieval Augmented Generation”(检索增强生成),是一种结合了检索和生成技术的自然语言处理模型。它主要用于文本生成任务,能够利用外部知识源来增强生成的文本,从而提高生成质量。相较于微调技术,RAG能够更加短平快的吸纳本地知识并整合大模型进行问答。因此本地部署了一个基于Langchain🦜🔗 + Ollma🐫的RAG应用,以检索本地知识库生成回答。
2024-07-01 14:45:26
589
原创 Jupyter无法导入库,但能在终端导入的问题
激活某个Conda的环境后,尽管已经通过conda或者pip在这个环境中安装了一些🐍Python的库,但无法在Jupyter中导入,却能在终端成功导入。
2024-07-01 10:46:56
665
原创 解决Unsloth遇到NotImplementedError: No operator found for memory_efficient_attention_forward with inputs
【代码】解决Unsloth遇到NotImplementedError: No operator found for memory_efficient_attention_forward with inputs。
2024-06-25 16:52:46
1076
原创 解决“TypeError: prepare_inputs_for_inference() got an unexpected keyword argument ‘cache_position‘”问题
Nougat安装成功之后,没有报错,但在使用的时候报出:TypeError: prepare_inputs_for_inference() got an unexpected keyword argument 'cache_position’的问题。
2024-06-13 17:23:18
770
原创 解决conda中“requests.exceptions.HTTPError: 404 Client Error”问题
最简单粗暴的方式就是删除原来乱七八糟的channels,恢复出厂默认设置。再次使用conda时运行成功。出现该错误的原因是因为。
2024-06-12 13:46:41
544
原创 基于python的PDF文件解析器汇总
大多数已发表的科学文献目前以 PDF 格式存在,这是一种轻量级、普遍的文件格式,能够保持一致的文本布局和格式。对于人类读者而言, PDF格式的文件内容展示整洁且一致的布局有助于阅读,可以很容易地浏览一篇论文并识别标题和图表。但是对于计算机而言,PDF 格式是一个非常嘈杂的 ASCII 文件,并不包含任何结构化文本的信息。因此,我们期望从这些已经发表的PDF格式科学文献中重新提取文字、图片、表格、注释、目录等数据来构建格式化的信息用于机器学习。
2024-06-11 15:11:20
1571
原创 pandas读CSV错误:ParserError: Error tokenizing data. C error: Expected 2 fields in line **
用pandas读取CSV文件时报错,因为读取的是CSV文件,分隔默认采用的是逗号,该错误的可能原因为读取的数据中某一项包含两个字段,即值内可能包含两个逗号。
2024-06-06 14:51:16
248
原创 Error: listen tcp 127.0.0.1:11434: bind: Only one usage of each socket address
Windows中默认安装Ollama会开机启动。查看该进程运行的软件,发现ollama已经启动。
2024-05-16 16:41:05
2432
原创 FlashAttention(flash-attn)安装
Flash Attention是一种注意力算法,更有效地缩放基于transformer的模型,从而实现更快的训练和推理。由于很多llm模型运行的时候都需要安装flash_attn,比如Llama3,趟了不少坑,最后建议按照已有环境中Python、PyTorch和CUDA的版本精确下载特定的whl文件安装是最佳方式。
2024-05-08 15:24:21
6129
7
原创 深度学习在药物研发方面的进展
深度学习算法已被应用于药物发现和开发,为药物科学的计算决策打开了一扇新的大门。基于药物研发的深度学习模型的成功得益于深度学习算法在计算机视觉(Computer Vision, CV)和自然语言处理(Natural Language Processing, NLP)等领域的快速发展、高性能算力的进步以及生物医药数据库中信息的爆炸式增长。
2024-02-01 16:47:46
1371
1
原创 AlphaFold2预测结构能否直接用于虚拟筛选?
虽然AlphaFold2能够预测出较为精确的蛋白骨架结构,但将其直接作为蛋白受体结构进行分子对接结果并不十分理想。但是,通过去除AlphaFold2预测结构中的低置信区域或使用柔性对接方法针对关键侧链添加柔性等,有助于改善对接结果。AlphaFold2预测结构相较于 apo 结构做对接更准确。
2024-01-18 16:40:34
1060
原创 AlphaFold更新了!AlphaFold-latest
🔈:号外号外!联合在2023年10月31日发布了新一代的AlphaFold(显着提高了准确性和覆盖范围,主要包括了抗体结合结构预测、蛋白质-核酸复合物结构预测、小分子-蛋白结构预测和蛋白质残基的修饰结构预测等方面的重大更新,为加速生物医药研究开辟了全新的可能性。
2023-11-02 10:48:41
274
1
原创 AlphaFold-multimer 复合物结构预测
是DeepMind开发的AlphaFold项目的一个扩展,旨在预测蛋白质多聚体的三维结构。蛋白质多聚体是由多个蛋白质亚单位相互组装而成的结构,如酶、膜蛋白复合物和病毒颗粒。理解多聚体的结构对于揭示蛋白质的功能和相互作用非常重要。
2023-10-17 16:54:52
1240
原创 共价对接(Covalent Docking)
共价对接的关键思想是模拟潜在药物分子与蛋白质目标之间的共价键形成,通过计算得出最有可能形成共价结合的分子构象。这通常涉及到特定的功能基团,如亲核基团(Nucleophiles)和电子亲合基团(Electrophiles),它们能够参与共价键的形成。共价对接方法需要考虑这些功能基团的相互作用,并通过优化分子构象来实现共价键的形成。共价对接的应用领域包括药物发现和生物活性分子的设计。它可以用于研究一些药物的作用机制,开发具有共价作用的药物,或者设计特定的生物活性分子。
2023-10-16 16:54:47
1582
1
原创 RDKit计算分子属性
分子属性的计算在化学、药物研发和生物信息学等领域中具有重要意义。这些属性包括分子的物理化学性质、生物活性、构象信息和其他关键特征,它们对于药物筛选、分子设计、毒理学评估以及生物分子研究等任务至关重要。RDKit,作为一款强大的开源工具包,被广泛应用于计算和分析分子属性。本文将探讨如何使用RDKit来计算和分析分子属性。
2023-10-16 14:50:39
638
原创 机器学习的打分方程汇总
受到(Machine Learning)和(Deep Learning)等算法模型的创新性冲击,其应用范围涵盖了自然语言处理(Natural Language Processing)、自动驾驶(Autopilot)、金融分析(Financial analysis)和(Biopharmaceutical R&D)等多个领域。其中,应用深度学习算法在预测小分子药物与疾病靶点蛋白之间的结合亲和力方面的设计和应用变得日益重要。
2023-10-16 14:26:28
401
原创 诺贝尔奖(Nobel Prize)2023——生理/医学奖
2023年10月2日颁布了诺贝尔生理学/医学奖(Nobel Prize in Physiology or Medicine),Katalin Karikó(卡塔琳·考里科)和Drew Weissman(德鲁·韦斯曼)获得了该奖项,以表彰他们在核苷碱基修饰方面的发现,这些发现使得开发针对 COVID-19 的有效 mRNA 疫苗成为可能。
2023-10-08 15:34:30
533
原创 诺贝尔奖那些事儿
1901 年至 2023 年间,诺贝尔奖和经济学奖共颁发了 621次,共有 999 名个人和组织获得。诺贝尔奖是由瑞典斯德哥尔摩诺贝尔基金会管理的国际奖项,以瑞典发明家和企业家阿尔弗雷德·诺贝尔的财富为基础。1968年,瑞典央行设立了瑞典央行经济科学奖,以纪念诺贝尔奖创始人阿尔弗雷德·诺贝尔。每个奖项包括一枚奖牌、一张个人证书和一份现金奖励。
2023-10-07 16:53:15
116
原创 拉斯克奖(Lasker Award)2023
Lasker-DeBakey Clinical Medical Research Award(Lasker Award)是美国著名的医学科学奖项之一,也是世界上最重要的医学奖项之一,以表彰对临床医学研究做出杰出贡献的科学家和医学专家。
2023-09-22 11:32:03
283
原创 分子对接软件简介-2023
分子对接(Molecular Docking)是分子模拟的重要方法之一,其本质是两个或多个分子之间的识别过程,其过程涉及分子之间的空间匹配和能量匹配。这项技术在药物研发、生物医学研究和药物设计中具有广泛的应用,可以帮助科学家理解分子如何相互作用,从而更好地设计和优化药物分子,以提高药物的疗效和选择性。
2023-09-18 17:01:18
3527
1
原创 AutoDock Vina多配体对接 (Simultaneous Multiple Ligand Docking)
多配体分子对接(Simultaneous Multiple Ligand Docking, SMLD)或(Multiple Ligand Simultaneous Docking, MLSD)是一种分子对接技术,用于将多个配体(小分子药物候选物)同时对接到一个蛋白质分子的结合位点。与传统的分子对接技术不同,传统方法通常只考虑一个配体与一个蛋白质的相互作用。SMLD的目标是更高效地研究多个配体如何与同一个蛋白质相互作用,以寻找潜在的药物候选物。
2023-09-06 14:44:01
2068
2
原创 AutoDock Vina 对接计算(大批量)
AutoDock Vina是一种用于计算生物分子之间相互作用的计算工具,主要用于蛋白质和小分子(通常是潜在药物分子)之间的对接研究。它可以用于虚拟筛选、药物设计和生物分子结合位点的预测等多个应用领域。
2023-09-05 10:24:41
3513
10
原创 拆分PDBQT文件并将其转换为PDB格式
假设你用AutoDock Vina做了对接,那么所有预测的结合构象都被放入一个多构象 PDBQT 文件中,如果需要拆分后进行可视化分析,那么Vina官方自带了vina_split来进行拆分,可以用Open Babel进行格式转换。
2023-08-07 16:15:08
2409
原创 PyMol选择配体周围的氨基酸残基
经常使用做蛋白质和小分子的可视化,可以直接生成用于文章发表的高质量图片,图片生成可参考等教程。但是,用了这么久一直没发现。考虑到目前很多深度学习算法用口袋周围的氨基酸来计算预测亲和力、并在一些场景下我们想聚焦只关注配体周围局部范围内的氨基酸与其相互作用,因此需要在pymol中达到这一功能。在预设的Action中并不存在这种可扩展的选项,但pymol的命令行可以实现这一功能,很简单,只需一行即可。
2023-08-04 15:40:46
4207
1
原创 KEGG信号通路富集分析
当我们手头有转录组测序后的差异分析数据后,想更进一步的去分析这些差异基因在信号通路富集情况,其中一种办法是使用KEGG网站进行信号通路富集分析。
2022-11-16 16:47:54
17159
原创 AutoDock Vina与LeDock对接口袋参数文件互转
AutoDock Vina口袋参数转化为LeDockLeDock口袋参数转化为AutoDock Vina
2022-03-15 16:29:02
1126
原创 拆分大sdf文件并删除分子属性数据
SDF(Structure Data File)格式是一种用于表示化学分子结构信息的文件格式,由MDL Information Systems(MDL)开发。它是一种纯文本格式,可以用来描述小分子、大分子、反应、光谱等多种化学信息。SDF格式在化学信息学和药物设计领域中得到了广泛的应用。
2021-11-22 17:34:34
3474
3
原创 2021-07-16
下载、安装、配置、更新Miniconda下载、安装、配置、更新Miniconda一、下载Miniconda二、安装Miniconda三、配置Miniconda1. 报错2. 配置清华镜像3. 关掉默认开启Miniconda3.1 设置`auto_activate_base`为`false`3.2 退出conda3.3 激活conda四、更新Miniconda下载、安装、配置、更新Miniconda一、下载Minicondawget -c https://repo.continuum.io/minico
2021-07-16 11:09:44
415
原创 Schrödinger中Ligprep小分子三维结构生成详解
LigPrep可以生成准确的、能量最小化的三维分子结构。LigPrep还应用复杂的规则来纠正Lewis结构,消除配体的错误,以减少下游的计算错误。
2021-04-25 10:41:29
3753
原创 Ambertools计算蛋白质电荷
AmberTools是一个用于分子模拟和计算化学研究的软件套件,特别是在生物分子和生物大分子的计算中广泛使用。
2021-01-18 15:55:47
1695
1. Notebook:在Jupyter-lab中使用RDKit画分子2D图 2. 4个该教程所需的SDF格式的分子文件
2024-03-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人