QFIUNE-CSDN博客

原创【文献阅读】MINT：让AI“学会”蛋白质对话的语言，开启相互作用预测新时代

不再满足于看懂单个蛋白质，新一代蛋白质语言模型MINT通过跨链注意力机制，直接从海量序列中学习蛋白质之间如何“握手”与“交谈”，在抗体设计、癌症突变解读、病毒免疫逃逸预测等领域大放异彩。

2026-03-20 15:21:24 389

原创【文献阅读】PPLM——让语言模型真正“理解“蛋白质之间的对话

在AI for Science领域，一项来自新加坡国立大学的研究重磅登陆《自然·通讯》，为蛋白质-蛋白质相互作用预测带来了范式转变。传统单链蛋白质语言模型（如ESM2）虽强，却像是训练“独行侠”，无法从根本上理解两个蛋白如何协同工作。为此，研究者提出了 PPLM —— 一个开创性的蛋白质配对语言模型。PPLM的核心革命在于其联合编码的预训练方式。它通过独创的混合链内/链间注意力机制，在模型底层就让AI学会同时“阅读”一对蛋白质序列，从而直接习得超越单链模型的、富含交互信息的联合表征。

2026-03-13 11:16:27 543

原创【阅读笔记】MAP-X技术揭示疟原虫蛋白质复合物的动态变化

这篇文献讲的是一种叫MAP-X的新技术。它就像给疟原虫做‘全身热成像’，不破坏细胞，就能看清它体内所有的蛋白质在不同生长阶段是怎么组合、解散和重组装的。作者用这个技术，不仅验证了以前知道的一些蛋白质小组，还发现了一些新的小组和新成员，更重要的是，第一次看到了疟原虫蛋白质小组在整个生命周期里非常活跃的动态变化，甚至发现有些蛋白质是‘兼职’的。这为我们理解疟原虫的生存之道，以及开发新药，提供了全新的视角和海量的数据。

2026-03-12 20:29:52 317

原创【Linux】Conda环境安装和卸载+Mamba安装

在conda中添加新环境可以帮助隔离不同项目的依赖，避免版本冲突。

2026-03-11 14:48:26 100

原创 Ubuntu 24.04.1LTS Linux内核降级

系统升级内核后出现NVIDIA驱动失效问题，原因是内核版本(6.14.0-36)与驱动不兼容。解决方案：1）检查当前内核(uname -r)；2）列出可用旧内核(dpkg --list)；3）若目标内核(6.14.0-29)存在，直接修改grub配置(/etc/default/grub)，将GRUB_DEFAULT指向该内核；4）更新grub并重启。

2026-02-28 15:48:10 573

原创【文献阅读】从单靶点到生命系统：Polypharmacology Browser PPB3 深度解析，开启全景式靶标预测

PPB3是一个革命性的免费在线工具，它能基于ChEMBL海量数据，深度预测小分子对蛋白质、细胞系及生物体的多靶点活性。本文精读其核心论文，揭示其性能关键，并通过案例展示其如何超越前代及同类工具，是药物化学与计算生物学工作者的必备利器

2026-02-26 11:01:58 928

原创【文献阅读】Tapioca：一种用于预测动态环境中蛋白质-蛋白质相互作用的平台

Tapioca整合了来自TPCA（Thermal denaturation）、CF-MS（cofractionation- mass spectrometry）或I-PISA（Ion-based precipitation）的MS曲线数据，以及蛋白质属性和组织特异性功能网络。与基于欧几里得距离的方法相比，Tapioca具有更优的预测性能。通过生成Tapioca获得的洞见，作者改进了TPCA的实验工作流程，以提高PPI预测的效率。

2026-01-04 11:25:24 785

原创科研常用工具

本文汇总了生物信息学和蛋白质研究相关的常用在线工具与数据库。这些资源为蛋白质结构、功能、药物开发等研究提供了重要支持。

2025-12-25 11:12:53 249

原创【python】AAindex的氨基酸理化属性提取

AAindex是一个包含氨基酸理化特性数值指标的数据库，分为AAindex1（氨基酸指标）、AAindex2（突变矩阵）和AAindex3（蛋白质接触势）三部分。aaindex软件包提供轻量级访问AAindex1数据的功能，无需额外安装库。使用方法简单：安装后通过Python代码即可获取氨基酸指标数据，并支持转换为DataFrame格式进行排序和保存。目前仅支持AAindex1，未来将扩展支持其他两部分。

2025-12-25 10:58:23 551

原创【文献阅读】DP-Site：一种基于双重深度学习的蛋白质-肽相互作用位点预测方法

研究团队开发了一款名为DP-Site的AI工具，仅需分析蛋白质的氨基酸序列（“设计图”），就能精准锁定小分子药物的潜在“靶点”。DP-Site的核心创新在于其 “双专家会诊”模式。一位是“图像专家”，擅长分析序列的局部结构特征；另一位是“语义专家”，擅长理解序列的全局上下文信息。两者协同工作，使其预测综合性能（F1分数）达到0.661，超越此前所有方法。

2025-12-16 15:06:00 925

原创【文献阅读】破解癌症“密码锁”！新探针发现大量隐藏靶点，抗癌药物研发将进入“淘金时代”

由中美科学家联合团队开发的NAIA化学探针，如同一架“蛋白质组显微镜”，首次在人类癌细胞中一次性成功锁定了超过6000个高价值药物靶点（半胱氨酸位点），其中大部分是此前从未被发现的。这项技术的关键突破在于其创新性的探针设计，使得探测效率比传统方法提升数倍。更重要的是，团队已将这份珍贵的“靶点藏宝图”数据完全公开。这意味着，全球的药物研发人员可以基于这份图谱，快速开发出针对这些新靶点的精准抗癌药物，大大加速了针对“不可成药”靶点的攻克进程，为未来癌症的个性化治疗带来了无限可能。

2025-12-12 10:54:02 554

原创【文献阅读】“伪装”的化学钥匙：中国科学家发现靶向“不可成药”蛋白新方法，克服耐药瓶颈

95%的疾病相关蛋白因无药可靶向而被视为‘不可成药’。而今，一项发表于顶刊《JACS》的研究带来了破局利器：一种名为“二氧唑酮”的分子，它能像万能钥匙一样，精准打开数千个此前无法触及的药物靶点，甚至有望破解令抗癌药失效的耐药性难题。

2025-12-11 10:30:27 941

原创使用ESM-2获取ContactMap

【代码】使用ESM-2获取ContactMap。

2025-05-30 11:10:22 598

原创数据分析之药物-基因-代谢物

余弦相似度计算，密度图，柱状图，折线图

2025-05-04 11:30:16 657

原创【文献阅读】建立高可信度的阴性样本，改进化合物-蛋白质相互作用预测

文章指出目前计算预测方法的性能受到可靠负样本缺乏的严重制约。因此，构建高质量负样本集是提升预测方法性能的关键。

2025-04-25 11:00:36 833

原创数据处理代码

（2）使用pubchempy包下载药物信息。

2025-03-28 15:41:23 404

原创解析DrugBank数据库数据|Python

DrugBank是一个综合性的生物信息学和化学信息学数据库，专门收录药物和靶点的详细信息。它由加拿大阿尔伯塔大学的Wishart 研究组维护，提供化学、药理学、相互作用、代谢、靶点等多方面的药物数据。DrugBank 结合了实验数据和计算预测，广泛应用于药物研发、精准医疗、生物信息学研究等领域。

2025-02-19 22:11:14 2789

原创解析Uniprot数据库数据|Python

UniProtKB提供蛋白质序列、物种来源、功能等注释，并引入注释评分来表示蛋白质注释完备程度和研究的丰富程度。

2025-02-19 19:47:26 1882

原创分子指纹的学习|Rdkit

Morgan指纹（Circular fingerprints）：基于分子的拓扑结构和半径参数生成的二进制指纹，可以用于描述分子的结构和相似性。MACCS指纹（MACCS keys）：基于分子的结构和功能团片段生成的二进制指纹，可以用于进行药物相似性和虚拟筛选。

2025-02-11 14:29:13 2020

原创在本地部署 DeepSeek 模型（Ollama + Chatbox）

DeepSeek作为一款开源且性能强大的大语言模型，提供了灵活的本地部署方案，让用户能够在本地环境中高效运行模型，同时保护数据隐私。

2025-02-10 20:43:57 1560

原创 Ubuntu 24.04 LTS系统安装Docker踩的坑

本文提供了一步一步的指南来在Ubuntu24.04系统上安装和启动Docker。

2025-01-08 17:46:15 4174 5

原创 FingerprintSimilarity和BulkTanimotoSimilarity的区别

化合物的指纹对于使用计算机考虑化合物的相似性是必需的。已经提出了各种评估方法，但是最常用的评估方法称为“ Tanimoto系数 ”。相似性原理（similar property principle）指出，总体相似的分子应具有相似的生物活性。

2024-11-15 17:35:37 698

原创 Blast+Aspera的安装与使用以及PSSM生成与解析

本文介绍了如何在Linux上安装和使用Blast+Aspera，感兴趣的朋友进来看一看瞧一瞧呀！

2024-10-24 15:58:28 1667

原创如何得到两个蛋白质序列的一致性和相似性

identity指的是对应位置上相同残基的数目占总长度的百分数。similarity指的是对应位置上相同和相似的参基占总数的百分数。

2024-10-21 11:26:42 8314 5

原创最新版FragPipe安装和使用教程

然后我们就看到了如下的界面，我们要配置MSFragger和Python环境，MSFragger可以在右边按钮直接下载，填写完基本信息之后下载，python环境的话，下载一个Anaconda。，然后找到base环境下的python路径就可以，或者新建一个python环境，这里的python要求是 Python 3.9, 3.10, or 3.11，不是这些版本都不行。，下载第二个包含有Java环境的，第一个要配置Java环境，很麻烦。第一步，假如我有一批原始的raw文件，然后根据图示操作即可。

2024-08-08 20:39:15 2725 1

原创 Python求均值，方差，标准差

numpy 计算的是总体标准差，参数ddof = 0；pandas 计算的是样本标准差，参数ddof = 1

2024-07-18 16:04:54 1487

原创配置服务器

无

2024-07-17 15:09:37 1318

原创 Lasso回归学习

LASSO，全称Least absolute shrinkage and selection operator，是由统计学家Robert Tibshirani于1996年提出的一种回归分析方法。它通过在损失函数中加入L1正则化项，实现对模型参数的惩罚，使得一部分参数趋于零。这种稀疏性的特点使得LASSO回归在高维数据集中具有出色的性能。

2024-07-12 11:26:10 2351

原创【白菜基础】初识蛋白质组学

蛋白质组学是基于高特异性、高灵敏度质谱仪，对特定生物样本中的全部蛋白质进行精确定性和定量的过程。

2024-04-07 20:57:07 2334

原创【白菜基础】蛋白组学之生信分析（1）

通过MaxQuant分析获得的结果包含大量的生物信息学数据，例如蛋白质定量、修饰、蛋白质组成等。这些数据可以通过不同的生物信息学分析方法进行进一步的处理和解释：蛋白质鉴定和定量分析、通路和网络分析、功能富集分析等。

2024-04-07 20:22:08 16615 1

原创【文献阅读】Bioorthogonal in situ assembly of nanomedicines as drug depots for extracellular drug delivery

这篇文章主要介绍了一种生物正交原位组装纳米药物的策略，用于在肿瘤区域内形成药物库，以增强药物在肿瘤组织中的滞留和富集，从而提高癌症治疗的疗效。该策略利用微环境中的轻微酸性诱导纳米颗粒表面的半胱氨酸暴露，随后半胱氨酸与另一个相邻纳米颗粒的2-氰基苯并噻唑基团发生生物正交反应，形成微米级药物库，以增强药物的滞留和富集。这种纳米药物的原位组装策略显著提高了针对细胞外靶向药物的抗转移疗效，并实现了多种药物的同时增强滞留和持续释放，用于联合混合化疗免疫疗法，最终引发强效的抗肿瘤免疫反应。这种纳米药物的原位组

2024-03-27 16:00:23 2032 3

原创【文献阅读】What does AlphaFold mean for drug discovery?

作为 RoseTTAFold 的一个案例研究，他的团队预测了与 IL-12 受体结合的 IL-12 细胞因子的结构，这是确定干预相互作用的方法的关键一步。DeepMind 的 Kathryn Tunyasuvunakool 表示：“我们的感觉是，如果你有非常高置信度的预测，[分子对接]可能值得一试，但总的来说，我们预计需要更多的工具开发才能成为可靠的程序。“我们不会收拾好玩具回家。这些包括蛋白质配体结构的预测，变构口袋的可药性，蛋白质-蛋白质相互作用和RNA靶点，以及疫苗免疫原和新生治疗蛋白的设计。

2024-03-25 15:57:47 877

BP神经网络算法实现

空空如也