自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(156)
  • 资源 (1)
  • 收藏
  • 关注

原创 【文献阅读】Tapioca:一种用于预测动态环境中蛋白质-蛋白质相互作用的平台

Tapioca整合了来自TPCA(Thermal denaturation)、CF-MS(cofractionation- mass spectrometry)或I-PISA(Ion-based precipitation)的MS曲线数据,以及蛋白质属性和组织特异性功能网络。与基于欧几里得距离的方法相比,Tapioca具有更优的预测性能。通过生成Tapioca获得的洞见,作者改进了TPCA的实验工作流程,以提高PPI预测的效率。

2026-01-04 11:25:24 614

原创 科研常用工具

本文汇总了生物信息学和蛋白质研究相关的常用在线工具与数据库。这些资源为蛋白质结构、功能、药物开发等研究提供了重要支持。

2025-12-25 11:12:53 123

原创 【python】AAindex的氨基酸理化属性提取

AAindex是一个包含氨基酸理化特性数值指标的数据库,分为AAindex1(氨基酸指标)、AAindex2(突变矩阵)和AAindex3(蛋白质接触势)三部分。aaindex软件包提供轻量级访问AAindex1数据的功能,无需额外安装库。使用方法简单:安装后通过Python代码即可获取氨基酸指标数据,并支持转换为DataFrame格式进行排序和保存。目前仅支持AAindex1,未来将扩展支持其他两部分。

2025-12-25 10:58:23 402

原创 【文献阅读】DP-Site:一种基于双重深度学习的蛋白质-肽相互作用位点预测方法

研究团队开发了一款名为DP-Site的AI工具,仅需分析蛋白质的氨基酸序列(“设计图”),就能精准锁定小分子药物的潜在“靶点”。DP-Site的核心创新在于其 “双专家会诊”模式。一位是“图像专家”,擅长分析序列的局部结构特征;另一位是“语义专家”,擅长理解序列的全局上下文信息。两者协同工作,使其预测综合性能(F1分数)达到0.661,超越此前所有方法。

2025-12-16 15:06:00 802

原创 【文献阅读】破解癌症“密码锁”!新探针发现大量隐藏靶点,抗癌药物研发将进入“淘金时代”

由中美科学家联合团队开发的NAIA化学探针,如同一架“蛋白质组显微镜”,首次在人类癌细胞中一次性成功锁定了超过6000个高价值药物靶点(半胱氨酸位点),其中大部分是此前从未被发现的。这项技术的关键突破在于其创新性的探针设计,使得探测效率比传统方法提升数倍。更重要的是,团队已将这份珍贵的“靶点藏宝图”数据完全公开。这意味着,全球的药物研发人员可以基于这份图谱,快速开发出针对这些新靶点的精准抗癌药物,大大加速了针对“不可成药”靶点的攻克进程,为未来癌症的个性化治疗带来了无限可能。

2025-12-12 10:54:02 449

原创 【文献阅读】“伪装”的化学钥匙:中国科学家发现靶向“不可成药”蛋白新方法,克服耐药瓶颈

95%的疾病相关蛋白因无药可靶向而被视为‘不可成药’。而今,一项发表于顶刊《JACS》的研究带来了破局利器:一种名为“二氧唑酮”的分子,它能像万能钥匙一样,精准打开数千个此前无法触及的药物靶点,甚至有望破解令抗癌药失效的耐药性难题。

2025-12-11 10:30:27 779

原创 使用ESM-2获取ContactMap

【代码】使用ESM-2获取ContactMap。

2025-05-30 11:10:22 489

原创 数据分析之药物-基因-代谢物

余弦相似度计算,密度图,柱状图,折线图

2025-05-04 11:30:16 540

原创 【文献阅读】建立高可信度的阴性样本,改进化合物-蛋白质相互作用预测

文章指出目前计算预测方法的性能受到可靠负样本缺乏的严重制约。因此,构建高质量负样本集是提升预测方法性能的关键。

2025-04-25 11:00:36 714

原创 数据处理代码

(2)使用pubchempy包下载药物信息。

2025-03-28 15:41:23 298

原创 解析DrugBank数据库数据|Python

DrugBank是一个综合性的生物信息学和化学信息学数据库,专门收录药物和靶点的详细信息。它由加拿大阿尔伯塔大学的Wishart 研究组维护,提供化学、药理学、相互作用、代谢、靶点等多方面的药物数据。DrugBank 结合了实验数据和计算预测,广泛应用于药物研发、精准医疗、生物信息学研究等领域。

2025-02-19 22:11:14 2537

原创 解析Uniprot数据库数据|Python

UniProtKB提供蛋白质序列、物种来源、功能等注释,并引 入注释评分来表示蛋白质注释完备程度和研究的丰富程度。

2025-02-19 19:47:26 1684

原创 分子指纹的学习|Rdkit

Morgan指纹(Circular fingerprints):基于分子的拓扑结构和半径参数生成的二进制指纹,可以用于描述分子的结构和相似性。MACCS指纹(MACCS keys):基于分子的结构和功能团片段生成的二进制指纹,可以用于进行药物相似性和虚拟筛选。

2025-02-11 14:29:13 1842

原创 在本地部署 DeepSeek 模型(Ollama + Chatbox)

DeepSeek作为一款开源且性能强大的大语言模型,提供了灵活的本地部署方案,让用户能够在本地环境中高效运行模型,同时保护数据隐私。

2025-02-10 20:43:57 1442

原创 Ubuntu 24.04 LTS系统安装Docker踩的坑

本文提供了一步一步的指南来在Ubuntu24.04系统上安装和启动Docker。

2025-01-08 17:46:15 3970 5

原创 FingerprintSimilarity和BulkTanimotoSimilarity的区别

化合物的指纹对于使用计算机考虑化合物的相似性是必需的。已经提出了各种评估方法,但是最常用的评估方法称为“ Tanimoto系数 ”。相似性原理(similar property principle)指出,总体相似的分子应具有相似的生物活性。

2024-11-15 17:35:37 591

原创 Blast+Aspera的安装与使用以及PSSM生成与解析

本文介绍了如何在Linux上安装和使用Blast+Aspera,感兴趣的朋友进来看一看瞧一瞧呀!

2024-10-24 15:58:28 1530

原创 如何得到两个蛋白质序列的一致性和相似性

identity指的是对应位置上相同残基的数目占总长度的百分数。similarity指的是对应位置上相同和相似的参基占总数的百分数。

2024-10-21 11:26:42 7651 1

原创 最新版FragPipe安装和使用教程

然后我们就看到了如下的界面,我们要配置MSFragger和Python环境,MSFragger可以在右边按钮直接下载,填写完基本信息之后下载,python环境的话,下载一个Anaconda。,然后找到base环境下的python路径就可以,或者新建一个python环境,这里的python要求是 Python 3.9, 3.10, or 3.11,不是这些版本都不行。,下载第二个包含有Java环境的,第一个要配置Java环境,很麻烦。第一步,假如我有一批原始的raw文件,然后根据图示操作即可。

2024-08-08 20:39:15 2485 1

原创 Python求均值,方差,标准差

numpy 计算的是总体标准差,参数ddof = 0;pandas 计算的是样本标准差,参数ddof = 1

2024-07-18 16:04:54 1412

原创 配置服务器

2024-07-17 15:09:37 1267

原创 Lasso回归学习

LASSO,全称Least absolute shrinkage and selection operator,是由统计学家Robert Tibshirani于1996年提出的一种回归分析方法。它通过在损失函数中加入L1正则化项,实现对模型参数的惩罚,使得一部分参数趋于零。这种稀疏性的特点使得LASSO回归在高维数据集中具有出色的性能。

2024-07-12 11:26:10 2247

原创 【白菜基础】初识蛋白质组学

蛋白质组学是基于高特异性、高灵敏度质谱仪,对特定生物样本中的全部蛋白质进行精确定性和定量的过程。

2024-04-07 20:57:07 2200

原创 【白菜基础】蛋白组学之生信分析(1)

通过MaxQuant分析获得的结果包含大量的生物信息学数据,例如蛋白质定量、修饰、蛋白质组成等。这些数据可以通过不同的生物信息学分析方法进行进一步的处理和解释:蛋白质鉴定和定量分析、通路和网络分析、功能富集分析等。

2024-04-07 20:22:08 15704 1

原创 【文献阅读】Bioorthogonal in situ assembly of nanomedicines as drug depots for extracellular drug delivery

这篇文章主要介绍了一种生物正交原位组装纳米药物的策略,用于在肿瘤区域内形成药物库,以增强药物在肿瘤组织中的滞留和富集,从而提高癌症治疗的疗效。该策略利用微环境中的轻微酸性诱导纳米颗粒表面的半胱氨酸暴露,随后半胱氨酸与另一个相邻纳米颗粒的2-氰基苯并噻唑基团发生生物正交反应,形成微米级药物库,以增强药物的滞留和富集。这种纳米药物的原位组装策略显著提高了针对细胞外靶向药物的抗转移疗效,并实现了多种药物的同时增强滞留和持续释放,用于联合混合化疗免疫疗法,最终引发强效的抗肿瘤免疫反应。这种纳米药物的原位组

2024-03-27 16:00:23 1910 3

原创 【文献阅读】What does AlphaFold mean for drug discovery?

作为 RoseTTAFold 的一个案例研究,他的团队预测了与 IL-12 受体结合的 IL-12 细胞因子的结构,这是确定干预相互作用的方法的关键一步。DeepMind 的 Kathryn Tunyasuvunakool 表示:“我们的感觉是,如果你有非常高置信度的预测,[分子对接]可能值得一试,但总的来说,我们预计需要更多的工具开发才能成为可靠​​的程序。“我们不会收拾好玩具回家。这些包括蛋白质配体结构的预测,变构口袋的可药性,蛋白质-蛋白质相互作用和RNA靶点,以及疫苗免疫原和新生治疗蛋白的设计。

2024-03-25 15:57:47 810

原创 【文献阅读】AlphaFold touted as next big thing for drug discovery — but is it?

这篇文章主要讨论了AlphaFold对蛋白质结构的预测以及Recursion公司利用AI工具MatchMaker进行药物发现的情况。文章提到了一些科学家对AlphaFold在药物发现中的潜力持乐观态度,但也有人对其影响持谨慎态度。同时,还涉及到其他公司和研究团队在这一领域的探索和努力。

2024-03-22 15:02:45 1063

原创 【文献阅读】Big data and benchmarking initiatives to bridge the gap from AlphaFold to drug design

最近的一项研究证实了AF2结构对于已知配体的回顾性对接研究效果不佳的结论,但有趣的是,他们发现AF2结构在前瞻性的虚拟筛选工作中取得了更好的结果。这一丰富的数据库包含了来自结构基因组学项目(如NIH蛋白质结构倡议)的成千上万个结构,该项目专门致力于增加“新折叠”的结构数量,为开发预测蛋白结构的计算方法提供了关键的训练数据集。这一知名的虚拟筛选工具。即使在预测结构中确定了可用于药物开发的口袋【pocket】,其内部的侧链也必须采取精确的构象排列,以适应给定的小分子配体,但这通常是无法正确预测的。

2024-03-21 22:18:16 1022 1

原创 dataframe处理

目的:截取两个dataframes一样的长度,拼接起来之后,随机打乱行。

2024-03-10 20:36:48 444

原创 Transformer学习(一)

学习了文本嵌入层的作用:无论是源文本嵌入还是目标文本嵌入,都是为了将文本中词汇的数字表示转变为向量表示, 希望在这样的高维空间捕捉词汇间的关系。学习并实现了文本嵌入层的类:Embeddings初始化函数以d_model: 词嵌入维度, 和vocab:词汇总数为参数,内部主要使用了nn中的预定层Embedding进行词嵌入。在forward函数中,将输入x传入到Embedding的实例化对象中, 然后乘以一个根号下d_model进行缩放, 控制数值大小。它的输出是文本嵌入后的结果。

2024-03-02 22:20:51 1436

原创 日常科研中经常使用的命令

记录科研过程中遇到的Linux命令!

2024-03-02 10:27:54 975

原创 学习GTEx数据库

组织类型(54):GTEx数据库简介(1) - 知乎 (zhihu.com)TCGA、ICGC、GTEx 数据库都是啥?- 知乎 (zhihu.com)GTEx:基因型和基因表达量关联数据库-CSDN博客。

2023-11-05 12:08:38 12006

原创 Overleaf小工具和报错解决方法积累

在线公式编辑工具:【1】【2】【3】【4】【5】

2023-07-18 23:50:09 2493

原创 小作文--流程图(练习1)

流程图(Flow chart/ Process diagram)传统意义上来说,流程图是两种主要类型,一是关于动物的生命周期,二是关于制造产品的工艺流程。但是近年来的话,也出现了非传统意义上的工艺流程,它并不是关于制造某个产品的过程,而是审批流程。

2023-06-07 22:51:07 1599 1

原创 预训练模型 ---- BERT架构

BERT是2018年10月由Google AI研究院提出的一种预训练模型。BERT的全称是Bidirectional Encoder Representation from Transformers。BERT在机器阅读理解顶级水平测试SQuAD1.1中表现出惊人的成绩:全部两个衡量指标上全面超越人类,并且在11种不同NLP测试中创出SOTA表现。包括将GLUE基准推高至80.4%(绝对改进7.6%),MultiNLI准确度达到86.7%(绝对改进5.6%),成为NLP发展史上的里程碑式的模型成就。

2023-05-25 17:19:44 3564 3

原创 多肽数据库

多肽数据库记录

2023-02-08 16:47:58 1953

原创 PDB文件格式说明查看方式记录

对于研究蛋白质性质的课题,都需要明确知道物质结构信息而非简单的序列信息。

2023-02-02 11:07:13 1194

转载 模型的第一层:详解torch.nn.Embedding和torch.nn.Linear

torch.nn.Embedding是用来将一个数字变成一个指定维度的向量的,比如数字1变成一个128维的向量,数字2变成另外一个128维的向量。不过,这128维的向量并不是永恒不变的,这些128维的向量是模型真正的输入(也就是模型的第1层)(数字1和2并不是,可以算作模型第0层),然后这128维的向量会参与模型训练并且得到更新,从而数字1会有一个更好的128维向量的表示。显然,这非常像全连接层,所以很多人说,Embedding层是全连接层的特例。

2023-01-30 11:47:55 1520

原创 安装Anaconda和在Jupyter notebook中切换内核遇到的问题

jupyter notebook里面切换内核遇到的关于ipython.core找不到模块和内核不能连接的问题

2022-08-18 16:39:16 2238

原创 用Networkx和matplotlib画图时无法保存图片的问题

问题:用 NetworkX 和 matplotlib画图时,想要保存为jpg或png格式的文件,结果发现保存的图片没有任何内容,只是一个白色的图像。

2022-06-23 22:20:32 1795

BP神经网络算法实现

自己用MATLAB写的BP神经网络代码,改一下数据能运行成功,每一行都有注释!

2018-04-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除