自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(138)
  • 资源 (1)
  • 收藏
  • 关注

原创 最新版FragPipe安装和使用教程

然后我们就看到了如下的界面,我们要配置MSFragger和Python环境,MSFragger可以在右边按钮直接下载,填写完基本信息之后下载,python环境的话,下载一个Anaconda。,然后找到base环境下的python路径就可以,或者新建一个python环境,这里的python要求是 Python 3.9, 3.10, or 3.11,不是这些版本都不行。,下载第二个包含有Java环境的,第一个要配置Java环境,很麻烦。第一步,假如我有一批原始的raw文件,然后根据图示操作即可。

2024-08-08 20:39:15 571

原创 Python求均值,方差,标准差

numpy 计算的是总体标准差,参数ddof = 0;pandas 计算的是样本标准差,参数ddof = 1

2024-07-18 16:04:54 785

原创 配置服务器

2024-07-17 15:09:37 1002

原创 Lasso回归学习

LASSO,全称Least absolute shrinkage and selection operator,是由统计学家Robert Tibshirani于1996年提出的一种回归分析方法。它通过在损失函数中加入L1正则化项,实现对模型参数的惩罚,使得一部分参数趋于零。这种稀疏性的特点使得LASSO回归在高维数据集中具有出色的性能。

2024-07-12 11:26:10 1028

原创 【白菜基础】初识蛋白质组学

蛋白质组学是基于高特异性、高灵敏度质谱仪,对特定生物样本中的全部蛋白质进行精确定性和定量的过程。

2024-04-07 20:57:07 984

原创 【白菜基础】蛋白组学之生信分析(1)

通过MaxQuant分析获得的结果包含大量的生物信息学数据,例如蛋白质定量、修饰、蛋白质组成等。这些数据可以通过不同的生物信息学分析方法进行进一步的处理和解释:蛋白质鉴定和定量分析、通路和网络分析、功能富集分析等。

2024-04-07 20:22:08 2911

原创 【文献阅读】Bioorthogonal in situ assembly of nanomedicines as drug depots for extracellular drug delivery

这篇文章主要介绍了一种生物正交原位组装纳米药物的策略,用于在肿瘤区域内形成药物库,以增强药物在肿瘤组织中的滞留和富集,从而提高癌症治疗的疗效。该策略利用微环境中的轻微酸性诱导纳米颗粒表面的半胱氨酸暴露,随后半胱氨酸与另一个相邻纳米颗粒的2-氰基苯并噻唑基团发生生物正交反应,形成微米级药物库,以增强药物的滞留和富集。这种纳米药物的原位组装策略显著提高了针对细胞外靶向药物的抗转移疗效,并实现了多种药物的同时增强滞留和持续释放,用于联合混合化疗免疫疗法,最终引发强效的抗肿瘤免疫反应。这种纳米药物的原位组

2024-03-27 16:00:23 1173 3

原创 【文献阅读】What does AlphaFold mean for drug discovery?

作为 RoseTTAFold 的一个案例研究,他的团队预测了与 IL-12 受体结合的 IL-12 细胞因子的结构,这是确定干预相互作用的方法的关键一步。DeepMind 的 Kathryn Tunyasuvunakool 表示:“我们的感觉是,如果你有非常高置信度的预测,[分子对接]可能值得一试,但总的来说,我们预计需要更多的工具开发才能成为可靠​​的程序。“我们不会收拾好玩具回家。这些包括蛋白质配体结构的预测,变构口袋的可药性,蛋白质-蛋白质相互作用和RNA靶点,以及疫苗免疫原和新生治疗蛋白的设计。

2024-03-25 15:57:47 626

原创 【文献阅读】AlphaFold touted as next big thing for drug discovery — but is it?

这篇文章主要讨论了AlphaFold对蛋白质结构的预测以及Recursion公司利用AI工具MatchMaker进行药物发现的情况。文章提到了一些科学家对AlphaFold在药物发现中的潜力持乐观态度,但也有人对其影响持谨慎态度。同时,还涉及到其他公司和研究团队在这一领域的探索和努力。

2024-03-22 15:02:45 830

原创 【文献阅读】Big data and benchmarking initiatives to bridge the gap from AlphaFold to drug design

最近的一项研究证实了AF2结构对于已知配体的回顾性对接研究效果不佳的结论,但有趣的是,他们发现AF2结构在前瞻性的虚拟筛选工作中取得了更好的结果。这一丰富的数据库包含了来自结构基因组学项目(如NIH蛋白质结构倡议)的成千上万个结构,该项目专门致力于增加“新折叠”的结构数量,为开发预测蛋白结构的计算方法提供了关键的训练数据集。这一知名的虚拟筛选工具。即使在预测结构中确定了可用于药物开发的口袋【pocket】,其内部的侧链也必须采取精确的构象排列,以适应给定的小分子配体,但这通常是无法正确预测的。

2024-03-21 22:18:16 891 1

原创 dataframe处理

目的:截取两个dataframes一样的长度,拼接起来之后,随机打乱行。

2024-03-10 20:36:48 366

原创 Transformer学习(一)

学习了文本嵌入层的作用:无论是源文本嵌入还是目标文本嵌入,都是为了将文本中词汇的数字表示转变为向量表示, 希望在这样的高维空间捕捉词汇间的关系。学习并实现了文本嵌入层的类:Embeddings初始化函数以d_model: 词嵌入维度, 和vocab:词汇总数为参数,内部主要使用了nn中的预定层Embedding进行词嵌入。在forward函数中,将输入x传入到Embedding的实例化对象中, 然后乘以一个根号下d_model进行缩放, 控制数值大小。它的输出是文本嵌入后的结果。

2024-03-02 22:20:51 1088

原创 日常科研中经常使用的命令

记录科研过程中遇到的Linux命令!

2024-03-02 10:27:54 880

原创 学习GTEx数据库

组织类型(54):GTEx数据库简介(1) - 知乎 (zhihu.com)TCGA、ICGC、GTEx 数据库都是啥?- 知乎 (zhihu.com)GTEx:基因型和基因表达量关联数据库-CSDN博客。

2023-11-05 12:08:38 5457

原创 Overleaf小工具和报错解决方法积累

在线公式编辑工具:【1】【2】【3】【4】【5】

2023-07-18 23:50:09 1698

原创 小作文--流程图(练习1)

流程图(Flow chart/ Process diagram)传统意义上来说,流程图是两种主要类型,一是关于动物的生命周期,二是关于制造产品的工艺流程。但是近年来的话,也出现了非传统意义上的工艺流程,它并不是关于制造某个产品的过程,而是审批流程。

2023-06-07 22:51:07 1036 1

原创 预训练模型 ---- BERT架构

BERT是2018年10月由Google AI研究院提出的一种预训练模型。BERT的全称是Bidirectional Encoder Representation from Transformers。BERT在机器阅读理解顶级水平测试SQuAD1.1中表现出惊人的成绩:全部两个衡量指标上全面超越人类,并且在11种不同NLP测试中创出SOTA表现。包括将GLUE基准推高至80.4%(绝对改进7.6%),MultiNLI准确度达到86.7%(绝对改进5.6%),成为NLP发展史上的里程碑式的模型成就。

2023-05-25 17:19:44 2914 3

原创 多肽数据库

多肽数据库记录

2023-02-08 16:47:58 1281

原创 PDB文件格式说明查看方式记录

对于研究蛋白质性质的课题,都需要明确知道物质结构信息而非简单的序列信息。

2023-02-02 11:07:13 788

转载 模型的第一层:详解torch.nn.Embedding和torch.nn.Linear

torch.nn.Embedding是用来将一个数字变成一个指定维度的向量的,比如数字1变成一个128维的向量,数字2变成另外一个128维的向量。不过,这128维的向量并不是永恒不变的,这些128维的向量是模型真正的输入(也就是模型的第1层)(数字1和2并不是,可以算作模型第0层),然后这128维的向量会参与模型训练并且得到更新,从而数字1会有一个更好的128维向量的表示。显然,这非常像全连接层,所以很多人说,Embedding层是全连接层的特例。

2023-01-30 11:47:55 1228

原创 安装Anaconda和在Jupyter notebook中切换内核遇到的问题

jupyter notebook里面切换内核遇到的关于ipython.core找不到模块和内核不能连接的问题

2022-08-18 16:39:16 1963

原创 用Networkx和matplotlib画图时无法保存图片的问题

问题:用 NetworkX 和 matplotlib画图时,想要保存为jpg或png格式的文件,结果发现保存的图片没有任何内容,只是一个白色的图像。

2022-06-23 22:20:32 1489

原创 RDKit学习

@Time : 2022/5/25 17:39@Author : Qiufen.Chen@FileName: learn_rdkit.py@Software: PyCharm'''from rdkit import Chemfrom rdkit.Chem import Draw, Descriptors, Crippen, MolSurf, Lipinskifrom rdkit.Chem.Crippen import MolLogP, MolMRfrom rdkit.Chem.Draw .

2022-05-31 22:32:50 1287

原创 回归问题归一化总结

在用深度学习做回归问题时,对数据进行标准化处理是一个共识,将数据标准化,利用标准化后得数据进行数据分析。不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。那么对标签是否进行归一化就需要从实际问题出发,比如我在做药物分子溶解度预测时,溶解度的取值从0-5000,值的分布范围较大,这就需要进行归一化处理,因为我这个数据中出现了奇异

2022-05-25 15:54:38 5263 2

原创 python创建文件夹

函数形式def mkdir(path): isExists = os.path.exists(path) if not isExists: os.makedirs(path) print('Directory create successfully!') return True else: print('Directory already exists!') return Falsesave_d

2022-04-22 11:21:48 961

原创 python将下三角矩阵补全成对称矩阵

# Author QFIUNE# coding=utf-8# @Time: 2022/4/18 12:25# @File: 222.py# @Software: PyCharm# @contact: 1760812842@qq.comimport numpydef square_mat_in_trilu_indices(n): '''Return a n x n symmetric index matrix, in which the elements are the i.

2022-04-22 09:58:54 1126

原创 python修改图片尺寸和DPI

使用PIL库pip3 install pillow'''# !/usr/bin/python3# -*- coding: utf-8 -*-@Time : 2022/4/21 17:16@Author : Qiufen.Chen@FileName: 111.py@Software: PyCharm'''from PIL import Imagedef Image_PreProcessing(): # 待处理图片存储路径 im = Image.open('C:/User

2022-04-21 17:25:56 3794

原创 MemBrain2.0_论文

MemBrain-contact 2.0: a new two-stage machine learning model for the prediction enhancement of transmembrane protein residue contacts in the full chainMemBrain-contact 2.0:一种新的两阶段机器学习模型,用于预测全链跨膜蛋白残基接触的增强AbstractMotivationInter-residue contacts in p

2022-04-17 20:18:46 8107

原创 学习RDKit

最近要做一个药物分子属性预测的课题,在跑别人现成的模型时,出现了花两天时间都解决不了的Bug。这让我开始反思,无脑套用网上的模型真的好吗?之前对“一知半解”嗤之以鼻,觉得自己怎么样都不会成为那个对知识对学问敷衍的人。可是为了赶进度,自己慢慢的也变成了一个知其然而不知其所以然的人了。无意中读到蔡元培先生的北大就职演说里上说的话:平时则放荡冶游,考试则熟读讲义,不问学问之有无,惟争分数之多寡;试验既终,书籍束之高阁,毫不过问,敷衍三四年,潦草塞责,文凭到手,即可借此活动于社会,岂非与求学初衷大相背驰乎?

2022-04-15 19:30:45 3003

原创 stochastic masks——随机掩码

阅读不能停,保持日常输入大于输出【通过学习随机掩码来解释生物序列的神经网络】切入正题之前,去了解了一下“掩码”的概念。参考:浅析深度学习中的mask操作_guofei_fly的博客-CSDN博客_深度学习mask参考:图像中的掩膜(Mask)是什么_bitcarmanlee的博客-CSDN博客_掩膜mask(掩码、掩膜)是深度学习中的常见操作。简单而言,其相当于在原始张量上盖上一层掩膜,从而屏蔽或选择一些特定元素,因此常用于构建张量的过滤器。按照上述定义,非线性激活函数Rel

2022-04-08 21:25:08 3931

原创 图的基本知识

一、图的背景来源:知乎------图解:什么是“图”? - 知乎图论的起源是基于一个现实生活中的事例:河中心有两个小岛。小岛与河的两岸有七条桥连接。在所有桥都只能走一遍的前提下,如何才能把这个地方所有的桥都走遍?欧拉在1735年提出,并没有方法能圆满解决这个问题,他更在第二年发表在论文《柯尼斯堡的七桥》中,证明符合条件的走法并不存在。欧拉把实际的抽象问题简化为平面上的点与线组合,每一座桥视为一条线,桥所连接的地区视为点。这样若从某点出发后最后再回到这点,则这一点的线数必须是偶

2022-01-12 16:27:23 1661

原创 Linux:No space left on device的解决方法

参考:linux "No space left on device" 磁盘空间解决办法 - 小姐,请叫我“序员”好吗 - 博客园 (cnblogs.com)什么是inode?inode在linux中,每个文件,不管大小是多少都会对应一个inode,inode就是一个专门用来保存文件属性,权限和指针(指向block)inode满了会导致什么问题?首先,在linux中,有两个概念,就是block和inode。block:用于存放实际数据;inode:存放文件属性,只要这两个其中一个占.

2021-12-01 17:34:16 2828

原创 python按列合并两个等长txt文件

(1.txt) (2.txt)'''# !/usr/bin/python3# -*- coding: utf-8 -*-@Time : 2021/11/22 19:11@Author : Qiufen.Chen@FileName: distance.py@Software: ...

2021-11-22 19:36:13 900

转载 Ubuntu 18.04.6 LTS (CPU版) 安装CCMpred

摘自:ubuntu18.04安装CCMpred_Gentlezzx的博客-CSDN博客(1)首先从官网下载CCMpred安装包,添加环境变量chenqiufen@cpuserver-14:~$ git clone --depth=50 --branch=master https://github.com/soedinglab/CCMpred.g itchenqiufen@cpuserver.

2021-10-17 17:30:36 941 4

原创 在 Linux 上一次性批量重命名一组文件

我有一组文件如下图所示,我想把它的后缀名.pdb全部改成.fasta。chenqiufen@cpuserver-14:~$ cd /home/chenqiufen/ContactMap/data/seq_data/chenqiufen@cpuserver-14:~/ContactMap/data/seq_data$ ls *.pdbchenqiufen@cpuserver-14:~/ContactMap/data/seq_data$ rename 's/pdb/fasta/' *....

2021-10-14 14:50:23 413

原创 查看Linux服务器性能

参考:(1)linux服务器性能查看_陈袁的博客-CSDN博客_linux查看性能(2)Linux查看服务器资源配置及性能 - 知乎写在前面当我们在使用服务器时,如果发现服务器运行较慢,使用top、 uptime 、 w等命令查看一下,那些进程耗费CPU资源过多,如果是垃圾进程,可以杀死。服务器性能好坏如何分辨?有哪些衡量标准?摘自知乎:服务器性能好坏如何分辨?有哪些衡量标准? - 知乎服务器是整个网络系统和计算平台的核心,许多重要的数据都保存在服务器上,很多网络服务都在服务器..

2021-10-11 16:38:59 4372 4

原创 部署“曙光”服务器深度学习环境

(1)阅读相关文档(2)Anaconda 安装 (3)pip install torch出现如下的错误:依据提示添加了各种channels,但还是失败,然后想到了手动下载torch安装包,还是出错:于是乎,重新安装anaconda并新建环境安装annaconda下载链接:Anaconda | Individual Editionhttps://www.anaconda.com/products/individual#macos(1)在家目录下创建文件夹并运行安..

2021-10-09 20:30:45 1646

原创 使用scp把另外一台服务器上的文件夹/文件拷贝到当前服务器

目的:把另外一台服务器上的文件夹拷贝到当前服务器上一、复制文件夹(1)从远端服务器将文件夹拷回当前服务器# scp -r 远端服务器账号@IP:源目录 目标路径scp -r cqfnenu@XX.XX.XX.XX:/home/cqfnenu/contact-prediction /home/chenqiufen/遇到了问题如下所示(远端主机标识已更改):REMOTE HOST IDENTIFICATION HAS CHANGED! 根据提示解决方法如下:方法:使用s

2021-10-04 15:56:10 4433

原创 MemBrain: Improving the Accuracy of PredictingTransmembrane Helices

今天要开始阅读论文啦,保持每天一篇【屏读】论文,锻炼自己的专业技能以及快速阅读能力。辅助工具:WPS,划词翻译功能特别好用,强行安利,国产工具现在是越来越人性化了,点赞!题目:MemBrain: Improving the Accuracy of Predicting Transmembrane Helices链接:MemBrain: Improving the Accuracy of Predicting Transmembrane Helices (plos.org)下载方式Sci-Hu

2021-10-03 11:09:09 335

原创 C语言:if、while、for、break、continue语句

if 语句(1)if 语句(2)if 语句(3)Switch语句Switch语句+break语句分支结构的嵌套While语句#include <stdio.h>int main(){ int i , sum = 0; while (i<=100){ sum = sum + i; i = i + 1; } printf("结果是: %d\n", sum);...

2021-09-26 12:47:09 1523

BP神经网络算法实现

自己用MATLAB写的BP神经网络代码,改一下数据能运行成功,每一行都有注释!

2018-04-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除