- 博客(84)
- 收藏
- 关注
原创 蛋白质致病突变的计算方法(八)
阿尔茨海默病(Alzheimer’s disease, AD)是各种神经系统疾病的主要标志(hallmark)疾病之一。已知在疾病样本中存在大量的蛋白质编码错义突变,主要靶点是presenilin 1 (PSEN1)、presenilin 2 (PSEN2)和淀粉样前体蛋白(APP)。致病突变信息在阿尔茨海默病测序项目(ADSP)数据库、阿尔茨海默病遗传学联盟(ADGC)和欧洲阿尔茨海默病联盟(EADC)等数据库中进行了注释。
2024-04-29 13:15:10 207
原创 蛋白质致病突变的计算方法(七)
这些模型使用蛋白质序列特征的不同组合,如PSSM谱、守恒分数、理化性质、邻近残基信息和膜蛋白的属性,如不同拓扑区域残基的比例、跨膜段的数量和prtn的替代矩阵。许多功能重要的突变已在IDH1 (R132H/G/L/S)、IDH2 (R140Q)、EGFR和BRAF中被确定,它们是癌症中众所周知的表观遗传修饰因子。因此,SIFT 、PolyPhen 、MutationTaster 和Cscape等计算方法使用基于结构、序列和网络的特征来预测蛋白质编码的单核苷酸变体对蛋白质结构表型的影响。
2024-04-26 16:11:49 298
原创 蛋白质致病突变的计算方法(六)
致病热点残基是蛋白质中特定的氨基酸位置,在突变时可导致疾病的发生。识别这些热点残基是了解疾病进展机制和开发潜在治疗策略的重要一步。Takeuchi 等人在BRCA1和BRCA2基因中发现了热点残基,它们与乳腺癌风险增加有关。Chang等人在41种癌症类型中确定了470个体细胞突变热点,这些突变热点似乎会影响各自蛋白质的分子功能。其他用于热点残基的重要数据库和服务器包括HotMAPS、HotSpoAnnotations 、HotSpot3D 、Mutation3D ,它们用于识别癌症中的突变簇。
2024-04-25 11:28:51 310
原创 蛋白质致病突变的计算方法(五)
Wu et al.系统地分析了20种不同遗传疾病的突变,并报道了每种可能突变的频率。从图4的数据可以看出,从发病情况来看,E→K、G→R、R→C、R→H、R→Q、R→W等特异性突变在疾病中较为普遍。图 4与遗传疾病相关的一组蛋白质的突变偏好。矩阵的每个元素表示氨基酸突变的数量(从列到行)。最高频率的2.5%用红色表示,2.5-12.5%用橙色表示,剩余的非零单元格用黄色表示。
2024-04-24 11:41:31 336
原创 蛋白质致病突变的计算方法(四)
此外,已经报道了针对特定基因组或蛋白质家族的特殊基质,以及恶性疟原虫和约利疟原虫的富集基因组,整合膜蛋白, β-桶跨膜蛋白,G蛋白偶联受体的视紫红质家族,蛋白质-蛋白质相互作用网络的枢纽蛋白和本质紊乱蛋白。度中心性衡量的是网络中一个蛋白质(或氨基酸)与其他蛋白质(或氨基酸)相互作用的次数,而介数中心性衡量的是一个蛋白质在网络中充当其他蛋白质(或氨基酸)之间桥梁的次数。(举这些例子的目的是通过具体的案例来说明在不同蛋白质中突变的位置和性质可能导致的不同影响,以及这些影响可能如何与癌症的发生和发展相关联)
2024-04-23 14:47:26 1059 1
原创 蛋白质治病突变的计算方法(三)
文献中使用了几种特征来识别蛋白质中的致病突变。它们大致分为三类:(1)序列,(2)结构和(3)网络,以及它们的组合。图1说明了这三组中的一些重要属性。图1 用于识别致病突变和热点的重要特征。基于氨基酸序列的特性包括理化特性、二级结构、位置特异性得分矩阵(PSSM)、特异性基序(motifs)和保守性得分。基于结构的性质包括界面分布(interface profiles)、残基的位置在核心和表面、相对溶剂可及面积(RSA)、体积、氢键供体和受体以及统计势能(statistical potentials)
2024-04-22 12:57:11 978
原创 蛋白质致病突变的计算方法(一)
目前,文献中可用的突变数据已被整理(curate)并存储在几个数据库中,这些数据已被有效地用于开发利用蛋白质的序列和结构属性识别有害(deleterious)突变(drivers)的计算方法。在本章中,我们将描述特定数据库的内容,这些数据库包含致病和中性(neutral)突变的信息(information on),然后(followed by)是基于序列和结构的属性。列出了重要的基于序列和结构的属性,这些属性在文献和计算工具中广泛用于识别癌症热点残基,以及区分蛋白质中的致病突变和中性突变。
2024-04-18 11:36:49 461
原创 已知genebank号 批处理获取gene ID和序列信息
处理一个公开数据集,发现多个genebank号对应1个gene ID,所以写了个脚本在NCBI接口批处理了一下。同时为了避免被封,添加了sleep,不知道是否好用,结过是几万的数据依然很流畅~~
2024-04-10 12:38:45 351
原创 VSCode SSH 连接 Could not establish connection to “XXX“: spawn UNKNOWN.
进入 ssh 插件的设置(可以通过在插件上选择设置按钮,也可以 ctrl + shift + p 再输入 ssh,选择 settings),在里面找到 Remote.ssh:Path 选项。默认本地路径: C:\Windows\System32\OpenSSH。拉取vscode终端:快捷键 ctrl+`(数字1旁边那个)2.1 找到本地SSH 位置。2.2 找到要修改的位置。
2024-04-04 10:45:06 824
原创 variant calling--SComatic
方法来自论文:De novo detection of somatic mutations in high-throughput single-cell profiling data sets。找到需要的染色体的fa.gz文件,右击-->复制链接地址-->linux端。将以上代码段写在.sh脚本中,执行 ./ **.sh 运行即可。我的任务是在几个scRNA数据中找到在突变基因不同细胞中特异性的表达。2. 解压染色体文件,并得到染色体的.fai文件。声明:我要处理的是hg38的染色体。
2024-03-26 10:41:10 290
原创 Pymol 常用指令:mutation in Pymol
Pick-#73 Glu, Color->yellow, 可以看到黄色是点突变以后Trp, 红色是原来的Glu. 点击Apply保存就只剩下黄色的Trp了。点show->stick;最近想尝试突变是否会改变蛋白质结构,想起来之前安装的Pymol有蛋白质可视化功能,所以小小记录一下。可以看到,做完点突变后,周围残基并没有发生构象上的变化,意味着pymol不会自动做能量最小化处理。3. 点Wizard->Mutagenesis->protein;OK,介绍 1b27蛋白质第73个残基由E变成W的过程。
2024-03-18 11:18:37 897 1
原创 服务器权限:Error: EACCES: permission denied, open‘/Cardiac/uniquC.csv
我想在服务器上传一个文件uniquC.csv,但是服务器说我没有权限。1. 查看目前是否存在对文件夹的权限。这也意味着root也没有赋予写的权限。然后输入root密码。4. 查看当前的权限。
2024-02-26 15:16:40 484
原创 google cloud storage批量文件下载
注意:3中复制的语言需要修改:1)去掉开始位置的 \ 2)删除” 前后的空格 3) 最简单的方法去chatgpt粘贴一下,他会给你正确的格式(已经崩溃,自己改了好多次没改对……),所以最后的样子应该是。我是先cd进了目标文件夹,所以保存的local路径是 .。1.首先创建项目,或者用之前的项目都可以。2.然后选中要下载的文件,点击下载。4.修改指令,并使用项目名称。
2024-01-16 12:37:15 907 3
原创 google cloud storage: Bucket is a requester pays bucket but no user project provided
啊啊,一整天熬到2点就干了个这,这收钱的界面做的太隐蔽了,根本找不到,花钱都花不出去……关于Enformer脚本的解析和数据等问题也可以问,可以考虑写个专辑了。bash脚本如果有需要可以在评论区提问。
2024-01-11 10:36:45 489
原创 pymol--常用指令
3.还发现Pymol>后的框可以通过上↑下↓箭头会到前后指令,这与Linux是一样的。新年快乐~~~ 1.1号写了点 但是太少了没发。1. 显示蛋白质序列,点击右下角的S就可以。2. 隐藏其中一条蛋白质序列。
2024-01-09 16:28:42 661
原创 pymol--常用指令
1)Pymol> load name.pdb, name # 载入pdb文件,并命名,我还没试过Pymol> fetch proteinID # 直接就加载了 我用的这个右边选框,有A S H L C指令。
2023-12-28 10:34:43 1292
原创 Pymol入门---安装Windows 多版本下载
Pymol需要文件,最好去下载清华提供的镜像,网速会很快由于我在本地有3.9的python,所以我先查了适配哪个Anaconda,然后选择在清华镜像源下载Anaconda3-2022.10的版本。下载后进行安装。
2023-12-28 10:21:34 1884
原创 在公共服务器/集群上 安装Linux pycharm 并在窗口调出pycharm界面
1.enter the web:https://www.jetbrains.com/pycharm/download/?section=linux#section=linux2.upload software (yourself folder)3.cd software4.find the Compressed package: .tar.gz5.Decompress:tar zxf pycharm-professional-2023.2.3.tar.gz6.cd pycharm-2023.2.3/bin/
2023-10-30 10:43:54 877
原创 如何根据蛋白质序列找到蛋白质ID
4. 筛选,左边有物种,0.98为score,取score最小的,原理不知。7. 验证结果:判断序列与找到的蛋白质ID序列是否一致。5. 可下载相关文件。
2023-08-20 20:26:46 2820
原创 RuntimeError: CUDA error: no kernel image is available for execution on the device
RuntimeError: CUDA error: no kernel image is available for execution on the deviceOSError: /home/aita/anaconda3/envs/FusionDTA/lib/python3.7/site-packages/nvidia/cublas/lib/libcublas.so.11: symbol cublasLtHSHMatmulAlgoInit version libcublasLt.so.11 not de
2023-04-06 20:11:09 838 1
原创 python pd.DataFram series转ndarry,然后转为(X,1)格式
在调试代码时报错:python key of type tuple not found and not a MultiIndex
2023-03-20 09:17:36 971
原创 tensor与numpy、array的转换,针对RuntimeError: Can‘t call numpy() on Variable that requires grad问题
tensor与numpy、array的转换,针对RuntimeError: Can‘t call numpy() on Variable that requires grad问题
2023-03-08 09:09:10 369
原创 记录 No module named ‘Bio‘
安装或调用python3,biopython。python2 里面用的module是。python3 里用的module是。
2023-02-24 21:47:32 3627 1
原创 ERROR: Could not install packages due to an OSError: [Errno 2] 没有那个文件或目录
ERROR: Could not install packages due to an OSError: [Errno 2] 没有那个文件或目录: '../lib/python3.7/site-packages/numpy-1.21.6.dist-info/METADATA'找到目录也就是:/lib/python3.7/site-packages/numpy-1.21.6.dist-info,然后创建一个文件METADTATA。
2023-02-24 21:43:06 1463
原创 Python + Uniprot获取蛋白质的功能向量
官网http://geneontology.org/docs/download-ontology/http://purl.obolibrary.org/obo/go.obo,右键点击该链接。我随机选中HSPA8基因的4个,然后 Download得到一个压缩包。3.对得到的压缩包进行数据处理,生成蛋白质数据的dataframe。1. 需要一个.obo文件,为了获得现在所有蛋白质的功能GO。选择’链接另存为’,即可下载最新版的go.obo文件。4. 处理得到最新的GO字典,并生成功能标签。
2023-01-17 15:04:12 545
原创 Linux导出环境包 .yaml permission deined
存在的目的是提供当前代码运行所需要的环境或者依赖信息,即这些东西的安装是当前代码运行的前提条件。这些信息相当于是开发者给使用者提供的用于恢复自己开发时的环境的信息。首先,我使用 ls -l,查看了anaconda的权限,发现权限正常,root,用户和其他都有读、写、可执行的权限。1. LInux导出环境包一般有2种:requirement.txt;然后,我发现当前路径不在代码目录下,换到代码目录下可以成功转出。4. 审稿意见涉及导出环境.yml,但是我一直permission deined。
2023-01-14 22:11:58 555
原创 HDIContact: a novel predictor of residue–residue contacts on hetero-dimer interfaces via sequential
HDIContact: a novel predictor of residue–residue contacts on hetero-dimer interfaces via sequential information and transfer learning strategy文章梳理
2022-08-31 11:07:00 3144 3
原创 python: No module named ‘gensim‘ 和 Read timed out
No module named 'gensim' 和 Read timed out
2022-08-09 16:48:36 1654
原创 matlab .mat转.txt
matlab 处理数据将.mat转.txt,代码如下clear allload('MixPA.mat')T=cell2table(protein_A); #数据集里面有个名字writetable(T,'Mix.AC_P1.txt');我应该集齐了所有文件转换处理的方法,摸摸自己,今天又是洒泪的一天,嘿嘿嘿……#########################写代码头秃的分割线系统说我质量较低,我应该再写点废话。我是一个菜鸟,挣扎在毕业一线,还有3年毕业,每天担心毕业到头秃,
2022-05-08 17:31:47 1749 3
原创 matlab .txt转.mat,.csv转.mat
处理数据信息需要使用不同的软件,python与matlab共同处理数据,以下是使用matlab将.txt和.csv文件转为.mat文件的代码:clc;close all;clear all;cancerPA=importdata('cancerPA.txt') #.csv就直接输入 X.csv就行save cancerPA.mat cancerPA;至此,python的文件转换,matlab的文件转换都差不多经历了,期待与大家的交流。...
2022-05-06 15:14:18 2536 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人