![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
蛋白质基础
文章平均质量分 61
李划水员
这个作者很懒,什么都没留下…
展开
-
蛋白质致病突变的计算方法(八)
阿尔茨海默病(Alzheimer’s disease, AD)是各种神经系统疾病的主要标志(hallmark)疾病之一。已知在疾病样本中存在大量的蛋白质编码错义突变,主要靶点是presenilin 1 (PSEN1)、presenilin 2 (PSEN2)和淀粉样前体蛋白(APP)。致病突变信息在阿尔茨海默病测序项目(ADSP)数据库、阿尔茨海默病遗传学联盟(ADGC)和欧洲阿尔茨海默病联盟(EADC)等数据库中进行了注释。原创 2024-04-29 13:15:10 · 185 阅读 · 0 评论 -
蛋白质致病突变的计算方法(七)
这些模型使用蛋白质序列特征的不同组合,如PSSM谱、守恒分数、理化性质、邻近残基信息和膜蛋白的属性,如不同拓扑区域残基的比例、跨膜段的数量和prtn的替代矩阵。许多功能重要的突变已在IDH1 (R132H/G/L/S)、IDH2 (R140Q)、EGFR和BRAF中被确定,它们是癌症中众所周知的表观遗传修饰因子。因此,SIFT 、PolyPhen 、MutationTaster 和Cscape等计算方法使用基于结构、序列和网络的特征来预测蛋白质编码的单核苷酸变体对蛋白质结构表型的影响。原创 2024-04-26 16:11:49 · 284 阅读 · 0 评论 -
蛋白质致病突变的计算方法(六)
致病热点残基是蛋白质中特定的氨基酸位置,在突变时可导致疾病的发生。识别这些热点残基是了解疾病进展机制和开发潜在治疗策略的重要一步。Takeuchi 等人在BRCA1和BRCA2基因中发现了热点残基,它们与乳腺癌风险增加有关。Chang等人在41种癌症类型中确定了470个体细胞突变热点,这些突变热点似乎会影响各自蛋白质的分子功能。其他用于热点残基的重要数据库和服务器包括HotMAPS、HotSpoAnnotations 、HotSpot3D 、Mutation3D ,它们用于识别癌症中的突变簇。原创 2024-04-25 11:28:51 · 288 阅读 · 0 评论 -
蛋白质致病突变的计算方法(五)
Wu et al.系统地分析了20种不同遗传疾病的突变,并报道了每种可能突变的频率。从图4的数据可以看出,从发病情况来看,E→K、G→R、R→C、R→H、R→Q、R→W等特异性突变在疾病中较为普遍。图 4与遗传疾病相关的一组蛋白质的突变偏好。矩阵的每个元素表示氨基酸突变的数量(从列到行)。最高频率的2.5%用红色表示,2.5-12.5%用橙色表示,剩余的非零单元格用黄色表示。原创 2024-04-24 11:41:31 · 311 阅读 · 0 评论 -
已知uniport ID 下载 seq
task如题,可以改成批处理的代码哦。原创 2024-04-23 14:54:12 · 323 阅读 · 0 评论 -
蛋白质致病突变的计算方法(四)
此外,已经报道了针对特定基因组或蛋白质家族的特殊基质,以及恶性疟原虫和约利疟原虫的富集基因组,整合膜蛋白, β-桶跨膜蛋白,G蛋白偶联受体的视紫红质家族,蛋白质-蛋白质相互作用网络的枢纽蛋白和本质紊乱蛋白。度中心性衡量的是网络中一个蛋白质(或氨基酸)与其他蛋白质(或氨基酸)相互作用的次数,而介数中心性衡量的是一个蛋白质在网络中充当其他蛋白质(或氨基酸)之间桥梁的次数。(举这些例子的目的是通过具体的案例来说明在不同蛋白质中突变的位置和性质可能导致的不同影响,以及这些影响可能如何与癌症的发生和发展相关联)原创 2024-04-23 14:47:26 · 1030 阅读 · 1 评论 -
蛋白质治病突变的计算方法(三)
文献中使用了几种特征来识别蛋白质中的致病突变。它们大致分为三类:(1)序列,(2)结构和(3)网络,以及它们的组合。图1说明了这三组中的一些重要属性。图1 用于识别致病突变和热点的重要特征。基于氨基酸序列的特性包括理化特性、二级结构、位置特异性得分矩阵(PSSM)、特异性基序(motifs)和保守性得分。基于结构的性质包括界面分布(interface profiles)、残基的位置在核心和表面、相对溶剂可及面积(RSA)、体积、氢键供体和受体以及统计势能(statistical potentials)原创 2024-04-22 12:57:11 · 957 阅读 · 0 评论 -
蛋白质致病突变的计算方法(二)
(继续上一篇)原创 2024-04-19 13:53:39 · 878 阅读 · 1 评论 -
蛋白质致病突变的计算方法(一)
目前,文献中可用的突变数据已被整理(curate)并存储在几个数据库中,这些数据已被有效地用于开发利用蛋白质的序列和结构属性识别有害(deleterious)突变(drivers)的计算方法。在本章中,我们将描述特定数据库的内容,这些数据库包含致病和中性(neutral)突变的信息(information on),然后(followed by)是基于序列和结构的属性。列出了重要的基于序列和结构的属性,这些属性在文献和计算工具中广泛用于识别癌症热点残基,以及区分蛋白质中的致病突变和中性突变。原创 2024-04-18 11:36:49 · 452 阅读 · 0 评论 -
已知genebank号 批处理获取gene ID和序列信息
处理一个公开数据集,发现多个genebank号对应1个gene ID,所以写了个脚本在NCBI接口批处理了一下。同时为了避免被封,添加了sleep,不知道是否好用,结过是几万的数据依然很流畅~~原创 2024-04-10 12:38:45 · 299 阅读 · 0 评论 -
如何根据蛋白质序列找到蛋白质ID
4. 筛选,左边有物种,0.98为score,取score最小的,原理不知。7. 验证结果:判断序列与找到的蛋白质ID序列是否一致。5. 可下载相关文件。原创 2023-08-20 20:26:46 · 2538 阅读 · 0 评论 -
根据Uniprot ID/PDB ID批处理获取蛋白质.pdb文件
根据Uniprot ID/PDB ID批处理获取蛋白质.pdb文件原创 2022-07-31 18:08:16 · 6000 阅读 · 6 评论 -
python 服务器批处理得到PSSM矩阵
批处理获得蛋白质的PSSM矩阵原创 2022-07-20 11:10:36 · 1368 阅读 · 9 评论 -
蛋白质序列处理,只保存蛋白质序列,而不存ID等
通常蛋白质从数据库中下载后,会有如下的信息,每个蛋白质第一行的信息,对于只关注序列的人来说,是多余的,如何将第一行去掉,并将一条蛋白质完整显示,用以下代码:def read_file(file_name): pro_swissProt = [] with open(file_name, 'r') as fp: protein = '' for line in fp: if line.startswith('>sp|.原创 2022-05-05 16:42:54 · 982 阅读 · 0 评论 -
AlphaFold2算法详解
正文:https://www.nature.com/articles/s41586-021-03819-2补充文件:https://static-content.springer.com/esm/art%3A10.1038%2Fs41586-021-03819-2/MediaObjects/41586_2021_3819_MOESM1_ESM.pdfhttps://static-content.springer.com/esm/art%3A10.1038%2Fs41586-021-03819-2/Med原创 2022-01-04 15:53:01 · 10326 阅读 · 3 评论