![](https://img-blog.csdnimg.cn/20190918140037908.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
生物信息
在生物信息学领域,遇到的一些问题,以及我的解决办法
病树前头
这个作者很懒,什么都没留下…
展开
-
正态分布的参数及意义
正态分布原创 2024-04-30 10:55:54 · 1025 阅读 · 0 评论 -
蛋白质——起始氨基酸
起始氨基酸原创 2024-04-30 10:25:57 · 100 阅读 · 0 评论 -
python统计低复杂度区域——(待完善)
【代码】python统计低复杂度区域——(待完善)原创 2023-12-18 11:16:18 · 430 阅读 · 0 评论 -
2022_0715处理蛋白后续文件得到LCR(低复杂度区域)的相关数据(代码能力不是很好,所以穿插了多种语言)
2.这里展示的文件是经过pandas排序的文件,我接下来的做法是不排序,去掉"index",通过shell语言(pastefile1file2)将链长追加在第4列,手动添加索引为"designnlcrlcrlen"3.将添加索引后的文件通过python语言,假设要处理的文件在当前路径下。将之前的natural结果追加到file4的第6列;用paste命令将结果追加在file4的第5列;5.我用的是awk命令第3列除以第4列;用此时的第5列减去第6列,得到差值;...原创 2022-07-15 14:52:52 · 211 阅读 · 0 评论 -
HMMER学习——(待完善)
Hmmer同源序列搜索原创 2023-12-07 19:49:31 · 365 阅读 · 0 评论 -
蛋白质数据库相关——(待完善)
如何下载蛋白搜库序列文件cd-hit fatal error Failed to open the database file(补充一点这个问题来得莫名其妙)Failed to open the database file - Program halted (file path variable related error)常用生物信息 ID 及转换方法(特别重要)NCBI、UniProt、RCSB PDB的部分功能使用(蛋白质晶体结构、蛋白质氨基酸序列、基因序列、序列比对等)MindSpore原创 2023-12-05 11:29:36 · 376 阅读 · 0 评论 -
蛋白质深度学习相关——(待完善)
阅读笔记-蛋白质序列预训练ESM利用Transformer替代MSA从蛋白序列中学习Contact MapAlphaFold2算法详解AlphaFold/ RoseTTAFold开源复现(1)—推理复现Alphfold2.0 进阶Nat. Commun.| CopulaNet:直接从多序列联配中学习残基间距离以“从头预测”蛋白质结构Facebook AI用自监督语言建模:从2.5亿个蛋白质序列,860亿个氨基酸学习生物内在特性李沐《动手学深度学习》 第二版 案例汇总原创 2023-12-05 11:29:19 · 404 阅读 · 0 评论 -
提取蛋白质PDB文件中的氨基酸序列
1.从PDB数据库中,下载的所有fasta中,根据cath的PDBid和Chainid去搜索。途中经历了一些低级错误。原创 2023-11-30 14:10:23 · 542 阅读 · 0 评论 -
生信菜鸟之基础统计分析,感谢各位大佬的代码
主要是利用一切可利用的语言,不管是python,shell等,完成一些基础统计,刚接触生信的菜鸟一枚。原创 2022-08-09 14:47:42 · 660 阅读 · 0 评论 -
Biopython等处理MSA相关文件
缺点是不能识别非ATOM 的squence。原创 2022-08-03 17:42:31 · 356 阅读 · 0 评论 -
python——循环处理指定类型比如.pdb文件
循环处理指定文件原创 2022-06-17 16:37:20 · 417 阅读 · 0 评论