BioMed
拾毅者
长期关注机器学习,数据挖掘和人工智能领域。
展开
-
生物信息-related
生物信息学的研究重点主要体现在基因组学(genomics)和蛋白质组学(proteomics)两个方面,intron 内含子,exon外显子1.DNA的双螺旋结构双螺旋结构是基于对碱基配对规律的认识:氢键结合只发生于互补的碱基A与T、G与C之间。双螺旋分子两条链的严格互补性,是指一条链的核苷酸顺序,无例外地取决于另一条链。每一条DNA链都能作为模板,以合成一条准确地限定核苷酸顺序的新链,也是根据碱基原创 2015-05-18 09:08:42 · 1550 阅读 · 0 评论 -
数据预处理-PDB文件处理代码
以下代码为个人原创,python实现,是处理PDB文件的常用代码,仅供参考!1.下载PDB文件下面是一个下载PDB文件的函数,传入的参数是一个写有pdb名字的namefile文件,函数的核心部分是三个系统命令,先通过wget下载,然后解压,最后替换名字。def downloadpdb(namefile): inputfile = open(namefile, 'r') for eac原创 2015-07-05 10:04:42 · 4659 阅读 · 0 评论 -
PSSM特征-从生成到处理
以下代码均为个人原创,如有疑问,欢迎交流。新浪微博:拾毅者本节内容:pssm生成pssm简化标准的pssm构建滑动pssm生成在基于蛋白质序列的相关预测中,使用PSSM打分矩阵会得将预测效果大大提高,同时,如果使用滑动的PSSM,效果又会进一步提高。这里主要以分享代码为主,下面介绍下PSSM从生成到处理的全过程。1.PSSM的生成PSSM的生成有多种方式,这里使用的psiblast软件,n原创 2015-07-07 22:34:00 · 12449 阅读 · 9 评论