基因组功能注释
文章平均质量分 72
Xsisikk
这个作者很懒,什么都没留下…
展开
-
子实体形态相关基因鉴定
进行糖类活性酶的注释,在这一过程中,序列特征谱作为搜索的目标,而包含各真菌蛋白质组序列的文件作为搜索对象。软件进行序列的鉴定。初步得到的微管蛋白序列通过系统发育分析方法进行家族分类。将包含各糖类活性酶家族的隐马尔科夫序列特征谱下载自。软件包对蛋白家族的基因数量进行分类统计,得到。)数据库鉴定同源域转录因子基因(的XP_003038723.1。的XP_006454075.1。的XP_001829147.2。用于鉴定线粒体中间肽酶基因(CAT数据库的数量矩阵。则用于鉴定β侧翼基因(数据库进行比对,选用。原创 2023-07-21 11:05:19 · 164 阅读 · 0 评论 -
给序列去除 * 号
【代码】给序列去除 * 号。原创 2023-06-25 18:48:02 · 71 阅读 · 0 评论 -
Augustus训练与预测
JJH方法。原创 2023-05-24 21:06:01 · 1093 阅读 · 0 评论 -
蛋白酶MEROPS,脂肪酶Lipase注释步骤(含批量)
againstMEROPS).).下载界面具体内容如下下载数据,使用ctrl+A(全选)和 ctrl+D(保存)选用pepunit.lib.fasta在进行序列比对前,首先需要。报错内容:解决措施:删除氨基酸序列中的点或把点替换为X(未知氨基酸),sed -i '/^>/!原创 2023-04-18 11:06:14 · 936 阅读 · 3 评论 -
利用fna和gbff得到genome.gff3,pep,cds
从NCBI下载的只有fna和gbff文件需要得到*.genome.gff3。原创 2023-04-07 14:12:01 · 1428 阅读 · 0 评论 -
antiSMASH在线及本地运行(含批量)
对于完整的基因组,运行ClusterBlast、 KnownClusterBlast、SubClusterBlast、ActiveSiteFinder, TTA codon detection 、自动模式下的TTA密码子检测、次级代谢物簇同源组预测和特定簇的详细注释采用如下参数(参数,antiSMASH 使用 blastp 来将氨基酸序列比对到已知的次级代谢 clusters 或 subclusters 上,来寻找 query 序列中的基因簇。可以同时上传*.genome.fasta和*.genome.原创 2023-04-07 17:01:37 · 1897 阅读 · 3 评论 -
Transcription Fatcor (TF), TCDB注释步骤(含批量)
新建文件夹需要interpro5.tsv。原创 2023-04-01 19:58:57 · 470 阅读 · 0 评论 -
KEGG注释步骤(含KAAS网页运行,KofamKOALA本地安装及批量)
再者,如果使用的是ensembl ID,则需要注意统一使用Transcript ID或Gene ID)。保留所有信息,包括Gene ID对应上的每一个KO Number,比对分数,E-value以及KO Number的详细信息等。:需要保持ID的一致性,否则注释不出结果(例如拿来做注释的往往是蛋白序列,一般会包括可变性剪切的标识符AT4G36920.1。需要填写邮箱信息,在网页中提交后需要再进入邮箱,点击邮件中的提交链接,才能开始计算。注释完毕后,从填写的邮箱中进入注释完毕后的网页,下载注释结果。原创 2023-04-01 18:53:56 · 2168 阅读 · 0 评论 -
PHI注释步骤(含批量)
.将PHI数据库下载下来本地blast,需要先填资料,填完之后即可下载至本地,使用blast进行比对。原创 2023-04-01 19:58:10 · 643 阅读 · 0 评论 -
InterProScan本地化安装、配置、使用(含批量操作)
interproscan 是个基因注释工具,可以一次运行实现多个数据库的注释。用户既可以提交蛋白序列也可以提交核酸序列,还可以对输出格式进行设置。优点:使用本地化的数据库,在断网和计算机资源充足的情况下,能加快注释速度;本地化网页版能同时比对多条序列;本地化能对DNA序列进行interpro注释。缺点:本地化安装InterProScan比较复杂耗时;需要不时更新本地数据库;本地化运行耗费计算资源大。原创 2023-03-30 14:41:58 · 3444 阅读 · 0 评论 -
Small Secreted Protein (SSP) 注释步骤(含批量)
SignalP批量操作TMHMM1)批量操作2)批量操作3)结果保存在$i.candidate_secreted_proteins_results.txt批量操作PredGPT将candidate_secreted_proteins.fasta分成candidate_secreted_proteins1.fasta和candidate_secreted_proteins2.fasta等多个文件。结果文件是fasta格式文件,其头部包含结果信息。取阈值FDR 0.5%。原创 2023-03-25 18:40:17 · 346 阅读 · 0 评论