自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 收藏
  • 关注

原创 UMAP visualization 测试练手版

本文仅供本人练习使用!下面所有代码都进行了较大幅度的修正!

2024-08-20 13:54:04 782

原创 linux提取文档第一列内容,删除重复行,统计文件行数

【代码】linux提取文档第一列内容,删除重复行,统计文件行数。

2023-12-07 15:52:33 889

原创 子实体形态相关基因鉴定

进行糖类活性酶的注释,在这一过程中,序列特征谱作为搜索的目标,而包含各真菌蛋白质组序列的文件作为搜索对象。软件进行序列的鉴定。初步得到的微管蛋白序列通过系统发育分析方法进行家族分类。将包含各糖类活性酶家族的隐马尔科夫序列特征谱下载自。软件包对蛋白家族的基因数量进行分类统计,得到。)数据库鉴定同源域转录因子基因(的XP_003038723.1。的XP_006454075.1。的XP_001829147.2。用于鉴定线粒体中间肽酶基因(CAT数据库的数量矩阵。则用于鉴定β侧翼基因(数据库进行比对,选用。

2023-07-21 11:05:19 129

原创 从fasta文件中批量提取序列

下载faSomeRecords脚本。

2023-07-11 23:30:12 708

原创 多序列建树鉴定物种

主要分为ITS, LSU, TEF, RPB2。

2023-06-26 09:59:51 110

原创 给序列去除 * 号

【代码】给序列去除 * 号。

2023-06-25 18:48:02 47

原创 mysql: [Warning] World-writable config file ‘/etc/mysql/conf.d/mysql.cnf‘ is ignored.报错及解决

【代码】mysql: [Warning] World-writable config file ‘/etc/mysql/conf.d/mysql.cnf‘ is ignored.报错及解决。

2023-06-20 20:29:54 1747

原创 查看Ubuntu占用内存

查看Ubuntu占用内存。

2023-06-19 12:14:31 90

原创 TCDB membrane transporters 数据整理

整理成下图由 transporter id 对应的z-score标准化后的数据。整理 transporter id 对应的蛋白编码基因拷贝数。

2023-06-16 19:11:08 56

原创 root报错及解决

sudoers的权限被改了,改回来就好了。

2023-06-16 14:52:28 608

原创 z-score标准化

将如下数据 转换成 z-score标准化后的数据

2023-06-14 19:29:57 686

原创 BUSCO评估基因组

【代码】BUSCO评估基因组。

2023-05-31 15:31:25 296

原创 纯二代Illumina测序序列组装

二代基因组soapdevono注释。配置config.txt。下面一步需要root权限。

2023-05-31 15:15:57 139

原创 Predicted gene number 统计

【代码】Predicted gene number 统计。

2023-05-26 17:03:13 60

原创 Augustus训练与预测

JJH方法。

2023-05-24 21:06:01 827

原创 Quast评估基因组组装

本方法仅供个人使用!!

2023-05-23 21:53:04 795

原创 genome comparison commend 1

仅本人练习使用!!后续会逐渐修改!!

2023-04-22 16:08:01 381

原创 转座子注释

也可使用在线网站# 进入conda环境sudo supassword# 运行# pepalldo。

2023-04-19 19:07:16 1226

原创 真菌转录组组装方法(有参)与Gene Prediction Commend 01略有不同

4)index得到:MS2_hisat2re.sam MS2_hisat2re.summaryview得到:MS2_hisat2re.bamsortindexfalgstate对回帖bam质量评估只分析已知转录本组装和定量得到:ballgown_out_dir cov_refs.gtf gene_abund.tab本质上,stringTie只提供了转录本水平的表达量,定量方式包括TPM和FPKM值两种。prepDE.py 需要一个 sample_list,第一列为样本名,第二列为。

2023-04-19 10:43:27 151

原创 分泌蛋白(SP)注释为CAZymes,蛋白酶MEROPS,脂肪酶Lipase

由于分泌的CAZymes在木材降解过程中起着关键作用,因此我们研究了它们在该科的含量变化,不同进化枝具有独特的CAZyme含量。分泌蛋白(SP)被注释为 CAZymes,脂肪酶或蛋白酶。对于每个基因组,我们对于这些我们指定的活性在普通植物细胞壁基质。从真菌世界( Mycocosm.JGI.doe.gov )获得 JGI 基因组组装的统计数据(即 N50、基因和支架的数量以及基因组大小)。

2023-04-18 11:08:17 334

原创 蛋白酶MEROPS,脂肪酶Lipase注释步骤(含批量)

againstMEROPS).).下载界面具体内容如下下载数据,使用ctrl+A(全选)和 ctrl+D(保存)选用pepunit.lib.fasta在进行序列比对前,首先需要。报错内容:解决措施:删除氨基酸序列中的点或把点替换为X(未知氨基酸),sed -i '/^>/!

2023-04-18 11:06:14 760 3

原创 gene prediction commend 3

用于后续并行. 为了降低内存消耗,–segmentsSize设置的大小需要少于1Mb(这里是100k), --overlapSize的不能太小,如果数学好,可用设置成基因平均长度加上2个标准差,数学不好,就设置成10K吧。

2023-04-14 12:23:25 522

原创 gene prediction commend 2

获得一个不包含基因组序列的gff3 文件:rnd5.all.gff,以及一系列蛋白质和转录组fasta 文件。cd ..

2023-04-13 17:46:46 299

原创 MobaXterm出现X11-forwarding : ✘ (disabled or not supported by server)及conda: command not found等问题

之前报错的command not found现在都可以用了!安装xorg-x11-xauth。上述问题可能不是重点~~

2023-04-07 17:21:43 6607 1

原创 antiSMASH在线及本地运行(含批量)

对于完整的基因组,运行ClusterBlast、 KnownClusterBlast、SubClusterBlast、ActiveSiteFinder, TTA codon detection 、自动模式下的TTA密码子检测、次级代谢物簇同源组预测和特定簇的详细注释采用如下参数(参数,antiSMASH 使用 blastp 来将氨基酸序列比对到已知的次级代谢 clusters 或 subclusters 上,来寻找 query 序列中的基因簇。可以同时上传*.genome.fasta和*.genome.

2023-04-07 17:01:37 1601 3

原创 利用fna和gbff得到genome.gff3,pep,cds

从NCBI下载的只有fna和gbff文件需要得到*.genome.gff3。

2023-04-07 14:12:01 1019

原创 Transcription Fatcor (TF), TCDB注释步骤(含批量)

新建文件夹需要interpro5.tsv。

2023-04-01 19:58:57 346

原创 PHI注释步骤(含批量)

.将PHI数据库下载下来本地blast,需要先填资料,填完之后即可下载至本地,使用blast进行比对。

2023-04-01 19:58:10 494

原创 KEGG注释步骤(含KAAS网页运行,KofamKOALA本地安装及批量)

再者,如果使用的是ensembl ID,则需要注意统一使用Transcript ID或Gene ID)。保留所有信息,包括Gene ID对应上的每一个KO Number,比对分数,E-value以及KO Number的详细信息等。:需要保持ID的一致性,否则注释不出结果(例如拿来做注释的往往是蛋白序列,一般会包括可变性剪切的标识符AT4G36920.1。需要填写邮箱信息,在网页中提交后需要再进入邮箱,点击邮件中的提交链接,才能开始计算。注释完毕后,从填写的邮箱中进入注释完毕后的网页,下载注释结果。

2023-04-01 18:53:56 1647

原创 orthovenn2

OrthoVenn2基于OrthoMCL启发式匹配算法,用DIAMOND进行比对,比传统的BLAST算法速度提高了1万倍,OrthoVenn2基因组蛋白序列来源于Ensembl数据库,通用性更强,单次在线分析的上限物种数量提高了1倍达12个。全基因组直系同源基因簇(Orthologousclusters)的分析是比较基因组学研究中的一项重要内容,直系同源基因簇之间的聚类及网络构建有助于解释跨多物种的蛋白质的功能和进化关系。

2023-04-01 15:44:48 263 1

原创 GO注释步骤(含批量)

注意:这些文件是制表符分隔的文本文件,千万不要保存为 Excel 格式,以免有后续问题!直接整理 eggNOG-mapper 的结果,输出几个文件,分别满足不同下游分析需要。但是使用EBI的工具时是有的(存在报错)2.Gene Onotoloy注释信息。四个文件的具体信息,截图可看。下面2种方法选一种使用即可。的注释结果中没有GO注释。接下来进行数据整理与画图。3.KEGG 注释信息。4.PFAM 注释信息。1.具体功能描述信息。

2023-03-31 14:29:37 743

原创 InterProScan本地化安装、配置、使用(含批量操作)

interproscan 是个基因注释工具,可以一次运行实现多个数据库的注释。用户既可以提交蛋白序列也可以提交核酸序列,还可以对输出格式进行设置。优点:使用本地化的数据库,在断网和计算机资源充足的情况下,能加快注释速度;本地化网页版能同时比对多条序列;本地化能对DNA序列进行interpro注释。缺点:本地化安装InterProScan比较复杂耗时;需要不时更新本地数据库;本地化运行耗费计算资源大。

2023-03-30 14:41:58 2516

原创 基因组组装Pilon(二代)-step3

得到 pilon02.fasta。

2023-03-29 20:17:47 160

原创 基因组组装hifiasm(三代 PacBio Hifi)-step2

根据K-mer分析杂合率<0.6%,不需要分型杂合率>或=0.6%,需要分型。

2023-03-29 17:21:02 350

原创 基因组K-mer分析(二代)-step1

在基因组组装之前需要做!进入conda环境。

2023-03-29 17:16:13 128

原创 Gene Prediction Commend 01

输出:out.filter1.gff3去冗余后的基因模型,out.filter2.gff3完整的基因模型,可用于ab initio基因预测软件的HMM training。结果:5_1210_db.assemblies.fasta.transdecoder.genome.gff3。统计结果在seqcl_transcripts.fasta.log。得到yc.transcripts.fasta。最终得到Trinity-GG.fasta文件。最终得到Trinity.fasta文件。得到merged.gtf。

2023-03-29 17:06:11 236

原创 日语学习--五十音记忆法(浊音)

[日语学习]浊音和长音_哔哩哔哩_bilibili仅供自己学习使用!!1. が行 K → G 浊音2. ざ行 S → Z 浊音3. だ行 T → D 浊音按照具体单词区分4. ば行H →B 浊音5. ぱ行 H → P 半浊音

2023-03-29 01:03:15 360

原创 日语学习-五十音记忆法(下)

仅供自己学习使用!!

2023-03-29 00:35:04 93

原创 日语学习-五十音记忆法(上)

仅供自己学习使用!!

2023-03-29 00:08:51 126

原创 测序结果峰图分析&物种鉴定方法1.0

若要更为严谨,可使用ITS4和ITS5两者结合的方式进行比对(如下文中的LSU比对教程)。ITS5(正向)ITS4(反向)序列较短,一般可不用进行序列反向互补和序列比对,若出现套峰则要进行序列反向互补和序列比对。

2023-03-27 19:27:12 5425

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除