Bioinformatics
文章平均质量分 92
Bioinformatics
Neptuneyut
这个作者很懒,什么都没留下…
展开
-
Salmon-超快速、准确的基因丰度计算
文章目录获取转录组并建立索引获取转录组并建立索引为了量化转录本水平的丰度,Salmon需要目标转录组。 该转录组以多FASTA序列文件(可以是压缩的)的形式提供给Salmon,每个序列均是转录本。 在此示例中,我们将分析拟南芥的一些数据,因此我们将下载拟南芥转录组并为其编制索引。下载参考转录组curl ftp://ftp.ensemblgenomes.org/pub/plants/release-28/fasta/arabidopsis_thaliana/cdna/Arabidopsis_tha原创 2023-11-17 21:24:28 · 2605 阅读 · 1 评论 -
KofamScan-KEGG官方推荐的使用系同源和隐马尔可夫模型进行KO注释
KofamScan 是一款基于 KEGG 直系同源和隐马尔可夫模型(HMM)的基因功能注释工具,可通过同源搜索和预先计算的自适应分数阈值,将 KEGG 同源物(KOs)分配给蛋白质序列的隐马尔可夫模型(KOfam)数据库。在线版本可在 https://www.genome.jp/tools/kofamkoala/ 上获取。KofamKOALA 比现有的 KO 分配工具更快,其准确性可与性能最好的工具相媲美。原创 2023-11-17 21:14:28 · 1229 阅读 · 0 评论 -
fastANI-基因组平均核酸一致性(ANI)计算
(gtdbtk) [yutao@myosin Eisenbacteria]$ head fa.idGCA_001780165.1_genomic.faGCA_003235575.1_genomic.faGCA_005893165.1_genomic.faGCA_005893185.1_genomic.faGCA_005893225.1_genomic.faGCA_005893265.1_genomic.faGCA_005893275.1_genomic.faGCA_005893295.1_g原创 2023-11-12 20:35:16 · 1959 阅读 · 0 评论 -
GTDB-Tk基因组物种注释
文章目录安装数据库参考安装conda install -c bioconda gtdbtkGTDB-Tk v1.3.0 requires ~25G of external data which needs to be downloadedand unarchived. This can be done automatically, or manually: 1. Run the command download-db.sh to automatically download to:原创 2023-11-10 20:29:19 · 1707 阅读 · 0 评论 -
dRep-基因组质控、去冗余及物种界定
文章目录概述使用结果参考概述在许多情况下,确定微生物之间的关系是研究问题的中心。 居住在建筑物表面的微生物是否与居住在其租户中的微生物相同? 医院病房中的微生物是否与新生婴儿中的微生物相同? 生活再木制表面的大肠杆菌与生活在塑料的大肠杆菌一样吗?常常通过平均核酸相似性(Average Nucleotide Identity, ANI)来衡量。 基本思想是比对两个基因组并计算比对中错配的数量。 例如,ANI为99%的基因组每100个碱基之间有1个错配,而ANI为95%的基因组每100个碱基之间有5个错配,原创 2023-11-10 20:28:22 · 2041 阅读 · 3 评论 -
Antismash-BigScape次级代谢基因簇鉴定
antiSMASH - the antibiotics and Secondary Metabolite Analysis SHell,是用来鉴定微生物基因组次级代谢物合成基因簇的软件。临床上使用的大部分抗生素和药物均来自植物或微生物的天然产物。结合基因组挖掘的经典分离与分析法使得基于基因组的天然产物途径鉴定和描述更为方便。一般情况下,参与次级代谢途径中生物合成酶基因在基因组上成簇排列,基于指定类型的HMM,antiSMASH数据库能准确鉴定所有已知的次级代谢簇。原创 2022-10-05 22:25:10 · 10989 阅读 · 6 评论 -
MetaWrap流程
文章目录BENCHMARKING METHODSMetaWRAP-Read_qcMetaWRAP-AssemblyMetaWRAP-KrakenBENCHMARKING METHODSCAMI binning benchmarkinghttps://github.com/bxlab/metawrap_paper/blob/master/running_metawrap_on_cami_data_commands.sh contains the commands used for this anal原创 2020-12-09 10:01:37 · 2572 阅读 · 0 评论 -
蛋白工厂(rRNA)和物流系统(tRNA)的识别鉴定-Barrnap,Infernal和tRNA-scan-SE
简介tRNA和rRNA是生命分子中最基本的两种构件,负责蛋白的生成。在原核生物中,上述两种基因与其他单拷贝基因不同,往往具备多个拷贝基因。rRNA在细菌中一般1-15个,在古菌中一般1-4 个拷贝rrnDB;tRNA至少18/20个,且与rRNA的数量呈现正相关tRNA拷贝数与rRNA拷贝数呈现正相关关系rrnDB16S rRNA在基因组中的拷贝数情况,多数在1-8个拷贝InfernalInfernal(“INFERence of RNA ALignment”)是用于搜索DNA序列数据库中的原创 2021-10-30 21:13:21 · 2428 阅读 · 0 评论 -
Bowtie2详细文档
文章目录Index比对选择n条reads快速比对Indexbowtie2-build --threads 20 reference.fa reference_bt2_index比对选择n条reads快速比对bowtie2 -x Bowtie2_Index/HTR8_bw2 -1 ~/Ocean_metagenome/Trim_galore/HTR8_1_val_1.fq.gz -2 ~/Ocean_metagenome/Trim_galore/HTR8_2_val_2.fq.gz --very-原创 2021-03-22 21:08:28 · 8773 阅读 · 0 评论 -
MASH--超快速估计基因组距离
MashMash, Fast genome and metagenome distance estimation using MinHashInstallUsageTutorials简单基因组距离评估下载 E. coli 基因组:genome1.fnagenome2.fna运行:mash dist genome1.fna genome2.fna结果:制表符分割的文件,代表着Reference-ID, Query-ID, Mash-distance, P-value, and Ma原创 2021-03-15 16:58:57 · 5372 阅读 · 5 评论 -
Excel中”诡异“的文本转换以及解决方法-word标题前的小黑块
文章目录说问题解决方法是智能化还是自作聪明?参考说问题Excel应该是Windows用户日常办公最常用的软件,但是不知道你有没有遇到过这种”诡异“情况,当你直接在单元格中输入或者从文本中复制粘贴诸如sep1的单词到单元格时,它倔强的给你变成1-Sep,无论你输入多少次。其实,这是Excel的自动处理日期格式在作祟,凡是与日期格式相关的文本都会自动被Excel变成它预先定义好的格式。这些与日期格式相关的文本类型如下:2017-06-19 # 年月日1-2 #月-日2/3 #月/日SEPT2 #月份原创 2021-03-05 18:22:05 · 762 阅读 · 0 评论 -
Prodigal-原核生物基因预测
文章目录参考prodigal -i my.metagenome.fna -o my.genes -a my.proteins.faa -p metanohup time prodigal -a HTR8.faa -d HTR8.fna -f gff -o HTR8.gff -p meta -i ../HTR8_Megahit.fa &>HTR8.log &-a: 输出选中文件的蛋白翻译结果.-c: 不允许注释的基因超出基因组序列的边缘.-d: 将基因序列输出到该文件原创 2021-02-06 21:56:51 · 15202 阅读 · 0 评论 -
宏基因组组装神器-MEGAHIT使用及常见问题
错误信息std::bad_alloc/Exit code -6排错从中断点重新跑:nohup megahit --continue -o Cluster3 &>Log/cluster3_coassembly_continue.log &-o 为之前的输出结果目录原创 2021-02-01 19:05:16 · 17072 阅读 · 2 评论 -
随手“一片”SCI,Qiime2扩增子处理流程确定不了解一下?
文章目录conda安装qiime2导入数据制作Manifest和Metadata表Import数据查看原始数据质量DADA2去噪、去嵌合体和生成OTU构建进化树绘制稀释曲线计算物种多样性物种组成分析基于sklearn方法基于blast和vsarch方法qiime2其他常用操作导出制表符分割的特征表折叠物种分类单元按样本筛选特征表参考作者:余涛email:yutao@im.ac.cn中国科学院...原创 2020-03-09 15:51:22 · 6647 阅读 · 0 评论 -
conda.c~是个什么鬼,我的conda呢
文章目录conda不见了,惊出我一身冷汗找回condaconda不见了,惊出我一身冷汗日常通过conda安装一个软件时,下载包后进入transaction阶段,在未完成时终端mobaxterm意外退出,当再次登上服务器时,发现conda命令找不到了。头一次遇到这种问题,以为是环境变量出问题,遂去conda安装目录下查看,发现找不到conda和activate可执行文件了,而只看到conda.c~和conda-enc.c~,尝试执行报错,conda去哪儿了呢?这个安装过程的意外break直接把cond原创 2020-08-11 22:50:32 · 1001 阅读 · 3 评论 -
查询宇宙生命的家谱--TaxonKit工具详解
文章目录遇到的问题taxonkit 概述taxonkit安装安装下载依赖数据taonkit使用1)列出给定taxonomy id的子分类树2)从taxid获取完整谱系3)重新构造谱系的格式4)通过物种拉丁名查询taxid:name2taxid回到问题一个也不能少参考作者:余涛email:yutao@big.ac.cn中国科学院大学遇到的问题在做宏基因组分析时,通过基因注释得到一个包含10...原创 2019-06-18 15:07:12 · 4465 阅读 · 0 评论 -
生物序列处理神器--bioawk
文章目录膜拜bioawk简介安装分步安装一步安装脚本使用语法实例Reference作者:余涛email:yutao@big.ac.cn中国科学院大学膜拜做生信的应该没有人不知道李恒大神了,鼎鼎大名的BWA在2009年到2019年短短10年的引用次数已经接近20K了,这样的引用次数对于生物软件来说绝对是数一数二的了。除此之外,Samtools、MAQ、TreeFam等也都是他的杰作。下面是...原创 2019-06-19 22:14:42 · 3350 阅读 · 0 评论