生信
文章平均质量分 59
不锈铁
想去更高的山,更远的水,见识更好的风景。
展开
-
metawrap宏基因组数据处理流程(亲测有用)
MetaWRAP旨在成为一个易于使用的宏基因组数据分析软件包,从头到尾完成宏基因组分析的核心任务:序列质量控制、组装、可视化、分类分析、提取基因组草图(又称分箱binning)和功能注释。此外,metaWRAP将bin提取和分析提升到了一个新的层次(参见下面的模块概述)。虽然没有简单的最佳方法来处理宏基因组数据,但在深入研究分析参数之前,metaWRAP是一种快速而简单的方法。MetaWRAP可应用于多种环境,包括肠道、水和土壤微生物组(详情请参阅MetaWRAP手册)原创 2023-02-12 12:55:24 · 5284 阅读 · 2 评论 -
16s数据库
文章目录一、Greengenes数据库二、SILVA数据库三、RDP数据库一、Greengenes数据库Greengenes数据库由Lawrence Berkeley National Laboratory构建。最新版本为13.8,它对13.5的序列分类进行了修正,13.5版本总共收录16S rRNA序列1,262,986条。这是非冗余的序列,Greengenes可以用Export工具实现对数据的过滤,输出定制的数据库。qiime软件中默认使用的是greengene数据库,为97_otus.fasta这原创 2023-02-11 20:52:21 · 2971 阅读 · 0 评论 -
python包--pandas的用法(最全pandas的用法--数据处理十分有用,后面会一直更新)
pandas是一个是一个python包,可以很大程度上加快我们对数据的处理。花费时间把这个包平常经常用到的函数整理一下,方便大家,也方便自己使用。原创 2022-10-06 20:13:05 · 3616 阅读 · 0 评论 -
contig N50---小脚本
基因组N50, GC 含量计算原创 2022-08-17 23:27:04 · 3500 阅读 · 0 评论 -
bowtie和bwa比对,reads mapping contig
bowtie和bwa比对的用法原创 2022-08-01 23:52:58 · 644 阅读 · 0 评论 -
MUMmer比对大片段序列(基因组)
mummer 大序列比对原创 2022-08-01 19:52:56 · 731 阅读 · 0 评论 -
比对软件-blastN结果详解
blast的结果详解原创 2022-07-24 17:04:33 · 6939 阅读 · 4 评论 -
从EBI中ENA数据库下载原始数据accession的详细信息以及序列
文章目录1. ENA 数据库的检索功能1. 简单搜索2. 复杂搜索2. ENA 数据库中的accession的详细信息下载3. ENA 数据库中的accession的序列下载学生物的大概都会用到EBI数据库,而其中的ENA数据库更是包含着丰度的序列信息,那么怎么获取他们呢?1. ENA 数据库的检索功能ENA数据库网址:https://www.ebi.ac.uk/ena/browser/home在下载信息之前首先是检索信息:1. 简单搜索如下图,直接搜多sediment的信息,就会有很多相关的序原创 2022-02-12 23:36:48 · 7792 阅读 · 0 评论 -
blast在linux上的用法
blastblast包含核酸序列比对,蛋白序列比对等。主要有两个步骤:建库 (makeblastdb)比对 (blast)mdkebalstdb和blast的参数makeblastdb -in input_file-input_type type #输入的文件类型:String, `asn1_bin', `asn1_txt', `blastdb', `fasta'-dbtype molecule_type #要生成的数据库类型:String, `nucl', `prot'-tit原创 2021-11-29 18:55:48 · 7590 阅读 · 0 评论 -
当厌氧菌遇见氧气之后,氧毒性、耐受性和防御性机制
文章目录摘要:背景研究内容厌氧菌的生长环境厌氧菌的两种氧气利用机制氧气毒性与生长停滞体内氧中毒研究以及体外结果的证实和扩展 (实验验证)最近一直忙于开题报告,在这件事中收获颇丰,接受的打击也颇丰。但是这事情总算是快告一段落了,有空去读读文献,接受一下新思想了。来自Nature Reviews Microbiology的一篇文章:当厌氧菌遇见氧气之后,氧毒性、耐受性和防御性机制摘要:问题:氧气会阻碍厌氧菌的生长,其中的机制尚不知道。之前的假设:厌氧菌为进化出对超氧化物或过氧化氢等活性氧化物原创 2021-11-16 11:05:12 · 3937 阅读 · 0 评论 -
python学习心里之——再学习
文章目录1. python之初学1.1 python是什么?1.2 python的文件1.3 python命令行形式1.4 变量的赋值1.5 变量的运算1.6 更深层次1. python之初学在学习一个东西的时候,总要弄明白它是什么,然后再学,这样才能更有逻辑的学习1.1 python是什么?python是一门语言,而这门语言是人类与计算机沟通的语言。当然类似的语言有很多,比如c,c++,php等等人和人之间沟通是说话;而人和机器沟通的python语言是.py文件;.py文件就集成了所有的原创 2021-10-21 13:49:59 · 61 阅读 · 0 评论 -
R语言实战 ---学习心得08--回归分析
文章目录1. 回归分析1.1 简单线性回归模型 ``lm()``1.2 多项式回归模型1.3 多元线性回归1. 回归分析定义: 自变量和因变量之间的关系,可以用回归方程是表达出来。对于回归分析常用的函数:备注:1. 响应变量:因变量,2. 预测变量:自变量,3. 解释变量:总共的自变量,4. ‘:’ 变量的交互项: 指的是两个变量对应元素的乘积,得到新的数据列1.1 简单线性回归模型 lm()使用women中的数据:womenfit = lm(weight~height,原创 2021-10-21 11:02:57 · 2400 阅读 · 0 评论 -
R语言实战 07-描述性统计分析
文章目录1. 描述性统计分析1. 描述性统计分析描述性统计量分析:包括平均数,方差,极差,最大值,最小值等,属于概率论与数理统计的简单内容。# 每加仑汽油行驶英里数(mpg) 、马力(hp)和车重(wt)# 变速箱类型(am) 汽缸数(cyl)mtcars # 所用数据summary(mtcars[c("mpg","hp","wt")]) # summmary() 得到数据的统计量# length()、 range()、quantile()/mean()、sd()、var()原创 2021-10-20 09:16:10 · 926 阅读 · 0 评论 -
相关性及相关性的显著性检验
文章目录相关性:显著性:看了一些统计学的书,关于相关性,假设检验等的问题,想写一点自己的理解相关性:相关性是在指两个或者多个变量的关系的远近。举个例子:路人甲,乙,丙,丁四个人,如果按照关系的远近分为三个级别,好(1),中等(0.5),差(0)以路人甲为出发点:甲和乙关系最好,定义其相关性等级为 1显著性:...原创 2021-10-04 02:05:42 · 15077 阅读 · 0 评论 -
kegg 上ko号对应的通路数据
kegg 上ko通路数据的获取最近一直在弄kegg的一些东西,就把心得写下来吧。接着自己上面的文章:ko对应K号的表的下载得到的json文件内容部分如下:{ "name":"ko00001", "children":[ { "name":"09100 Metabolism", "children":[ { "name":"09101 Carbohydrate metabolism", "children":[ { "name":"00010 Glyc原创 2021-09-30 21:46:51 · 11231 阅读 · 2 评论 -
KEGG数据库以及 KAAS 网站注释
1. KEGG现在自己用到的KEGG数据库主要是功能注释,下面谈一下我再用KEGG 时候的经验吧。首先在kaas上传数据做基因的注释。我们用的是prokka注释过后的faa文件:是蛋白序列。当然基因序列也可以。kaas 比对网站https://www.genome.jp/tools/kaas/得到的结果会在kaas的网站:上面图片的text文件是下面的内容:打开html之后内容就是:代谢通路图(ko):K号信息:另外在kobas上可以做kegg富集分析https原创 2021-09-30 21:27:25 · 2931 阅读 · 0 评论 -
R语言实战--06--语法结构
语法结构(流程化)掌握r的语法结构能够有助于我们使我们的分析流程化。这样会更快捷方便。1. for的用法# for (条件) {输出}for (i in seq(10)) {print(i)}原创 2021-09-27 14:10:55 · 129 阅读 · 0 评论 -
R语言中 scale函数用法
scale() 函数1. 用法scale(x, center = TRUE, scale = TRUE) # x 是样本数据 (r语言中定义为 数字矩阵)# center 中心化(这里指的是减去样本数据x的平均值)# scale 标准化 (这里指的是除以样本数据x的方差)备注: 之前一直听别人说scale(标准化)是除以什么根方差 ,不太懂,所以自己就验证了一下。结论1: 在同时使用center =T 和 scale =T 的情况下,根方差的值就等于方差结论2: 在只使用cente原创 2021-09-26 22:49:08 · 13336 阅读 · 3 评论 -
R语言实战---05--函数
高级数据管理简单的数据管理只是有效的管理数据,二高级数据管理则是更近一步,只有充分了解r语言的控制流程,算术函数等,才可以更高效的处理数据。为了方便,以下所有的分析,我都会基于r提供的原始数据进行分析。本节目的学习用于创建和转换变量的算术函数、字符处理函数和统计函数。探索控制程序流程的方式之后,了解如何编写自己的函数。如何使用这些函数来整合及概括数据。一. 数值和字符处理函数> abs(x) #绝对值 abs(-4) #返回值为 4 sqrt(x) #平方根, sqrt(25)原创 2021-09-06 11:30:50 · 836 阅读 · 0 评论 -
R 语言实战---04--数据处理
数据整理无论是输入外部数据还是R本身写入的数据,斗殴要经过处理才能使我们更好的分析。在我们做诗句处理前,先了解一下R中的算术运算符和逻辑运算符。算术运算符:就是加减乘除类的符号。逻辑运算符:表示判断的符号。1. 算术运算符如下:2.逻辑运算符如下:一. 数据表的修改首先我们定义一组数据:manager <- c(1, 2, 3, 4, 5) date <- c("10/24/08", "10/28/08", "10/1/08", "10/12/08", "5/1/09"原创 2021-09-05 20:40:35 · 653 阅读 · 0 评论 -
R 语言实战---03--数据导入
一. 数据的输入R语言本身就是处理数据分析,以及数据可视化的。在数据分析中,对于数据的输入就尤为重要,今天我们就介绍数据在R中的输入。R语言的数据输入包括两种:1. 是R自身带的编辑器;2. 外部输入数据。1. R自身带的编辑器# 数据的手动输入# mydata <- data.frame(age=numeric(0),gender=character(0),weight=numeric(0))# 两种方法编辑数据集# edit要重新赋值mydata = edit(mydata)#原创 2021-09-03 23:53:55 · 1371 阅读 · 0 评论 -
R语言实战---02--数据结构
数据集结构数据集通常是由数据构成的一个矩形数组,行表示观测,列表示变量。不同的行业对于数据集的行和列叫法不同。统计学家称它们为观测(observation)和变量(variable),数据库分析师则称其为记录(record)和字段(field),数据挖掘和机器学习学科的研究者则把它们叫作示例(example)和属性(attribute)。(摘录自R语言实战第2版)R 的数据结构R中有许多用于存储数据的结构,包括标量、向量、数组、数据框和列表。R可以处理的数据类型(模式)包括数值型、字符型、逻辑原创 2021-09-03 22:38:38 · 506 阅读 · 0 评论 -
r语言实战----01--安装下载
1. R 简介R 是现今最受欢迎的数据分析和可视化平台之一。它是自由的开源软件,并同时提供 Windows、Mac OS X 和 Linux 系统的版本。数据分析:对于数据的处理,加工,分析,和得出结论。可视化:将得到的结果用图表的形式变现出来。2.R 安装R可以在CRAN(Comprehensive R Archive Network,http://cran.r-project.org)上免费下载。Linux、Mac OS X和Windows都有相应编译好的二进制版本。根据你所选择平台的安原创 2021-09-03 16:42:22 · 321 阅读 · 0 评论 -
fastq 文件的处理
fastq 文件处理fastq文件格式@FCD056DACXX:3:1101:2163:1959#TCGCCGTG/1TCCGATAACGCTCAACCAGAGGGCTGCCAGCTCCGATCGGCAGTTGCAACCCATTGGCCGTCTGAGCCAGCAACCCCGGA+gggiiiiiiiiiiiiiiiiiiiiiiiiiigggggeeecccccc^bcbcccccccbccccc]aaccbbccc^R^^acccc_@FCD056DACXX:3:1101:2194:1984#原创 2021-08-31 23:02:42 · 2964 阅读 · 0 评论 -
linux 虚拟机下载Anaconda问题解决:
linux 虚拟机下载Anaconda问题解决:1.下载下载conda包-------https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/一般是下载最新的版本,具体看个人需求。下载完直接拖到虚拟机里,然后执行命令:bash + 你文件的位置最后一步步操作就行了。修改环境变量在安装完成之后,一般输入conda命令,就会有效果了。如果没有效果就要配置环境变量-----vim/etc/profile再最后一行添加:exportPATH=原创 2021-01-27 21:24:59 · 858 阅读 · 0 评论