![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 56
不锈铁
想去更高的山,更远的水,见识更好的风景。
展开
-
metawrap宏基因组数据处理流程(亲测有用)
MetaWRAP旨在成为一个易于使用的宏基因组数据分析软件包,从头到尾完成宏基因组分析的核心任务:序列质量控制、组装、可视化、分类分析、提取基因组草图(又称分箱binning)和功能注释。此外,metaWRAP将bin提取和分析提升到了一个新的层次(参见下面的模块概述)。虽然没有简单的最佳方法来处理宏基因组数据,但在深入研究分析参数之前,metaWRAP是一种快速而简单的方法。MetaWRAP可应用于多种环境,包括肠道、水和土壤微生物组(详情请参阅MetaWRAP手册)原创 2023-02-12 12:55:24 · 4525 阅读 · 2 评论 -
python包--pandas的用法(最全pandas的用法--数据处理十分有用,后面会一直更新)
pandas是一个是一个python包,可以很大程度上加快我们对数据的处理。花费时间把这个包平常经常用到的函数整理一下,方便大家,也方便自己使用。原创 2022-10-06 20:13:05 · 3454 阅读 · 0 评论 -
contig N50---小脚本
基因组N50, GC 含量计算原创 2022-08-17 23:27:04 · 3172 阅读 · 0 评论 -
bowtie和bwa比对,reads mapping contig
bowtie和bwa比对的用法原创 2022-08-01 23:52:58 · 592 阅读 · 0 评论 -
MUMmer比对大片段序列(基因组)
mummer 大序列比对原创 2022-08-01 19:52:56 · 661 阅读 · 0 评论 -
比对软件-blastN结果详解
blast的结果详解原创 2022-07-24 17:04:33 · 5880 阅读 · 4 评论 -
从EBI中ENA数据库下载原始数据accession的详细信息以及序列
文章目录1. ENA 数据库的检索功能1. 简单搜索2. 复杂搜索2. ENA 数据库中的accession的详细信息下载3. ENA 数据库中的accession的序列下载学生物的大概都会用到EBI数据库,而其中的ENA数据库更是包含着丰度的序列信息,那么怎么获取他们呢?1. ENA 数据库的检索功能ENA数据库网址:https://www.ebi.ac.uk/ena/browser/home在下载信息之前首先是检索信息:1. 简单搜索如下图,直接搜多sediment的信息,就会有很多相关的序原创 2022-02-12 23:36:48 · 7255 阅读 · 0 评论 -
R语言实战 ---学习心得08--回归分析
文章目录1. 回归分析1.1 简单线性回归模型 ``lm()``1.2 多项式回归模型1.3 多元线性回归1. 回归分析定义: 自变量和因变量之间的关系,可以用回归方程是表达出来。对于回归分析常用的函数:备注:1. 响应变量:因变量,2. 预测变量:自变量,3. 解释变量:总共的自变量,4. ‘:’ 变量的交互项: 指的是两个变量对应元素的乘积,得到新的数据列1.1 简单线性回归模型 lm()使用women中的数据:womenfit = lm(weight~height,原创 2021-10-21 11:02:57 · 2262 阅读 · 0 评论 -
R语言实战 07-描述性统计分析
文章目录1. 描述性统计分析1. 描述性统计分析描述性统计量分析:包括平均数,方差,极差,最大值,最小值等,属于概率论与数理统计的简单内容。# 每加仑汽油行驶英里数(mpg) 、马力(hp)和车重(wt)# 变速箱类型(am) 汽缸数(cyl)mtcars # 所用数据summary(mtcars[c("mpg","hp","wt")]) # summmary() 得到数据的统计量# length()、 range()、quantile()/mean()、sd()、var()原创 2021-10-20 09:16:10 · 890 阅读 · 0 评论 -
相关性及相关性的显著性检验
文章目录相关性:显著性:看了一些统计学的书,关于相关性,假设检验等的问题,想写一点自己的理解相关性:相关性是在指两个或者多个变量的关系的远近。举个例子:路人甲,乙,丙,丁四个人,如果按照关系的远近分为三个级别,好(1),中等(0.5),差(0)以路人甲为出发点:甲和乙关系最好,定义其相关性等级为 1显著性:...原创 2021-10-04 02:05:42 · 14466 阅读 · 0 评论 -
kegg 上ko号对应的通路数据
kegg 上ko通路数据的获取最近一直在弄kegg的一些东西,就把心得写下来吧。接着自己上面的文章:ko对应K号的表的下载得到的json文件内容部分如下:{ "name":"ko00001", "children":[ { "name":"09100 Metabolism", "children":[ { "name":"09101 Carbohydrate metabolism", "children":[ { "name":"00010 Glyc原创 2021-09-30 21:46:51 · 10671 阅读 · 2 评论 -
KEGG数据库以及 KAAS 网站注释
1. KEGG现在自己用到的KEGG数据库主要是功能注释,下面谈一下我再用KEGG 时候的经验吧。首先在kaas上传数据做基因的注释。我们用的是prokka注释过后的faa文件:是蛋白序列。当然基因序列也可以。kaas 比对网站https://www.genome.jp/tools/kaas/得到的结果会在kaas的网站:上面图片的text文件是下面的内容:打开html之后内容就是:代谢通路图(ko):K号信息:另外在kobas上可以做kegg富集分析https原创 2021-09-30 21:27:25 · 2809 阅读 · 0 评论 -
R语言实战--06--语法结构
语法结构(流程化)掌握r的语法结构能够有助于我们使我们的分析流程化。这样会更快捷方便。1. for的用法# for (条件) {输出}for (i in seq(10)) {print(i)}原创 2021-09-27 14:10:55 · 112 阅读 · 0 评论 -
R语言中 scale函数用法
scale() 函数1. 用法scale(x, center = TRUE, scale = TRUE) # x 是样本数据 (r语言中定义为 数字矩阵)# center 中心化(这里指的是减去样本数据x的平均值)# scale 标准化 (这里指的是除以样本数据x的方差)备注: 之前一直听别人说scale(标准化)是除以什么根方差 ,不太懂,所以自己就验证了一下。结论1: 在同时使用center =T 和 scale =T 的情况下,根方差的值就等于方差结论2: 在只使用cente原创 2021-09-26 22:49:08 · 12581 阅读 · 3 评论