使用gce进行基因组survey

爱宝&～～

已于 2024-01-09 14:46:08 修改

阅读量1.2k

点赞数 18

文章标签： linux

于 2024-01-09 12:02:40 首次发布

本文链接：https://blog.csdn.net/weixin_69890544/article/details/135440067

版权

gce的使用方法：首先在github中下载安装包（https://github.com/fanagislab/GCE），解压，进入gce.1.0.2，使用make进行编译，编译后，使用gce进行基因组survey

在使用gce进行基因组survey时，一定要注意使用的命令，如果使用第一步的kmerfreq命令，就需要指定kmerfreq的位置，如果使用gce命令，就要指定gce的地址

第一步，获取测序数据的K-mer频率

./gce-1.0.2/kmerfreq -k 17 -t 10 -p ara cleandatalist
# -k 是kmer大小，一定要在13-19之间，不然会报错，
-p是输出文件前缀，
最后的cleandatalist是一个文件，里面每一行都是测序数据的地址，
具体样式见下图

运行之后会得到一个后缀是kmer.freq.stat的文件，我的前缀是ara，所以文件就是ara.kmer.freq.stat，使

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

爱宝&～～

关注关注

18
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

基因组survey

weixin_69890544的博客

01-09

1319

jellyfish count -C -m 21 -t 3 -s 500M -o genomesurvey/kmer_count.jf il_1_clean.fq il_2_clean.fq#这里注意双端测序需要用-C参数，-m 较小基因组推荐使用17，较大基因组推荐使用21，-s。./gce -g 3295248520 -f ara.kmer.freq.stat.2colum >gce.table 2>gce.log#使用之前的得到的-g和-f参数进行基因组survey，纯合模式。

用k-mer分析进行基因组调查：（五）用GCE分步实现

qq_40569830的博客

06-18

1266

介绍GCE，用GCE的kmerfreq做基因组调查(genome survey)的k-mer频数统计，GCE的gce做基因组特征评估。

参与评论您还未登录，请先登录后发表或查看评论

基因组Survey分析

shuai19970911的博客

04-02

966

流程图：图片来源：https://www.jianshu.com/p/94da86093843。

「基因组survey」使用GenomeScope进行基因组分析

xuzhougeng blog

05-15

4734

在我写的基因组survey介绍了如何通过jellyfish统计k-mer然后绘制k-mer分布图研究基因组的方法。由于最近又在搞基因组survey，又检索了一波资源，发现了一个分析工具，所以有了这篇教程。 GenomeScope 是2017年发表在 bioinformatic 的一个工具，最近一次更新在2018年2月16日。这个工具的目的就是处理一些高复杂度的基因组，比如说高杂合度...

基因组survey评估

07-25

总结起来，基因组survey评估是通过使用软件和方法来估算基因组大小，并根据物种的复杂程度来进行判断。 #### 引用[.reference_title] - *1* *2* *4* *5* [基因组组装---基因组大小评估（genome survey）]...

用k-mer分析进行基因组调查：（一）基本原理

qq_40569830的博客

06-14

5144

基因组调查(genome survey)指基因组特征评估，一般指通过k-mer分析二代测序数据，获得基因组大小(genome size)，杂合度(heterozygosity)，重复序列比例，GC含量等基因组信息的手段。

基因组组装之GCE的使用

qq_44652539的博客

05-07

1546

首先将测序获得的fragment.?.fastq文件写入一个列表并命名为read.list read.list 文件内容如下：紧接着输入下图命令，估计基因组大小。运行截图运行后生成两个文件E_coli.log和E_coli.table 下图是使用H参数后所得结果 ...

GCE的安装和使用

weixin_44616693的博客

10-24

976

计算重复序列占比R=1-b[1/2]-b[1]=1-0.101873-0.279256=61.89%，杂合度H=[a[1/2]/(2-a[1/2])]/kmer_value=[0.270554/(2-0.270554)]/17=0.92%#若计算的杂合度H<0.5%，则表示该物种是纯合物种，那么重复序列占比R需要重新计算，使用文件17mer_shuxi.log中的信息。R=1-b[1]=1-0.431343=56.87%#依据genome_size、a[1/2]、a[1]、b[1/2]、b[1]值。

基因组组装---基因组大小评估（genome survey）

cfc424的博客

08-29

8737

基因组组装---基因组大小评估（genome survey）

使用 GCE 进行基因组大小评估

云之南

03-31

2835

使用 GCE 进行基因组大小评估 1. GCE 简介 GCE(Genome Characteristics Estimation) 是华大基因用于基因组评估的软件，其参考文献为：Estimation of genomic characteristics by analyzing k-mer frequency in de novo genome projects。下载地址：ftp://ftp.genomics.org.cn/pub/gce。 GCE 软件包中主要包含 kmer_freq_hash 和

「干活」基因组组装之前要做的：Genome Survey

陈有朴的博客

10-16

1158

Genome Survey：jellyfish + kmc + Genome Scope 2.0 + Smugdeplot

awk学习笔记

weixin_34006965的博客

04-30

5256

不错的学习链接：所以拷贝下来了http://sebug.net/paper/books/awk/ awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息awk处理过程:依次对每一行进行处理，然后输出awk命令形式:awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END...

生信分析常用脚本（二）--SOAPdenovo

weixin_30426879的博客

11-02

1037

1.SOAPDenovo配置文件示例软件下载安装和使用：http://soap.genomics.org.cn/soapdenovo.html asm.cfg #maximal read lengthmax_rd_len=100 [LIB] avg_ins=450#if sequence needs to be reversed reverse_seq=0#in which ...

GCE 开源项目使用教程

最新发布

gitblog_01162的博客

09-13

747

GCE 开源项目使用教程 gce The Game Communication Environment (GCE) is an actor model framework for online game development. ...

在GCP上创建GCE的三种方式(Console,gcloud,Terraform)

南瓜慢说

01-12

778

1 简介如果要选择GCP为云平台，则经常需要创建GCE(Google Compute Engine)，有以下几种方式： (1) 在浏览器创建 (2) 命令 gcloud (3) Terraform 在开始之前，可以查看：《初始化一个GCP项目并用gcloud访问操作》。 2 GCP Console 登陆操作界面，点击创建按钮，然后选择好参数即可：会显示出对应的价格。 3 gcloud命令在操作界面创建时，可以直接查看对应的gcould命令：我们直接运行就可以创建了： $ gcloud compu

纯二代测序从头组装基因组

weixin_33737774的博客

03-09

4085

基因组组装 基因组组装一般分为三个层次，contig, scaffold和chromosomes. contig表示从大规模测序得到的短读(reads)中找到的一致性序列。组装的第一步就是从短片段(pair-end)文库中组装出contig。进一步基于不同长度的大片段(mate-pair)文库，将原本孤立的c...

基因组组装流程

weixin_34220834的博客

06-12

2978

1. 前期准备背景信息： GC含量和 GC分布 基因组重复程度 基因组大小估计杂合情况最好的情况是对方能提供已经发表的近源物种。根据近源物种分析以上信息，尤其是GC含量以及对应的GC分布，重复程度。 2. 测序策略根据基因组大小和具体情况选择个大概的k值，根据“测序X数推导说明.pdf”制定用于构建contig所需的数据量以及所需的构建的文库数量。对于植物基因组一般考虑的是大kmer...