自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 所见所想随笔2

人生可以失败无数次,但绝不要被打倒我喜欢很多美好的东西,喜欢到想要变成他们,从风景到植物、动物,他们让我感到放松与快乐,是一种纯粹的美好。星空,我表白过无数次的神秘的动态世界,不管过了多久,依然会为了找到一颗明亮的星,知道一个星座的位置,一些漂亮的图案,甚至是一抬头就能见到的北斗七星而欢呼雀跃。不厌其烦的寻找北极星的位置。小时候是觉的星星好看,也是因为一个好朋友很喜欢他们,现在却成了我一个人的坚守。科研真的是让我又爱又恨,我绝大多数的情绪变化都是因为它。别人评价我说,抗压能力太差,只适合活在顺境中。

2021-06-22 10:22:07 135

原创 所见所闻随笔1

随着时间的流逝,我们慢慢的长大,还真是越长大越孤独,你很难找到有相同兴趣爱好的人。当你兴高采烈的去和别人分享你发现的感兴趣的事物时,很少会得到你所期待的反馈。所以,博客是一个很好的分享的平台。...

2021-06-16 16:43:35 171

原创 2021-04-14

R ggplot数据抖动首先,我们先来画一个图:ggplot(data = mpg) +geom_point(mapping = aes(x = displ, y = hwy, color = class))虽然数据集中有 234 个观测值,但散点图中只显示了 126 个点?这是因为有一些点重合了,这个问题称为过绘制。点的这种排列方式很难看出数据的聚集模式,为了更加清晰的帮助我们观测数据,理解数据,数据抖动就可以派上用场了。通过将位置调整方式设为“抖动”,可以避免这种网格化排列。 positio

2021-04-14 20:17:48 135

原创 2021-04-14

ggplot中几何对象和统计变换对应表绘图时用来计算新数据的算法称为 stat(statistical transformation, 统计变换)。统计变换可以生成新的变量并在图形中展示。通过查看 stat 参数的默认值,你可以知道几何对象函数使用了哪种统计变换。例如, ?geom_bar 显示出 stat 的默认值是 count,这说明 geom_bar() 使用 stat_count() 函数进行统计变换。 stat_count() 在文档中与 geom_bar() 位于同一页,如果继续向下看

2021-04-14 19:45:36 178

转载 2020-09-11

xargs 是给命令传递参数的一个过滤器,也是组合多个命令的一个工具。xargs 可以将管道或标准输入(stdin)数据转换成命令行参数,也能够从文件的输出中读取数据。xargs 也可以将单行或多行文本输入转换为其他格式,例如多行变单行,单行变多行。xargs 默认的命令是 echo,这意味着通过管道传递给 xargs 的输入将会包含换行和空白,不过通过 xargs 的处理,换行和空白将被空格取代。xargs 是一个强有力的命令,它能够捕获一个命令的输出,然后传递给另外一个命令。之所以能

2020-09-11 15:56:27 58

转载 NGS数据过滤之trimmomatic

NGS 原始数据过滤对后续分析至关重要,去除一些无用的序列也可以提高后续分析的准确率和效率。Trimmomatic 是一个功能强大的数据过滤软件。Trimmomatic 介绍Trimmomatic 发表的文章至今已被引用了 2810 次,是一个广受欢迎的 Illumina 平台数据过滤工具。其他平台的数据例如 Iron torrent ,PGM 测序数据可以用 fastx_toolkit 、NGSQC toolkit 来过滤。Trimmomatic 支持多线程,处理数据速度快,主要用来去除 Il

2020-09-07 19:47:56 2020 2

原创 Linux后台运行命令的方法

Linux后台运行命令的方法1、nohup用法:nohup command &#这种是最基础的后台运行的命令,一般会默认生成一个nohup.out的日志文件,存储运行过程。如果没有放个后台的话是会直接在控制台打印出来的。当然,有的命令不会记录过程,也就没有这个日志文件。如果要指定日志文件的名字的话,运行下面的命令即可:myout.file就是文件名nohup command > myout.file 2>&1 &当command中也有一个 “>”

2020-08-13 23:31:08 222

原创 GATK BaseRecalibrator报错”The contig order in dbsnp_138.hg38.vcf and reference is not the same“

GATK BaseRecalibrator报错”The contig order in dbsnp_138.hg38.vcf and reference is not the same“首先,用 picard 中的SortVcf将dbsnp_138.hg38.vcf根据参考基因组排序picard SortVcf -I dbsnp_138.hg38.dic.vcf -O order_dbsnp_138.hg38.vcf -SEQUENCE_DICTIONARY hg38.dict 如果报错为“java

2020-08-12 19:45:18 661

原创 BWA处理WES文件

BWA处理WES文件的用法及注意事项1. 构建索引bwa index -a bwtsw hg38.fa构建索引时需要注意的问题:bwa构建索引有两种算法,两种算法都是基于BWT的,这两种算法通过参数-a is 和-a bwtsw进行选择。其中-a bwtsw对于短的参考序列是不工作的,必须要大于等于10Mb;-a is是默认参数,这个参数不适用于大的参考序列,必须要小于等于2G。整个过程会得到5个文件hg38.fasta.amb、hg38.fasta.ann、hg38.fasta.bwt、hg38

2020-08-03 10:59:05 553

原创 下载GATK中存储的snp vcf文件

下载GATK中存储的snp vcf文件写这篇文章的目的是为了以后不迷路,哈哈。我可以花了很长时间二次查找。GATK是我们在找somatic snp时经常会用到的工具,它可以对可能存在小插入或者缺失的位点进行重新排列和校准!GATK里存储了很多版本的vcf文件以下载hg38版本为例网址为ftp://ftp.broadinstitute.org/bundle/hg38/我们可以在服务器上直接下载wget -b -c ftp://gsapubftp-anonymous@ftp.broadinsti

2020-08-01 20:01:49 2957

原创 单细胞文章解读——用单细胞RNA测序技术分析与肿瘤转移相关的细胞间通讯

题目:Analysis of Single-Cell RNA-Seq Identifies Cell-Cell Communication Associated with Tumor Characteristics

2020-04-21 23:07:14 5602

原创 单细胞文章解读——使用单细胞RNA测序识别人乳房上皮细胞的细胞多样性

Profiling human breast epithelial cells using single cell RNA sequencing identifies cell diversity

2020-04-17 00:14:04 1525

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除