自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 XP—EHH画图+理解全流程+报错分析

LD通常是指两个等位基因之间的关联程度,在这里,我们用LD来衡量一个位点的单个等位基因与不同距离处的多个位点之间的关联程度。由于重组,突变附近的LD将大幅衰减,大多数等位基因通常是比较古老的突变并且具有较短范围的LD。而一个新突变正在经历正选择(这里主要考虑Hard sweep)的关键特征就是等位基因频率在群体中异常快速上升,发生的时间足够短以至于重组基本上来不及破坏所选突变的单倍型,简而言之,正选择印记就是一个等位基因在给定群体频率下具有异常长范围的LD。

2024-04-07 12:30:31 1129 2

原创 我一直想开启的Perl学习(1)

能解决excel不能处理的巨大数据比R快捷,和R一样容易接受比较为熟悉的c++的代码少很多在我十几年的读书生涯里面,我能接触的是C++,所以之后不管学习啥语言我都会和C++做对比,而python虽然很多人学,网上资料很多,但是我不太能接受,再加上,我只是单纯的对数据的处理,没有要爬虫或者是机械学习那种,Perl对我来说比较好上手我掌握的也不是很完美,只能做很基础的事情但是好事说得好,哎,不知道为啥最近有点不求上进,不想逼迫我自己了,先把自己该干的事情完全掌握才是对的再说吧。

2024-03-21 10:35:58 253 2

原创 Treemix分析流程+报错分析+基本理解

这里就不重复写了。

2024-03-21 10:08:15 394 2

原创 关联分析之可视化QQ图和曼哈顿图,2.0版本

根据上一篇文章的选择,

2023-12-11 18:43:01 2567 3

原创 关联分析的理解,1.5版本

1.1.1全基因组关联分析(Genome-Wide Association Study, GWAS),GWAS是一种用于识别遗传区域(基因座)和性状(包括疾病)之间关联的无假设方法, 在群体水平上解析性状遗传基础的方法。通俗点,在一个从常见基因突变(common variant,>5%的人口所具有的突变)中来找到至病的变异(SNP),然后可以针对这个变异进行更广泛的科研。举个例子说明一下,比如,我们在世界上找到了一组身高超过姚明身高的‘小巨人’,身高就是这些‘小巨人’的性状特征。

2023-12-11 01:11:37 949 1

原创 单倍型分析过程,旧+新,1.0版本(下)

旧版消耗时间过长,过于麻烦,接下来看一下我最近刚刚学到的新版新版有可能有一些隐藏的问题,因为我只浅浅试了一个小的数据,

2023-12-08 11:48:53 533

原创 单倍型分析理解性问题,以及图如何看,2.0版本

先看一些文章,再看一个图片,相信能有一个很好的理解,单倍型分析 - 简书 (jianshu.com)参考基因组新时代 — “单倍型”参考基因组 - 简书 (jianshu.com)生信:haplotype 单倍型分析全解,基于vcf文件进行基因单倍型分析 (qq.com)单倍型甚至还有一个官网单倍型 (genome.gov)Haplotype:SNP :是指基因组上由单个核苷酸的变异所引起的DNA序列多态性。单倍型(haplotype):位于一条染色体上某一区域的一组相关联的多个SNP等位位点被称作。

2023-12-08 09:33:41 4149

原创 对snpeff注释的理解性问题3.0版本

半夜两三点的时候,我用代码跑linux的时候,无意间看到最后一个是报错信息,也就是说,报错信息会直接体现出来,把注释好的vcf放在在kate里面,真的emmm不知道说啥,亏我找了那么久,b不然我真得通宵了。

2023-12-06 21:34:41 1198 1

原创 snpeff注释最全,包括错误分析和理解,3.0版本

经过半个月的乱七八糟,更新最近能理解的东西首先自行去官网下载一个压缩包,经常用得到,反正数据有问题卸载之后再次安装可以重新构建这里我重新构建一下,也算是重新整理一份snpeff需要Java环境,自己去下载Java然后环境配置,记得生效,这个是我的路径,改一下路径就OK。

2023-11-28 22:44:52 3918 2

原创 好吧,C,Perl、Python学习历程

用的是国内镜像下载的网上一堆教程,推荐看这个课程,有有关环境配置的教程、下载的是eclipse。首先我们得需要解释器。

2023-11-16 01:02:15 39 1

原创 如何在乌班图上安装Java

注意在下载之前一定要先创造环境 ,这里就不多说了。然后用,直接下载,rpm包主要用于及分支如redhat,centos,Fedora等而deb包主要用于debian及分支如debian,ubuntu等。

2023-10-31 10:36:19 84 1

原创 关联分析全程,理解+过程,2.0版

c,vcf的二进制文件,G2,FID ID文件#bim/bed/fam转ped/map查看多少个位点。

2023-10-28 16:07:43 114

原创 关于PCA一直到GCTA的一些理解笔记

关于PCA的一些理解笔记,自己总结的,欢迎讨论。其实有很多知识得自己去理解,但是发现有关遗传学的基本上都涉及高难度计算了,只能按照我现有的水平去理解了。如果PCA没有明显的分层,说明协变量也没有显著性,加入模型也不会影响结果。在理解协方差,之前,

2023-10-15 21:17:29 79

原创 Ubuntu22.04的基本操作

个人学习笔记,感觉用得比较多首先我不是卸载Ubuntu重新安装了吗,现在需要更新一下,直接更新可能会报错,泪如现在我们需要进入root。

2023-10-13 22:00:43 378

原创 安装GWAS的软件汇总,最全

由于我总是把软件安装在基础环境里面,导致各种报错和不兼容,接下来重新卸载和安装乌班图以及长用的一些软件。

2023-10-13 10:43:13 251

原创 单倍型分析过程,旧+新,2.0版本(上)

1.VCF转成的plink的二进制文件,SNP位点文件(rs-1-7602377-1678200),样本名称文件(1054 1054)2.plink1.9和Python脚本。

2023-10-12 18:34:09 832

原创 GCTA:全基因组复杂性状分析工具,1.5版本

需要plink文件的bed,切到路径下。

2023-10-11 22:46:06 1353

原创 admixture全流程+跨K颜色处理

使用pong进行可视化的时候

2023-10-10 13:43:23 652 4

原创 plink在GWAS的里面的用法

wget https://s3.amazonaws.com/plink2-assets/plink2_linux_x86_64_20231005.zipunzip plink2_linux_x86_64_20231005.zipll./plink2vim ./bashrcalias plink2='~plink2‘source ~/.bashrcplink2首先切到使用文件夹,然后进入环境1.VCF转ped/map2.ped/map转bim/bed/fam3.bim/bed/f

2023-10-10 13:16:05 438

原创 PopLDdecay画连锁不平衡LD学习笔记,1.5版本

注意,我是在PopLDdecay文件夹,bin下面创建的新的文件,所以后面一步要切出磁盘,其次,别人教程里面是list文件,我的是txt,比较方便直接在我们新建的文件里面建文本。在你新建的文件夹下面,可以直接创建一个Pop.txt,包含两列,第一列为LD decay文件的路径,第二列为亚群的图例。类似这样的,可以按照教程的vim。画图,可以需要在PopLDdecay文件下直接创建文件夹,可以去看看的教程,这里说一下我怎么操作的。但是这个我解压不了,不过你们可以试试。网上有比较详细的教程,直接搜索。

2023-09-23 12:53:21 1116 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除