自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 augustus 软件安装与Docker使用记录

augustus 软件安装与Docker使用记录augustus:一基因预测软件;Docker:应用容器引擎,可实现虚拟机。一. 问题:Github下载的augustus难以正常安装及使用本机系统:CentOS7git clone https://github.com/Gaius-Augustus/Augustus.gitcd Augustusmake augustus## 报错如下:mkdir -p bincd src && makemake[1]: Enterin

2021-08-10 15:38:23 1102

原创 breakdancer 报错解决

breakdancer 报错解决:perl 中缺少GD_histogram 和Statistics Descriptive解决:wget -O- http://cpanmin.us | perl - -l ~/perl5 App::cpanminus local::libeval `perl -I ~/perl5/lib/perl5 -Mlocal::lib`echo 'eval `perl -I ~/perl5/lib/perl5 -Mlocal::lib`' >> ~/.profi

2021-05-12 14:51:27 251

原创 plink --extract参数采坑问题记录

plink --extract采坑问题记录问题描述:使用–extract 参数后没能正常进行LD修剪~/software/miniconda2/bin/plink --cow --allow-extra-chr -noweb --file /home/yanglv/soft_project/Target/target_result_test/result_5_3_clean_dropna2_filter_19sample/admixture_pairwise_50_10_0_2/test/admixtu

2021-04-27 21:04:05 2147 2

原创 plink质控及转换文件、admixture软件学习记录

plink质控及转换文件、admixture软件学习记录目的:自定义ped文件和map文件,用plink质控及转换文件,使用admixture做群体结构学分析。ped文件和map文件根据格式用pandas生成即可。非vcf文件,可按照以下两个文件格式转换数据,再进行后续分析。ped文件格式:一行一个样本,每一列以空格为相隔;前六列为信息列;第一列:家系ID(FID)第二列:个体ID(IID)第三列:父本ID,未知则设为0第四列:母本ID,未知可设为0第五列:性别列,未知设为0第六列:

2021-04-13 18:56:52 3634 15

原创 Linux 挂载etx4格式的移动硬盘

Linux 挂载etx4格式的移动硬盘1. 挂载新硬盘挂载新硬盘时,4T的硬盘挂载完成后只有2T,fdisk只能对2T及以下的硬盘进行分区,若想挂载大于2T的硬盘就需要格式化硬盘为etx4;etx4格式传输效率高,容量更大。参考:https://m.jb51.cc/linux/399789.html # 1. 查看盘, 找到新盘名称[root@localhost GVCF_file]# fdisk -l# 2.格式化新盘分区:新盘名为/dev/sdc,有sdc1一个分区mkfs.ext4

2021-03-21 20:19:11 1789

原创 python小知识点

python小知识点重回顾1.r’\string…’r是raw的意思,保持字符串的原样,以免被转义字符影响。2. 列表检查列表中是否包含某个元素是非常缓慢的,因为python在列表中线性逐个扫描;在字典和集和中,python是同时检查所有元素。两个列表的合并:直接用 + 号连接list1.extend(list2),更好更快。3.切片:[start:end]: 包含start,不包含end:[start: end:step]: 每隔一段取一个值::sep = [1,2,3,4,5]

2021-03-08 14:27:40 84

原创 GATK4.1.9.0使用之BQSR

目录BQSR记录:问题处理1. GATK下载:2.BQSR(Base (Quality Score) Recalibration),已知集已经下载;参考网站: https://qcb.ucla.edu/wp-content/uploads/sites/14/2016/03/GATKwr12-4-Base_recalibration.pdf①介绍②成功重新校准的重要因素③运行方法:3. 改known-sites的VCF文件中contig名称:4. 为更改名称的known-sites VCF文件压缩和建立索引5

2021-01-15 18:47:35 5348

原创 R安装GenomicRanges出错问题

R安装GenomicRanges出错问题凡哥安装R初出茅庐,安装GenomicRanges出错如下R版本信息:R version 4.0.3 (2020-10-10) -- "Bunny-Wunnies Freak Out"Copyright (C) 2020 The R Foundation for Statistical ComputingPlatform: x86_64-w64-mingw32/x64 (64-bit)报错信息:错误: Bioconductor version canno

2020-11-11 21:17:12 2381

原创 简单爬虫----NCBI上获取品种信息

简单爬虫实践手里有了RUNID,需要收集这些测序生物样本的品种等相关信息。记录于此,有待改善。'''@author:yanglv2020年11月7日20:18:49简单爬虫---根据表格中的runid,在NCBI爬取Biosample信息,并写入表格。'''import requestsimport refrom bs4 import BeautifulSoupimport xlrdfrom xlutils.copy import copyimport timefrom ret

2020-11-07 20:37:44 1219

原创 python实现奶牛饲料配方

奶牛日粮配方设计参考:https://blog.csdn.net/qq_20448859/article/details/72330362"""@author: yanglv2020年11月1日08:59:16日粮配方:妊娠7个月,体重500kg,日平均产乳量20kg,乳脂率3.5%的奶牛的营养需要量"""from pulp import *import xlrddef get_Ingredients(): # 得到原料列表 feeddata = xlrd.open

2020-11-03 22:17:29 2031 9

原创 Trim_Galore的报错问题

使用Trim Galore的报错问题报错信息: cutadapt -j 1 -e 0.1 -q 20 -O 1 -a AGATCGGAAGAGC s50X_1.clean.fq.gzThis is cutadapt 2.10 with Python 3.6.1Command line parameters: -j 1 -e 0.1 -q 20 -O 1 -a AGATCGGAAGAGC s50X_1.clean.fq.gzRun "cutadapt --help" to see command-l

2020-09-20 14:22:50 1445

原创 R包:Pophelper 作堆积柱状图

Pophelper(V 2.3.0)堆积柱状图的R包1安装安装pophelper库。源代码可以从GitHub获得。R(>= 3.5.0)。需要依赖包:install.packages(c("devtools","ggplot2","gridExtra","gtable","label.switching","tidyr"),dependencies=T)## 然后安装pophelperinstall.packages('pophelper')加载和检查# load libraryl

2020-09-16 20:30:06 4691 3

翻译 qgg包-续2-大数据集教程

qgg包-续2-大数据集教程目录qgg包-续2-大数据集教程使用1000基因组项目数据的教程下载1000 基因组数据准备qgg的基因型数据摸拟数据计算基因组关系矩阵(GRM)使用GRMlist(适用于大数据)的示例使用GRM(适用于小数据)的示例REML分析和交叉验证单标记关联和基因集富集分析使用UK生物库表型数据为qgg准备表型数据使用英国生物库数据指南准备qgg的基因型数据REML分析单标记分析利用高斯-塞德尔求解线性混合模型基因集合富集分析使用1000基因组项目数据的教程遗传数据来自公开可获得的

2020-08-27 17:03:07 819

翻译 qgg包(续)-小数据教程-数据分析

小数据教程-数据分析使用GBLUP和交叉验证进行预测使用GFBLUP和交叉验证进行预测基因集富集分析一、使用GBLUP和交叉验证进行预测这里,我们将展示如何使用qgg中的greml函数执行基因组最佳线性无偏预测(GBLUP)分析和交叉验证。这包括在训练集中使用限制最大似然估计(REML)估计方差成分,在验证集中使用GBLUP进行预测。这将在果蝇遗传参考面板(DGRP)中可用的“抗饥饿”表型和基因型数据中得到说明。要执行GBLUP分析,以下输入数据是必不可少的。y: vector of phen

2020-08-26 21:07:04 1678

原创 使用SNP数据计算IBD、PCA、系统树鉴别亲缘关系

分析步骤,有可能有错误,希望指正小故事数据预处理计算IBD计算pca系统发育树计算SNP分布情况。后记小故事接到的小任务,对于大佬们来说可能不难,对于新手,却是要抓破脑袋。两个养殖户的牛群跑到一个山头,牛群混了,有一头小牛不知道是谁家的,都坚称是自己的。他们自己掏钱找公司分别测序了两头母牛和小牛,数据送到导师手里。数据预处理1.得到的fastq文件,首先去除质量低的位点(QC)。软件:NGSQCToolkit2.序列比对,sentieon生成sort.bam,sambamba建立索引。软件:

2020-08-17 14:26:51 9506 6

翻译 R语言:qgg包

qgg包:一款大规模数量遗传和基因组分析的R包一、概述该包基于:假设基因组特征可能会富集影响性状的因果变体。根据以往的研究和不同的信息来源,可以分成几种基因组特征,如基因、染色体或生物途径。原文:http://psoerensen.github.io/qgg/1、核心功能拟合线性混合模型构建基因组关系矩阵估计遗传参数(遗传性和相关性)基因预测单标记关联分析基因集合富集分析2、qgg利用以下处理大规模数据使用openMP的多核处理在BLAS库(如OpenBLAS、ATLAS或M

2020-07-30 22:13:03 1603

原创 爬虫——审查元素与网页源代码不一致问题

按照常规做法,获得源网页后无论用selector还是Xpath,均无返回值问题爬取NCBI网站的数据,审查元素与获得的网页源代码不一样,爬取的东西在源码中没有,审查元素中存在。经过查找,发现NCBI该部分为异步传输,所需信息在Network下XHR的第九个文件中,且网址与爬取的网址不一致,需要POST获取网页。...

2020-07-07 18:12:11 8643

原创 安装FastQC

安装fastQC直接下载和配置变量即可 1007 cd ~ 1008 java -version #检查java 1013 cd software 1015 wget http://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.9.zip 1017 unzip fastqc_v0.11.9.zip 1019 rm fastqc_v0.11.9.zip 1021 cd FastQC 1024 fas

2020-06-29 14:11:43 2208

原创 bcftools的安装问题

bcftools安装问题这是我的第一个博客,可能不太好看,仅作为个人学习记录,若有问题,欢迎与我交流。安装需要sudo命令,如果apt-get不能下载,可使用yum -y,安装步骤可参考其他人的博客,安装过程比较简单。但我遇到小问题,是缺少liblzma-dev,安装liblzma-dev方法如下这是我的第一个博客,可能不太好看,仅作为个人学习记录,若有问题,欢迎与我交流。安装需要sudo命令,如果apt-get不能下载,可使用yum -y,安装步骤可参考其他人的博客,安装过程比较简单。但我遇到小问题,

2020-06-01 01:53:42 2736 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除