谁曾经不是菜鸟啦-CSDN博客

原创 augustus 软件安装与Docker使用记录

augustus 软件安装与Docker使用记录augustus：一基因预测软件；Docker：应用容器引擎，可实现虚拟机。一. 问题：Github下载的augustus难以正常安装及使用本机系统：CentOS7git clone https://github.com/Gaius-Augustus/Augustus.gitcd Augustusmake augustus## 报错如下：mkdir -p bincd src && makemake[1]: Enterin

2021-08-10 15:38:23 1208

原创 breakdancer 报错解决

breakdancer 报错解决：perl 中缺少GD_histogram 和Statistics Descriptive解决：wget -O- http://cpanmin.us | perl - -l ~/perl5 App::cpanminus local::libeval `perl -I ~/perl5/lib/perl5 -Mlocal::lib`echo 'eval `perl -I ~/perl5/lib/perl5 -Mlocal::lib`' >> ~/.profi

2021-05-12 14:51:27 272

原创 plink --extract参数采坑问题记录

plink --extract采坑问题记录问题描述：使用–extract 参数后没能正常进行LD修剪~/software/miniconda2/bin/plink --cow --allow-extra-chr -noweb --file /home/yanglv/soft_project/Target/target_result_test/result_5_3_clean_dropna2_filter_19sample/admixture_pairwise_50_10_0_2/test/admixtu

2021-04-27 21:04:05 2291 2

原创 plink质控及转换文件、admixture软件学习记录

plink质控及转换文件、admixture软件学习记录目的：自定义ped文件和map文件，用plink质控及转换文件，使用admixture做群体结构学分析。ped文件和map文件根据格式用pandas生成即可。非vcf文件，可按照以下两个文件格式转换数据，再进行后续分析。ped文件格式：一行一个样本，每一列以空格为相隔；前六列为信息列；第一列：家系ID（FID）第二列：个体ID（IID）第三列：父本ID，未知则设为0第四列：母本ID，未知可设为0第五列：性别列，未知设为0第六列：

2021-04-13 18:56:52 4054 15

原创 Linux 挂载etx4格式的移动硬盘

Linux 挂载etx4格式的移动硬盘1. 挂载新硬盘挂载新硬盘时，4T的硬盘挂载完成后只有2T,fdisk只能对2T及以下的硬盘进行分区，若想挂载大于2T的硬盘就需要格式化硬盘为etx4；etx4格式传输效率高，容量更大。参考：https://m.jb51.cc/linux/399789.html # 1. 查看盘, 找到新盘名称[root@localhost GVCF_file]# fdisk -l# 2.格式化新盘分区：新盘名为/dev/sdc，有sdc1一个分区mkfs.ext4

2021-03-21 20:19:11 1882

原创 python小知识点

python小知识点重回顾1.r’\string…’r是raw的意思，保持字符串的原样，以免被转义字符影响。2. 列表检查列表中是否包含某个元素是非常缓慢的，因为python在列表中线性逐个扫描；在字典和集和中，python是同时检查所有元素。两个列表的合并：直接用 + 号连接list1.extend(list2),更好更快。3.切片：[start:end]: 包含start，不包含end：[start: end:step]: 每隔一段取一个值：:sep = [1,2,3,4,5]

2021-03-08 14:27:40 92

原创 GATK4.1.9.0使用之BQSR

目录BQSR记录:问题处理1. GATK下载：2.BQSR（Base (Quality Score) Recalibration）,已知集已经下载；参考网站： https://qcb.ucla.edu/wp-content/uploads/sites/14/2016/03/GATKwr12-4-Base_recalibration.pdf①介绍②成功重新校准的重要因素③运行方法：3. 改known-sites的VCF文件中contig名称：4. 为更改名称的known-sites VCF文件压缩和建立索引5

2021-01-15 18:47:35 5971

原创 R安装GenomicRanges出错问题

R安装GenomicRanges出错问题凡哥安装R初出茅庐，安装GenomicRanges出错如下R版本信息：R version 4.0.3 (2020-10-10) -- "Bunny-Wunnies Freak Out"Copyright (C) 2020 The R Foundation for Statistical ComputingPlatform: x86_64-w64-mingw32/x64 (64-bit)报错信息：错误: Bioconductor version canno

2020-11-11 21:17:12 2606

原创简单爬虫----NCBI上获取品种信息

简单爬虫实践手里有了RUNID，需要收集这些测序生物样本的品种等相关信息。记录于此，有待改善。'''@author:yanglv2020年11月7日20:18:49简单爬虫---根据表格中的runid，在NCBI爬取Biosample信息，并写入表格。'''import requestsimport refrom bs4 import BeautifulSoupimport xlrdfrom xlutils.copy import copyimport timefrom ret

2020-11-07 20:37:44 1336

原创 python实现奶牛饲料配方

奶牛日粮配方设计参考：https://blog.csdn.net/qq_20448859/article/details/72330362"""@author: yanglv2020年11月1日08:59:16日粮配方：妊娠7个月，体重500kg,日平均产乳量20kg，乳脂率3.5%的奶牛的营养需要量"""from pulp import *import xlrddef get_Ingredients(): # 得到原料列表 feeddata = xlrd.open

2020-11-03 22:17:29 2085 9

原创 Trim_Galore的报错问题

使用Trim Galore的报错问题报错信息： cutadapt -j 1 -e 0.1 -q 20 -O 1 -a AGATCGGAAGAGC s50X_1.clean.fq.gzThis is cutadapt 2.10 with Python 3.6.1Command line parameters: -j 1 -e 0.1 -q 20 -O 1 -a AGATCGGAAGAGC s50X_1.clean.fq.gzRun "cutadapt --help" to see command-l

2020-09-20 14:22:50 1536

原创 R包：Pophelper 作堆积柱状图

Pophelper（V 2.3.0)堆积柱状图的R包1安装安装pophelper库。源代码可以从GitHub获得。R(>= 3.5.0)。需要依赖包：install.packages(c("devtools","ggplot2","gridExtra","gtable","label.switching","tidyr"),dependencies=T)## 然后安装pophelperinstall.packages('pophelper')加载和检查# load libraryl

2020-09-16 20:30:06 4928 3

翻译 qgg包-续2-大数据集教程

qgg包-续2-大数据集教程目录qgg包-续2-大数据集教程使用1000基因组项目数据的教程下载1000 基因组数据准备qgg的基因型数据摸拟数据计算基因组关系矩阵(GRM)使用GRMlist(适用于大数据)的示例使用GRM(适用于小数据)的示例REML分析和交叉验证单标记关联和基因集富集分析使用UK生物库表型数据为qgg准备表型数据使用英国生物库数据指南准备qgg的基因型数据REML分析单标记分析利用高斯-塞德尔求解线性混合模型基因集合富集分析使用1000基因组项目数据的教程遗传数据来自公开可获得的

2020-08-27 17:03:07 1070 1

翻译 qgg包（续）-小数据教程-数据分析

小数据教程-数据分析使用GBLUP和交叉验证进行预测使用GFBLUP和交叉验证进行预测基因集富集分析一、使用GBLUP和交叉验证进行预测这里，我们将展示如何使用qgg中的greml函数执行基因组最佳线性无偏预测(GBLUP)分析和交叉验证。这包括在训练集中使用限制最大似然估计(REML)估计方差成分，在验证集中使用GBLUP进行预测。这将在果蝇遗传参考面板(DGRP)中可用的“抗饥饿”表型和基因型数据中得到说明。要执行GBLUP分析，以下输入数据是必不可少的。y: vector of phen

2020-08-26 21:07:04 1814 1

原创使用SNP数据计算IBD、PCA、系统树鉴别亲缘关系

分析步骤，有可能有错误，希望指正小故事数据预处理计算IBD计算pca系统发育树计算SNP分布情况。后记小故事接到的小任务，对于大佬们来说可能不难，对于新手，却是要抓破脑袋。两个养殖户的牛群跑到一个山头，牛群混了，有一头小牛不知道是谁家的，都坚称是自己的。他们自己掏钱找公司分别测序了两头母牛和小牛，数据送到导师手里。数据预处理1.得到的fastq文件，首先去除质量低的位点（QC）。软件：NGSQCToolkit2.序列比对，sentieon生成sort.bam，sambamba建立索引。软件：

2020-08-17 14:26:51 10729 6

翻译 R语言：qgg包

qgg包：一款大规模数量遗传和基因组分析的R包一、概述该包基于：假设基因组特征可能会富集影响性状的因果变体。根据以往的研究和不同的信息来源，可以分成几种基因组特征,如基因、染色体或生物途径。原文：http://psoerensen.github.io/qgg/1、核心功能拟合线性混合模型构建基因组关系矩阵估计遗传参数(遗传性和相关性)基因预测单标记关联分析基因集合富集分析2、qgg利用以下处理大规模数据使用openMP的多核处理在BLAS库(如OpenBLAS、ATLAS或M

2020-07-30 22:13:03 1693

原创爬虫——审查元素与网页源代码不一致问题

按照常规做法，获得源网页后无论用selector还是Xpath，均无返回值问题爬取NCBI网站的数据，审查元素与获得的网页源代码不一样，爬取的东西在源码中没有，审查元素中存在。经过查找，发现NCBI该部分为异步传输，所需信息在Network下XHR的第九个文件中，且网址与爬取的网址不一致，需要POST获取网页。...

2020-07-07 18:12:11 8843

原创安装FastQC

安装fastQC直接下载和配置变量即可 1007 cd ~ 1008 java -version #检查java 1013 cd software 1015 wget http://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.9.zip 1017 unzip fastqc_v0.11.9.zip 1019 rm fastqc_v0.11.9.zip 1021 cd FastQC 1024 fas

2020-06-29 14:11:43 2235

原创 bcftools的安装问题

bcftools安装问题这是我的第一个博客，可能不太好看，仅作为个人学习记录，若有问题，欢迎与我交流。安装需要sudo命令，如果apt-get不能下载，可使用yum -y，安装步骤可参考其他人的博客，安装过程比较简单。但我遇到小问题，是缺少liblzma-dev，安装liblzma-dev方法如下这是我的第一个博客，可能不太好看，仅作为个人学习记录，若有问题，欢迎与我交流。安装需要sudo命令，如果apt-get不能下载，可使用yum -y，安装步骤可参考其他人的博客，安装过程比较简单。但我遇到小问题，

2020-06-01 01:53:42 2825 3

qq_43206685的博客