自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 git 大文本上传和下载git-lfs

git -lfs 安裝

2024-06-13 12:22:58 370

原创 TBTOOLS标记染色体上的gene

最近碰到个问题,如何在染色体上标记gene, 查了下发现了个windows工具:TBTOOLs , 有点意思,真是简洁高效。话不多说,直接干。。

2024-01-29 21:55:40 692

原创 互信息,条件熵,联合熵

看到一个图介绍互信息,条件熵,联合熵,简单记录

2024-01-09 16:08:55 468

原创 python + mongodb使用入门

Python + mongo使用入门介绍

2023-11-30 17:05:40 352

原创 肿瘤HRR和HRD 简单记录

最近看到两个在肿瘤领域高频出现的词HRR和HRD, 遂简单记录下。

2023-02-15 21:20:59 1179

原创 RNAseq生信分析流程简介

简要介绍RNAseq生信分析流程

2023-02-05 19:06:19 2460

原创 变异检测准确性评估软件hap.py使用

hap.py是illumina官方开发的在单倍型水平上比较二倍体基因型的工具。可用于针对金标准变异数据集(例如NA12878样本)对检测的变异结果进行基准测试,以判断检测结果的准确性, 也可以用于比较和评估两个不同变异检测软件检测结果的差异

2022-11-14 00:00:57 1446 5

原创 python 项目结构规范

最近,在做一些python项目,发现以前的习惯很不好,很多脚本写的很随意,导致后面看的时候自己都忘记当时的思路了。因此,特复习下之前看过的项目结构化规范,顺便就在此处留个记录吧。

2022-11-07 23:49:58 2400

原创 一文详解python日志loggin的使用

一个通用的日志系统对于系统软件开发来说非常重要,对于Python而言,我们通常使用python 自带的 logging 来进行日志的管理。对于一些小型的项目来说logging是完全够用的,且非常简单易上手。

2022-08-25 14:11:55 697

原创 变异标准化(归一化和左对齐)

Variant Call Format (VCF) 是一种灵活的文件格式规范,用于表示SNP, INDEL, CNV, SV等许多不同的变体类型。 然而,对于同一个变异的可能出现多种不同的表达形式,例如(chrY:2655074:AG->AC 和 chrY:2655075:G->C )。这对VCF来说是合规,但如果我们未能认识到这一点,往往会导致不准确的分析。.........

2022-07-13 16:24:30 1013

原创 DEseq2 差异分析基本原理

DEseq简介寻找组间显著表达变化的基因,以解释基因表达水平的变化对生物功能的变化最直接的办法就行进行转录组测序和定量。那如何从不同组定量的转录组寻找到那些显著差异的基因呢?DESeq 就是来解决这个问题的,它主要使用负二项分布的模型来进行差异分析。DESeq2是DEseq的升级版,但是DEseq2只适用于有生物学重复的试验,而DEseq既可以做有生物学重复也可以做无重复(或部分重复的)试验。2. DEseq2的差异分析原理2.1 统计模型:负二项分布所谓的差异分析实际上是指通过假设检验来判断两组数

2022-05-22 18:05:24 11062 1

原创 Adobe Illustrator(组图科研小技巧, 持续更新)

1. 去除留白,以尽量减少插图周围的空白区域大多数投稿期刊往往会有一条要求:“Each figure should be closely cropped to minimize the amount of white space surrounding the illustration” , 也就是去除留白。解决办法:详见下图,依次点击1,2,3,4即可2. 调整图片大小例如文稿要求为:Figures in the final PDF version:width of 85 mm for ha

2022-05-13 17:23:36 1358

原创 docker启动mongodb一直重启问题

docker启动mongodb一直重启问题1. mongo 容器 Restarting (132) 2 seconds ago近期接手一个后端项目,发现使用docker 创建mongodb的容器时,总是显示一直重启,显示Restarting (132) 2 seconds ago , 然而在我自己的window10电脑上却无法复现,或者换一台机器也不会出现类似的问题。查了下万能的google 终于找到了问题所在。原文链接:https://stackoverflow.com/questions/609

2022-05-07 12:50:59 6315

原创 DEseq2和edgeR的安装问题记录

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar

2022-05-03 00:16:28 7103 1

原创 下载NCBI的SRA数据 详细教程

SRA(Sequence ReadArchive)数据库是NCBI(National Center for Biotechnology Information)旗下用于存储高通量测序数据的子库。来自世界各地研究的测序数据在此处都可以免费下载,本文就聊聊如何下载SRA数据库对应的测序数据。1. SRA基本框架下载数据之前,咱们可以先聊聊SRA数据库的一些基础知识。SRA数据库的组织框架是基于 STUDY, SAMPLE, EXPERIMENT, RUN 四个概念构建的。STUDY :研究课题/研究项

2022-04-05 16:45:33 5754 7

原创 GATK-HaplotypeCaller 变异检测详解

1.GATK-HaplotypeCaller简介基因组变异检测是基因组学领域一个非常重要的问题,是遗传性疾病溯源,物种进化等分析的前提。而目前最主流、使用最广泛的变异检测软件当属 Broad Institute 开发的 GATK(Genome Analysis ToolKit) 组件。GATK 设计之初是用于分析人类的全外显子和全基因组数据,随着不断发展,现在也可以应用于其他的物种。GATK官网提供了一整套完整的变异检测分析流程:GATK Best Practices。如下图示:其中,Haplotyp

2022-03-18 00:50:14 10140

原创 docker安装目录迁移

在安装docker时通常是默认安装的系统盘目录/var/lib/docker,而该目录通常是比较小的,一旦镜像过多就可能出现docker无法运行的情况,这时进行docker目录的迁移就可以很好地解决问题。

2021-12-14 11:14:00 12640 4

原创 apine安装一些常用工具

SampleSample----NA12878| | || | CNV-P | 0.9007 | 0.7977 | 0.8461|HG002 | RAW | 0.2054 | 1.0000 | 0.3408| | Hard_Cutoff_2 | 0.4026 | 0.9729 | 0.5695| | Hard_Cutoff_5 | 0.57...

2021-12-08 00:15:46 529

原创 bam 可视化:samtools tview 详细解释

bam可视化软件大家可能熟悉的是IGV,然而,IGV对于大多数linux用户来说并不友好,而samtools tview可以很好满足该需求。话不多说直接上命令行:samtools tview -p chr1:3128088 NA12878.bam hg38.fasta-p 指定染色体的位置,tview从指定的位置开始显示NA12878.bam 比对结果bam文件,需要构建索引(NA12878.bam.bai)hg38.fasta 比对时使用的fasta文件,如果不提供则第一行会显示为N. 需要

2021-09-27 23:27:27 9254

原创 Shell 带$的特殊变量

特殊变量列表$0 当前脚本的文件名$n 传递给脚本或函数的参数。n 是一个数字,表示第几个参数。例如,第一个参数是$1,第二个参数是$2。$# 传递给脚本或函数的参数个数。$* 传递给脚本或函数的所有参数。$@ 传递给脚本或函数的所有参数。被双引号(" ")包含时,与 $* 稍有不同,下面将会讲到。$? 上个命令的退出状态,或函数的返回值。$$ 当前Shell进程ID。对于 Shell 脚本,就是这些脚本所在的进程ID。一些说明运行脚本时传递给脚本的参数称为命令行参数。命令行参数用 $

2021-05-07 16:27:01 416 1

原创 shell 脚本里面的if判断:if比较的字符用法

shell 脚本里面的if判断:if比较的字符用法写shell脚本经常会碰到if的判断结构,下面对这些简写的判断做了下总结:-e 判断对象是否存在-d 判断对象是否存在,并且为目录-f 判断对象是否存在,并且为常规文件-L 判断对象是否存在,并且为符号链接-h 判断对象是否存在,并且为软链接-s 判断对象是否存在,并且长度不为0-r 判断对象是否存在,并且可读-w 判断对象是否存在,并且可写-x 判断对象是否存在,并且可执行-O 判断对象是否存在,并且属于当前用户-G 判断对象是否存

2021-05-07 16:13:24 1597

原创 python几种下划线的含义

python 存在好几种下划线,他们都具有哪些含义呢?总结先不赘述了,直接给结论吧, 感兴趣或者不理解的可以看参考链接。单下划线开头: _variate,python约定俗成的,仅供内部使用的变量名单下划线结尾:variate_,尾部加一个下划线来解决命名冲突,例如python系统存在变量class,为了区分可以用class_双下划线开头:__variate,双下划线前缀会导致Python解释器重写属性名称,以避免子类中的命名冲突。例如父类Faclass的变量__variate会被记录为_Fac

2021-04-26 09:44:28 223

原创 小白专用:如何将Python打包上传到Pypi

最近写了个python包, 向上传到pypi以供其他人下载和使用,于是研究了一波,发现挺easy的!主要包括以下几个步骤:准备python模块代码编写setup.py编写README.md和LICENSE安装一些模块(setuptools 和 wheel,twine)生成 dist 目录用于上传twine 上传1. 准备python模块代码例如我建一个目录wtftest,在里面随便写个代码:wtftest.pydef printwtf(): print("what the fuck

2021-02-22 15:22:37 367

原创 git 免密登录

git 下载或者上传时都需要重新输入密码非常麻烦,免密登录即可解决该问题1. 首先在电脑服务器上输入下列命令,生成公匙:ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa #-t 加密算法类型,这里是使用rsa算法#-P 指定私钥的密码,不需要可以不指定#-f 指定生成秘钥的位置路径2. 在github 登录页面,按如下图示操作,最后将~/.ssh/id_rsa.pub 的内容输入填入确认即可...

2021-01-04 22:41:00 257

原创 cutadapt 截取fastq导致fq文件报错

Raw ASCII character 10 but expected 33-based Phred qual 的解决方案最近使用cutadapt截取数据发现截取的数据没法使用bowtie/bowtie2进行比对,一比对就出现下列问题:Saw ASCII character 10 but expected 33-based Phred qual.terminate called after throwing an instance of 'int'经过一番探究发现cutadapter过滤出来的fa

2020-11-11 10:48:00 1231

原创 Snakemake搭建流程 - 干货级

本文目录1. snakemake 简介2. snakemake 安装3. snakemake 参数简介4. snakemake 使用说明4.1 定义workflow4.2 配置信息Configuration4.3 运行代码示例参考1. snakemake 简介最近碰到一个snakemake搭建的流程,挺好奇,便学习了一波,在此特分享一些体会和心得,仅供想快速入手的骚年们一些参考吧。为了照顾大家的耐心,都只放干货了(代码示例)2. snakemake 安装snakemake是基于python,使用co

2020-08-05 16:20:11 4725 1

原创 Conda install找不到包,使用pip

conda pip 安装使用conda安装python包的时候经常会碰到 PackagesNotFoundError: The following packages are not available from current channels:的报错信息,例如但我们想安装fake_useragent是时,就碰到下面的问题:此时肯定很多同学会想,能不能用最简单粗暴的pip安装呢,显然是可以的,不过需要注意的是,此时的pip并非系统的pip而是要用conda 对应环境下的pip程序才行。例如对于上面的

2020-07-31 16:49:17 4964

原创 git上传本地代码到github

1. git简介2.git工作框架图为了便于理解,简单粗暴直接上图:

2020-07-28 15:09:24 151

原创 Docker构建镜像(Dockerfile 和docker-commit)

Docker入门级实战以及使用Dockerfile构建镜像简介:拉取一个空的镜像:docker pull centos:7.5.1804

2020-07-17 18:22:07 491

原创 nmon内存监控和可视化

简介项目中经常遇到一个问题:某个程序运行的内存和CPU利用如何?例如,当我们开发了一个程序,通常会把他和已有程序作比较,这时候通常会比较内存和CPU使用,最简单粗暴的方式就是使用top查看,为了实时监控,可能需要自己写个脚本每隔一定的间隔进行采样,提取对应的时间,内存,和CPU使用等数值,然后根据这些绘制整个图形。例如,我们想查看某个进程,进程号为:189183 【使用top 查看进程号】top -d 5 -p 189183 -b-p 189183 进程号-d 5 每隔 5s间隔刷新一次

2020-07-07 21:58:44 1219

原创 如何使用conda安装R和R包

如何使用conda安装R和R包生物信息分析常遇到R和R包使用和安装问题,最新版的R包特别难安装,而conda可以很好的解决这个问题。conda的安装相对简单此处不再赘述。1. R安装使用conda安装R时,最好先使用conda create创建独立的运行的环境,这样不会由于不同程序的依赖关系而导致冲突;此外对于一些依赖关系复杂R包,其安装可能会破坏原有的R包环境,这时也可以新建一个conda...

2020-03-13 11:42:48 33230 7

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除