自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(46)
  • 资源 (6)
  • 问答 (1)
  • 收藏
  • 关注

转载 UCSC Genome Browser 使用教程

UCSC Genome Browser 使用教程,看这篇就够了

2024-03-25 14:55:11 185

转载 450K甲基化探针cg编号(比如cg13788592)获取对应的基因组坐标位置(chr:position)

转载原文

2024-03-21 14:55:21 138

转载 R 决策曲线

R, DCA曲线,决策曲线

2024-03-06 11:29:29 30

原创 【R】数据相关性的可视化/热图

【代码】【R】数据相关性的可视化。

2023-10-18 10:49:12 641

原创 计算95%置信区间

【代码】计算95%置信区间。

2023-07-06 17:13:49 761 1

转载 【LOESS局部加权非参数回归】

aa

2022-10-18 15:14:21 552

转载 【逻辑回归模型】

逻辑回归

2022-10-17 15:46:55 128

原创 根据HGVS转换突变位置

TransVarhttps://bioinformatics.mdanderson.org/transvar/

2022-05-18 11:16:01 448

原创 conda环境的移植

**移植conda环境**如果想移植自己Conda的环境或者其它人的conda环境,1.查看当前conda所有的环境source activate # 激活base环境。如果是移植其它人的环境,则激活其它人conda环境./conda info --envs # 查看所有环境。如果是查看其它人的conda环境,需要写他人conda的绝对路径2.进入所要移植的环境source sciclone # 进入sciclone 环境 。如果是移植base环境,则在base环境3.导出当前环

2022-05-11 17:44:30 5776

原创 RNA检测流程

1 比对Hist2 下载https://github.com/DaehwanKimLab/hisat2./hisat2/hisat2-2.2.1/hisat2 \ -x /hg19index/ucsc.hg19 \ -1 fq1.gz \ -2 fq2.gz \ -S out.sam \ --dta --rna-strandness-x :对hg19参考基因组做的索引cd hg19indexhisat2/hisat2-2.2.1/hisat2-build -p 4 ucsc.

2022-04-19 14:44:36 1926

原创 matplotlib笔记

设置画布plt.figure(figsize=(25, 6))1. 轴标签修改设置x轴,y轴 最大,最小 范围plt.ylim(-20, 20)plt.xlim(-20, 20)修改x轴刻度, 只显示在 x_kedu 位置的标签 ,标签对应为x_label ,rotation表示标签旋转50度x_kedu = [3,5,7]x_label = ["exon3","exon5","exon7"]plt.xticks(x_kedu, labels=x_label,rotation=50

2022-04-15 11:53:09 491

转载 pymc3 MCMC应用【转载】

转载:https://blog.csdn.net/qq_44009891/article/details/106069563第一部分 编程准备贝叶斯思维:和更传统的统计推断不同,贝叶斯推断会保留不确定性,在贝叶斯派的世界观中,概率是被解释为我们对一件事情发生的相信程度或者说信心(飞机事故,总统选举)。需注意的是,我们每个人都可以给事件赋概率值,而不是存在某个唯一的概率值,因为不同的人拥有不同的信息,因此他们对同一事件发生的信心也可以有不同的值,但这些不同并不说明其他人是错误的。飞机事故:综合某航空

2022-03-24 23:59:21 892

转载 Python 读取gz文件,字符串与字节串的相互转换

首先是字节串转字符串,也就是str:b = b'some byte array' str(b, encoding = "utf-8") #orbytes.decode(b)然后是字符串转为字节串:s = 'some string' bytes(s, encoding = "utf8") #orstr.encode(s)

2022-03-04 18:05:51 866

转载 python画venn图

python 画 venn图

2022-01-19 11:09:43 348

原创 python中文文档

https://docs.python.org/zh-cn/3.7/

2022-01-06 09:54:28 828

原创 bam文件中所有 tags的解释

bam文件中所有 tags的解释官方的解释文档http://samtools.github.io/hts-specs/SAMv1.pdfTags 的详细解释http://samtools.github.io/hts-specs/SAMtags.pdf

2021-11-25 19:09:22 1066

原创 linux R安装 , libcurl >= 7.22.0报错

目录R下载安装R官网:选择清华镜像选择最新版本或以往版本选择版本安装R下载安装R官网:https://www.r-project.org/选择清华镜像选择最新版本或以往版本选择版本安装wget https://mirrors.tuna.tsinghua.edu.cn/CRAN/src/base/R-3/R-3.6.1.tar.gztar zxvf R-3.6.1.tar.gzcd R-3.6.1./configure --prefix="当前的安装目录"可能遇到的报错:c

2021-05-13 18:40:08 3115

原创 TCGA小工具

sangerbox 第三方软件下载TCGA数据http://sangerbox.com/

2021-04-26 22:19:45 199

原创 python matplotlib画图中文显示

matplotlib 中文显示1. 查看字体路径2. 删除matplotlib的缓冲目录3. 修改matplotlibrc文件4. 最后使用jupyterlab的话,重启1. 查看字体路径import matplotlib print(matplotlib.matplotlib_fname())把 ttf 格式的中文字体文件放到path_to/python3.8/site-packages/matplotlib/mpl-data/fonts/ttf2. 删除matplotlib的缓

2021-04-23 14:26:37 247 1

原创 ensembl数据库BioMart使用,查找转录本ID在ensembl与refseq中的对应关系

如何查找 转录本ID在ensembl与refseq中的对应关系Ensembl数据库地址:http://grch37.ensembl.org/index.html进入BioMart选择DataSet点击左侧 Filter 可以选择一些条件点击Attributes点击GENE选择特征 ,勾选 Gene name , Transcript name点击EXTERNAL, 在 External References 中选择需要转换对应的外部数据库的种类信息,勾选 Refseq的转录本ID

2021-04-20 19:43:32 4722

转载 ABSOLUTE评估肿瘤纯度

转载:http://www.sci666.net/69999.html

2021-04-16 18:17:28 457

原创 提取目标区域的bam文件,拆分bed文件,bed区间深度

提取bed区间内的readssamtools view -bh -L target.bed bamfile.bam > target.bamsamtools view -hb chr:start-end bamfile.bam > target.bam

2021-04-15 17:56:38 6471 5

原创 Git基础使用

创建服务器公钥ssh-keygen三次回车继续,生成的公钥路径在根目录下.ssh目录id_rsa.pub中。复制公钥,粘贴进gitlabGit全局设置git config --global user.name "XiaoZhang"git config --global user.email "XiaoZhang@123.com"创建gitlab远程库1.2.3.创建本地仓库,推送拉取文件mkdir MyFirstPjcd MyFirstPj'''# 初始化本地仓库

2021-04-08 19:10:03 83

原创 pandas笔记

import pandas as pddata = pd.read_csv("Narrativedata.csv")显示数据框信息data.info()2. 填充缺失值 fillnadata["Age"] = data["Age"].fillna(data["Age"].mean())3.删除缺失值 data = data.dropna()4 某一列去重 labels = data["Embarked"].unique().tolist()5. 对某一列执行 la

2021-03-18 23:23:38 4002

转载 MSI基础

MSI基础http://www.360doc.com/content/17/0515/02/39750415_654001965.shtml

2021-03-10 18:24:19 167

原创 matplotlib 画图笔记 直方图; 插入片段insertsize分布

import pysamimport numpy as npfrom matplotlib import pyplot as pltfrom matplotlib.backends.backend_pdf import PdfPagesimport globimport multiprocessing as mpdef insertSize(bam): sam = pysam.AlignmentFile(bam) insize_list = [] for read i

2021-02-07 17:34:14 1263 2

原创 matplotlib 画图笔记 柱状图、曲线图、box图

import matplotlib.pyplot as pltimport numpy as npfrom matplotlib.backends.backend_pdf import PdfPagesimport pandas as pdGCcounttxt 文件,5列,“chrom”,“start”,“end”,“区间内gc比例”,“reads”bed文件画柱状图,曲线图,以及注释def draw_pic(GCcounttxt): # GCcounttxt 5列,"chrom","

2021-02-07 17:14:14 436 1

原创 计算bed区间gc含量,碱基深度等

计算样本 bed区间内gc ,depthimport pysamimport numpy as npimport pandas as pdimport mathimport pyfaidxdef calGC(bamfile, bed): sampleid = bamfile.strip().split("/")[-1].split(".")[0] out = open("%s.GCcount.txt"%sampleid,"w") sam = pysam.AlignmentFile(ba

2021-02-05 17:27:39 1577

原创 非root权限GCC安装

查看当前gcc版本gcc --version下载gccwget ftp.gnu.org/gnu/gcc/gcc-7.3.0/gcc-7.3.0.tar.gz解压tar -zxvf gcc-7.3.0.tar.gz进入目录cd gcc-7.3.0检测和安装相关依赖包,直接执行gcc自带的文件./contrib/download_prerequisites创建安装目录mkdir buildcd build配置文件,非root权限时设置个人安装路径, prefix 为个人安装

2021-01-26 16:47:10 771

转载 bam文件格式解析

http://blog.csdn.net/qq_21478261/article/details/106005482

2020-09-23 14:27:45 1367

翻译 深度剖析somatic CNV变异分析影响因素

深度剖析somatic CNV变异分析影响因素http://47.94.226.79/?p=1033肿瘤样本拷贝数变异分析升级啦!升级啦!升级啦!重要的事情说三遍。Control-FREEC开启新功能,可以更加准确筛选somatic CNV和LOH。先看图再说话。图1 Control-FREEC[1,2]软件分析somatic CNV设置纯度参数前(上)后(下)我们在利用Control-FREEC软件分析somatic CNV时,开启了肿瘤纯度参数后更准确的检出肿瘤样本中的CNV和LOH变化。图中

2020-09-23 11:07:03 3472

原创 ANNOVAR注释

1.下载需要科研机构邮箱#http://download.openbioinformatics.org/annovar_download_form.phptar xvfz annovar.latest.tar.gz下载数据库perl annotate_variation.pl -downdb -buildver hg38 -webfrom annovar refGene /humandb...

2020-06-14 16:25:21 3037

原创 不同参考基因组版本间 bed vcf文件转换

1. 通过liftover转换bed文件坐标1.1 下载转换的chain文件http://hgdownload.soe.ucsc.edu/downloads.html#humanhg19转hg38 的chainwget http://hgdownload.soe.ucsc.edu/goldenPath/hg19/liftOver/hg19ToHg38.over.chain.gzhg38转hg19 的chainwget http://hgdownload.soe.ucsc.edu/goldenP

2020-06-14 12:16:51 4184 1

原创 python的 py文件与pyc文件编译 / 反编译

1. 什么是py与pyc文件.py与.pyc文件的区别2.编译pycpython -m compileall file.py 编译完成的文件会在 __pycache__下面3. 反编译pyc文件使用conda安装 uncompylepip install uncompyle./uncompyle file.pyc > file.py这样 pyc文件就可读了...

2020-06-14 10:45:32 254

原创 hunman参考基因组下载及索引建立

进入UCSC官网,进入hunman基因组页面,点击基因组数据,下载hg38.analysisSet.2bitwget http://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/analysisSet/hg38.analysisSet.2bit下载UCSC工具包,将2bit格式的参考基因组转为fasta格式rsync -aP rsync://hgdownload.soe.ucsc.edu/genome/admin/exe/linux.x86

2020-06-13 18:50:26 1861

原创 MongoDB数据库安装部署

1. 数据库分类关系型数据库(RDBMS)MySQL , Oracle , DB2 , SQL Sever `````非关系型数据库(No SQL)MongoDB , Redis ``````MongoDB中层级关系在MongoDB数据库中左侧的表就是collection , 右侧的每条数据就是document,document内以Bjson的形式保存数据内容。document内内容格式:2. MongoDB下载wget https://fastdl.mongodb.org

2020-06-07 18:26:59 235

原创 python 类 中 __dict__ 赋值变量

python类中__dict__属性返回的是实例对象中当前已经定义的所有自定义实例变量的名和值,为字典的形式class Persion(): def __init__(self,par1,par2,par3,par4): self.par1 = par1 self.par2 = par2 self.par3 = par3 self.par4 = par4 def female(self): pass def male(self): passP = Persion("a

2020-06-04 20:37:46 1292

原创 Linux 实用小命令

对文件不同列进行连接--output-delimiter 连接符-f 切片的列-d 切片的分隔符,默认Tabcut --output-delimiter=_ -f 2,3,5,6 input_file.txt

2020-05-24 16:04:59 104

原创 ichorCNA 的下载使用

1. 安装 HMMCopy先用conda search HMMCopy没有这个安装包,手动安装mkdir HMMcopycd HMMcopywget https://github.com/shahcompbio/hmmcopy_utils/archive/master.zipunzip master.zipcmake .make把HMMcopy加入环境变量PATH=path_to_HMMcopy/HMMcopy/hmmcopy_utils-master/bin:$PATH后面会用

2020-05-14 21:09:18 1888

原创 python创建可以迭代的类

python中可以使用 for … in …进行遍历(迭代)的数据类型,都是可迭代的对象。如 列表,字符串,字典,元组 都是可迭代的(Iterable),而浮点数,整型,布尔值都是不可迭代。for i in [1,2,3,4]: print(i)for i in "abcd": print(i)for i in {"key1":1,"key2":2,"key3":3}: print(i...

2020-04-16 00:36:30 1572

mutation_pattern 进行突变特征分析。

pdf文件中是NMF分解出的3个突变特征:signatureA、B、C,分别对应xls文件中每行,表格中的每个值代表该signature与cosmic中signature的余弦相似度,大于0.9时认为与cosmic中的signature基本一致,可以用cosmic中signature的功能和特点来解释。

2022-08-04

解析bam文件中flag标签

解析bam文件中flag标签

2022-02-10

bam文件标签含义.pdf

bam文件标签含义.pdf

2021-11-25

VCF格式详解.pdf

VCF格式详解.pdf

2021-11-25

生信分析服务器配置脚本

生信分析linux环境配置,安装分析软件环境,需要root权限

2021-08-13

Fonts.zip 文件大全

编程中文ttf文件

2021-04-24

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除