自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(99)
  • 收藏
  • 关注

原创 Py基础可视化-Matplotlib & Seaborn总结篇

另外方便读者们进行查阅,我会将相关的内容进行汇总,可在。

2023-05-19 16:09:09 533

原创 一文读懂单分子标签UMI

这些过程会引入偏差,包括重复、相应的 不均匀扩增以及因聚合酶误差导致的假象,这种误差会引入原始样品中本不存在的序列变化。具有不同分子条形码的读出序列代表不同的原始DNA 分子,而具有相同条形码的读出序列则是相同原始分子经 PCR 复制的结果。2. 仪器系统误差:最常使用的Illumina 测序仪来说,误差率在 ~0.05% 到 ~1% 之间,具体取决于读取长度、所用的碱基识别算法和测定的变异类型。, R | Y:可以是ATCG中的一种)或者固定核苷酸链(在模板分子有限的情况下)。

2023-07-11 13:42:17 819

原创 实验技术-汇总篇

202306. 实验技术-汇总篇。

2023-06-25 13:31:35 141

原创 实用干货-汇总篇

202306. 实用干货-汇总篇。

2023-06-25 13:31:07 180

原创 python高频函数—CSV() 读写

创建一个对象,该对象在操作上类似于常规 reader,但是将每行中的信息映射到一个 dict,该 dict 的键由 fieldnames 可选参数给出。无论字段名是如何确定的,字典都将保留其原始顺序。创建一个对象,该对象在操作上类似常规 writer,但会将字典映射到输出行。fieldnames 参数是由键组成的 序列,它指定字典中值的顺序,这些值会按指定顺序传递给 writerow() 方法并写入文件 f。返回一个 writer 对象,该对象负责将用户的数据在给定的文件类对象上转换为带分隔符的字符串。

2023-06-25 13:30:27 527

原创 python编程-汇总篇

202306. python编程-汇总篇。python编程-汇总篇。

2023-06-25 13:26:50 32

原创 5.实用干货-你可能没留意的几个生信基础

比如 2.0M 的 Panel Size,下机数据量1.0G,有50%数据落在目标区域(on target),50%为重复序列,那么其测序深度为500X (1.0G/2.0M),有效深度仅为125X(1G*50%*50%/2.0M)比如一个肿瘤panel测序, panel 的 size 为 2.0M,1.98M 的区域至少覆盖1X深度, 那么覆盖度是1.98/2=99%的话,那么还有1%的序列区域是没有通过测序获得的,Gap就是1%。不等同于测序深度,是指可信的去除重复序列(dup)后目标区域的平均深度。

2023-06-21 08:47:04 695

原创 3.Python高频函数—数据合并concat()

concat() 函数能够沿指定轴执行连接操作,同时对其他轴上的索引(如果有的话,Series 只有一个轴)执行可选的集合运算(并集或交集)前面merge 只适用于两个表格的合并,如果多个表格的合并可以用到concat().表中不存在的键值,将以NaN 补充。concat().函数应用示例。concat().函数。axis=1,横向拼接。

2023-06-19 13:28:13 618

原创 6.python高频函数-处理缺失值isnull()、fillna()、dropna()

如何判断pandas.DataFrame、Series是否包含缺失值NaN以及如何处理缺失值NaN。

2023-06-15 10:51:41 837

原创 4.Python高频函数—数据分割split()

这里是针对dataframe 的数据的列中的字符串进行分割、分列,首先需要先用.str将这一列转换为类似字符串的格式,然后再使用split()方法。根据分隔符或正则表达式对字符串进行拆分;返回数据框(DataFrame)或者复杂索引(MultiIndel)。需求:将Anno 这一列进行拆分成:Gene Transcript Exon。4.Python高频函数—数据分割split()dataframe 数据分割split()

2023-06-07 09:04:36 1090

原创 实验技术—测序数据不好,可能是建库出了问题?(上)

(低于50ng以下) 这种情况 不宜用机械打断,机械打断对样本损伤比较大,损失更多样本导致建库失败。更适合用酶切的方法;常规基本的步骤有:1 DNA的片段化、2: 末端补平,3 端加A 、4 连接测序接头、5 PCR扩增和纯化。自适应聚焦声波在样本中造成气穴现象从而机械随机的切断DNA,长片段的DNA,受到的剪切力比较大。建库的第一步就是获得片段大小合适的DNA分子,那么就需要对DNA 进行打断.,有更多的overlap区域,便于我们数据组装,可变剪切。,比如准备上PE150, 那么打断的片段可以在。

2023-06-05 08:52:31 1182

原创 1.Python高频函数—数据合并merge()

当左右两个frame的连接键的名字相同时,可以直接用参数‘on’。此时就用left_on和right_on参数以替代参数on。merger函数是Python里的数据分析工作中最常见的函数之一,主要应用场景是:针对同一个主键存在两张不同字段的表。默认值没有指定连接的列索引名称,以列名的交集作为连接键。两个表共同的键["Chrom", "Start", "End", ”Gene“]指定要执行的连接方式,inner : 使用左右侧frame的键的交集;_x和_y是默认后缀。简要的罗列函数的构成和参数的介绍。

2023-05-31 09:11:54 2271

原创 1.实验技术-收藏吃灰去,深入浅出常规PCR

PCR(Polymerase Chain Reaction,聚合酶链式反应)是现代生物学中一项必不可少的技术,能进行体外扩增DNA序列,为基因组研究和分子诊断提供了有力的工具。

2023-05-24 16:20:24 586

原创 09.python可视化-Seanorn绘制类别关系图boxplot() & boxenplot() & violinplot()

1). 箱线图 : boxplot() 2).增强箱图boxenplot() 3).小提琴图 :violinplot()

2023-05-12 14:07:14 672

原创 08.python可视化-Seanorn绘制类别关系图stripplot() &swarmplot()

1) 分类散点图:stripplot() 与 catplot(kind=“strip”)2) 分簇散点图: swarmplot() 与 catplot(kind=“swarm”)

2023-05-11 13:21:13 279

原创 05.Matplotlib-多子图设置

1. add_subplot() 绘制多子图。2. subplots() 绘制多子图。3. add_gridspec() 绘制多子图。4. subplot2grid() 绘制多子图。

2023-05-09 08:58:29 182

原创 (转载)04.Matplotlib-文本&注释&数学表达式设置

Matplotlib 支持绘制 TeX 包含的数学符号。TeX 是一套功能强大、十分灵活的排版语言,它可以用来绘制文本、符号、数学表达式等。2. matplotlib.pyplot.annotate 注释基本参数设置。1. matplotlib.pyplot.text 文本基本参数设置。Matplotlib Text 文本设置。weight:注释文本内容的粗细风格;x: 注释文本内容所在位置的横坐标;y:注释文本内容所在位置的纵坐标;string:注释文本内容;

2023-05-08 11:37:43 381

原创 (转载)03.Matplotlib-Seaborn figure styles图形外观设置

1. set_style设置图形背景风格。seaborn包含5中背景风格。2. 自定义背景风格。

2023-05-08 11:36:55 78

转载 (转载)02.python可视化-Matplotlib 标题&网格&坐标轴&刻度&刻度值设置

【代码】(转载)02.python可视化-Matplotlib 标题&网格&坐标轴&刻度&刻度值设置。

2023-05-05 09:30:48 602

原创 (转载)01.Matplotlib 图像结构-figure()&axes设置

介绍matplotlib 绘制图像起手, figure() 的设置, axes() 的设置。主要的内容可移步最后部分的总结。

2023-05-04 08:41:24 678

转载 (转载)实用干货—解惑NGS可能引入的错误突变

常规的NGS工作流程及其可能引入的错误突变来源包括样本制备、样本处理、PCR扩增、测序过程

2023-04-26 11:53:10 444

原创 ValueError: check_hostname requires server_hostname

2021-10-14 10:25:03 136

原创 生信分析- Pysam应用

https://mp.weixin.qq.com/s/ezsg8ho7dsDXWMF-jzFYYAPysam应用Pysam包是一个处理基因组数据的python模块,它打包了htslib-1.3、samtools-1.3 和 bcftools-1.3的核心功能,能在编程时非常灵活的处理bam和bcf文档,实现python处理基因组数据的无缝衔接,而不用在python进程内部调用samtools、bcftools等软件。函数Pysam的函数有很多,主要的读取函数有:AlignmentFi

2021-07-26 10:07:03 2410

原创 根据reads名称提取bam

软件: bbmap filterbyname.sh下载地址:https://sourceforge.net/projects/bbmap/./filterbyname.sh -hWritten by Brian BushnellLast modified September 1, 2016Description: Filters reads by name.Usage: filterbyname.sh in=<file> in2=<file2> out..

2021-05-26 15:38:12 1054

原创 R - scale()函数标准化

标准化 (Standardization)scale函数标准化处理原理是计算每组的平均值和标准差,再将组内各个数值与其平均值的差,与其标准差的比值,作为该数值在组内的相对数值。(考虑均值和离散程度)归一化(Normalization)归一化:1)把数据变成(0,1)或者(1,1)之间的小数。主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速。2)把有量纲表达式变成无...

2019-11-20 09:46:58 5565

原创 R | 方差分析

方差分析(analysisofvariance ,ANOVA ):用于 两个或两个以上 样本均数的比较 , 还可分析两个或多个研究因素的 交互作用 以及回归方程的 线性假设检验等。(涉及总变异、组内变异、组间变异、自由度)基本思想:把全部观察值间的变异—— 总变异按设计和需要分解成两个或多个组成部分,再作分析。理解:方差分析是分析数据间均值的差异。方差分析的前提条件...

2019-11-05 12:18:16 5794

原创 R | data frame去掉是零的行?

*** 去掉全为零的行情况一:若为多列数据框data [which(rowSums(data) > 0),]*** 去掉只要有一列为零的行data[which(rowSums(data==0)==0),]>str(data)data : int ... ### data的输出结果为数值类型若要把持数据类型不变的话,修改如下:data = [which(...

2019-11-05 11:58:41 27808

转载 R - 卡方分析

卡方检验,又称χ2检验,是一种非参数检验,主要是比较两个以及两个以上样本率以及两个分类变量之间是否具有显著的相关性,其根本思想是统计样本的实际观测值与理论推断值之间的偏离程度。卡方检验有3种推导过程:四格表法的卡方检验; 行列表法的卡方检验; 列联表法的卡方检验;卡方检验应用情况举个例子,两独立样本率的比较时,所有的理论数T≥5并且总样本量n≥40,用Pearson卡方进行检...

2019-11-05 11:47:04 2643

原创 R | RColorBrewer颜色设置

ggplot 、plot 画图时,都会有自带的颜色配置,但是比较难看。个人偏向自定义颜色,当然也有很多现成好用的配色方案(如RColorBrewer包)。RColorBrewer包 提供了3套很好的配色方案。 连续型sequential:生成一系列连续渐变的颜色。 离散型diverging:生成用深色强调两端、浅色标示中部的系列颜色。 分类型qualit...

2019-11-05 09:41:19 12363

原创 python 内存,存储,cpu使用率以及进程监控

#!/usr/bin/env python# -*- coding: UTF-8 -*-import osimport getpassimport psutilimport timeimport loggingimport smtplibfrom email.mime.text import MIMETextfrom email.header import Header...

2019-11-05 09:39:07 2699

原创 R - F检验

F检验(方差齐性检验): 主要通过比较两组数据的方差,以确定他们的密度是否有显著性差异(判断两总体方差是否相等,就可以用F检验)。F检验的前提: 数据满足正态分布,使用Shapiro-Will进行正态分布检验# 正态分布检验> shapiro.test(x)> statistic the value of the Shapiro-Wilk statistic.p.val...

2019-11-04 16:59:43 14525

原创 python3 | 利用Crypto生成公钥、私钥,文本加密、文本解密

生成公钥、私钥from Crypto import Randomfrom Crypto.PublicKey import RSA# 获取一个伪随机数生成器random_generator = Random.new().read# 获取一个rsa算法对应的密钥对生成器实例rsa = RSA.generate(2048, random_generator)# 生成私钥并保存pr...

2019-11-04 12:03:02 3920 1

原创 megahit 序列拼接

MEGAHITMEGAHIT is a single node assembler for large and complex metagenomics NGS reads, such as soil. Compare to SOAPdenovo, it generates longer contigs and consumes less memory.参考文献:an ultra-fast...

2019-11-01 16:41:26 9440

原创 cd-hit 去冗余

下载:http://www.bioinformatics.org/cd-hit/背景:生信分析中经常要根据指定条件查找相似序列,比如构建多个样品间的非冗余基因集、分析样品间的相似程度。cd-hit 去冗余,也可以叫做相似序列的聚类工作原理可概述为:将所有序列按照参数设定进行聚类,并将每一组聚类中的最长序列作为代表序列进行输出,同时给出每组聚类下的每个序列名可供相似度分析使用。其中设定阈...

2019-11-01 16:40:33 7612 1

原创 R | failed to load cairo DLL

系统 :mac os软件 :R-studio报错信息 :failed to load cairo DLL 、package or namespace load failed for 'Cairo'解决方法:Mac OS X 在 Mountain Lion 之后放弃 X11, 导致出现依赖包丢失。前往 XQuartz 安装 X11 link:https://www.xqua...

2019-10-31 10:42:14 3121

原创 R - R包安装

R安装方法一:下载R 安装包(下载路径:https://cran.rstudio.com/src/base/R-3/)./configure; make; make test; make install./configure --prefix=你想安装路径 ; make; make test; make install (非root )方法二:Linux下也可以通过相...

2019-10-30 13:58:07 3040

原创 R - 绘制箱线图

library(ggplot2)library(ggthemes)library("RColorBrewer")library(dplyr)library(tidyr)library(magrittr)display.brewer.all() # 显示所有可用色板display.brewer.all(type = "seq") # 查看渐变色板###颜色设置cols <...

2019-10-30 12:04:55 3427 1

转载 R - 参数传递函数: getopt()

getopt(),是getopt包的函数,需要先按照getopt包getopt(spec = NULL, opt = commandArgs(TRUE),command = get_Rscript_filename(), usage = FALSE,debug = FALSE)spec:一个4或5列的矩阵,里面包括了参数信息,前四列是必须的,第五列可选。第一列:参数的longname,...

2019-10-29 14:08:43 5154

原创 R - 包记录

library(rvest)library(magrittr)library(dplyr)library(tidyr)

2019-10-28 18:11:16 225

原创 R - 爬猎聘网职位酬薪

library(rvest)library(magrittr)library(dplyr)library(tidyr)### 单页抓取数据get_job_on_page <- function(url){##1、通过CSS 选择器,抓取网页的数据 #url <- c("https://www.liepin.com/zhaopin/?init=-1&headc...

2019-10-28 18:10:15 208

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除