自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(71)
  • 资源 (2)
  • 收藏
  • 关注

原创 perl的$符号扩展用法

$! 根据上下文内容返回错误号或者错误串$” 列表分隔符$# 打印数字时默认的数字输出格式$$ Perl解释器的进程ID$% 当前输出通道的当前页号$& 与上个格式匹配的字符串(当前进程的组ID( 当前进程的组ID(当前进程的组ID) 当前进程的有效组ID$* 设置1表示处理多行格式.现在多以/s和/m修饰符取代之.$, 当前输出字段分隔符$. 上次阅读的文件的当前输入行号$/ 当前输入记录分隔符,默认情况是新行$: 字符设置,此后的字符串将被分开,以填充连续的字段.$; 在

2021-06-19 20:16:53 4

原创 R语言的数据类型

一、数据类型概括来说,R可以识别六种基本的数据类型,分别是,双整型(double)、整型(integer)、字符型(character)、逻辑型(logical)、复数类型(complex)以及原始类型(raw).1.双整型(double)储存普通数值型数据,可正可负,可大可小,可含小数可不含R中键入的任何一个数值都默认以double型存储想知道某个对象是什么类型,可以使用typeof() 函数进行查看在数据科学里,它更常被称为数值型(numeric)2.整型(integer)顾名思义,只能

2021-06-03 11:16:35 37 1

原创 R语言强制数据类型转换

在R中进行将数据框类型转换为数字类型类型的时候,有时候会出现 错误: (串列)对象不能强制改变成’double’种类 解决分两步:①data<-apply(data,as.numeric)@as.numeric(data)这样即可解决问题。#将转化成类型TA_04_brain <- round(apply(t1_1, 1, mean))TA_04_brain <- as.integer(TA_04_brain)...

2021-06-03 11:09:29 88 2

原创 R语言单独保存输出图片文件

1.图片文件保存输出jpeg(file = "style.jpg") ##在当前目录下创建图片plot(iris[,1],col="red") ## 画图程序dev.off() ##只有dev.off()结尾才可以把图片保存出去。2.图片尺寸调整输出p.picture=paste(a,"test.jpg")jpeg(p.picture,width=1200,height=600)a=plot(iris[,1],col="red")print(a)dev.off()3.图片文件

2021-05-21 09:03:59 31

原创 Perl基本数组排序方法介绍

这篇文章主要介绍了Perl基本数组排序方法介绍,本文讲解基于ASCII码排序、比较函数、按字母顺序排列、Perl对数值排序等内容本文我们学习如何用Perl对字符串或者数字数组进行排序。Perl有个内置函数叫做sort毫无疑问的可以排序一个数组。 其最简单的形式是传递一个数组,它会返回排序后的元素组成的数组。@sorted = sort @original。基于ASCII码排序#!/usr/bin/perluse strict;use warnings;use 5.010;use Data::

2021-04-29 12:54:24 25

原创 perl 统计字符串中特定字符出现的次数

perl 统计字符串中特定字符出现的次数方法一: #!/usr/bin/perl -w use strict; my $str = 'abcsfsaf#sdagasdga#sdgaghoiiopjh#dsfjkopahkl;fjh#dsjfklpafj '; my $count = $str =~ tr/#/#/; print $count; 统计了字符串$str 中出现的#的个数,在这里用到了转换操作符tr///,简单快速,当之首选。附上s/// 和tr/// 的区别:s///: 替

2021-04-29 12:45:30 40

原创 R语言大小写字母转换

R语言小写函数 tolowerx = “CAGTTTCTTGAGTCTGATTAATTCAGGTTTCGGGGT”#定义字符串变量xtolower(x)[1] “cagtttcttgagtctgattaattcaggtttcggggt”#将x中的字符全部转换为小写字母y = tolower(x)y[1] “cagtttcttgagtctgattaattcaggtttcggggt”大写函数touppertoupper(y)[1] “CAGTTTCTTGAGTCTGATTAATTC

2021-04-21 10:02:32 446

原创 R语言中因子(factor)转换成数值型(numeric)的问题

R语言中因子(factor)转换成数值型(numeric)的问题一直觉得只要是数字,不管是什么类型的,都可以通过as.numeric()函数转换为对应的numeric类型的数字,例如x<-“123”,x为character类型,而as.numeric(x)则为numeric类型的123。但是因子(factor)类型却不一样。a<-factor(c(100,200,300,301,302,400,10)),它们的值分别为100 200 300 301 302 400 10,然而as.nume

2021-04-04 08:04:08 354

原创 使用R中merge()函数合并数据

使用R中merge()函数合并数据使用R中merge()函数合并数据在R中可以使用merge()函数去合并数据框,其强大之处在于在两个不同的数据框中标识共同的列或行。如何使用merge()获取数据集中交叉部分merge()最简单的形式为获取两个不同数据框中交叉部分。举例,获取cold.states和large.states完全匹配的数据。代码如下: merge(cold.states, large.states) Name Frost Area1 Alaska 152 566432

2021-04-01 00:51:24 126

原创 R语言中数据框某一列进行分割,变成两列

R语言中数据框某一列进行分割,变成两列 type id pedigree trait1 trait2 trait31 training L0001 f1_X_m1 -1.746103 -0.7855251 -0.3316372 training L0002 f2_X_m1 -1.679248 -1.5694899 -2.5726143 training L0003 f3_X_m1 -2.748920 -0.6086439 -1.1088124 traini

2021-04-01 00:48:45 653

原创 dplyr包30个实例

dplyr包30个实例dplyr软件包是R中功能最强大,最受欢迎的软件包之一。该软件包由最受欢迎的R程序员Hadley Wickham编写,他编写了许多有用的R软件包,如ggplot2,tidyr等。本文包括一些示例和如何使用使用dplyr软件包来清理和转换数据。这是一个关于数据操作和数据处理的完整教程。什么是dplyr?dplyr是一个强大的R软件包,用于处理,清理和汇总非结构化数据。简而言之,它使得R中的数据探索和数据操作变得简单快捷。dplyr有什么特别之处?软件包“dplyr”包含许多主要

2021-04-01 00:48:05 47

原创 R语言-数据导出

1、导出文本文件1)write.table函数语法:write.table (x, file ="", sep ="", row.names =TRUE, col.names =TRUE, quote =TRUE)x:需要导出的数据file:导出的文件路径sep:分隔符,默认为空格(" "),也就是以空格为分割列row.names:是否导出行序号,默认为TRUE,也就是导出行序号col.names:是否导出列名,默认为TRUE,也就是导出列名quote:字符串是否使用引号表示,默认为TRUE

2021-04-01 00:33:09 125

原创 文件IO---标准输入、标准输出和标准错误

文件IO—标准输入、标准输出和标准错误(1) 每个进程都会默认打开3个文件描述符,即0、1、2。其中0代表标准输入流、1代表标准输出流、2代表标准错误流。通常标准输入流对应着键盘的设备文件、标准输出流和错误流对应着显示器的设备文件。在编程中通常使用宏STDIN_FILENO、STDOUT_FILENO和STDERR_FILENO分别来代表0,1,2。要注意一点:0、1、2这三个文件描述符对应的是标准输入流、标准输出流和标准错误流而不是键盘设备文件和显示器设备文件。只是默认标准输入流对应着键盘设备文件,

2021-03-31 11:33:37 45

原创 查询服务器内核数量

总核数 = 物理CPU个数 X 每颗物理CPU的核数总逻辑CPU数 = 物理CPU个数 X 每颗物理CPU的核数 X 超线程数查看物理CPU个数cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l查看每个物理CPU中core的个数(即核数)cat /proc/cpuinfo| grep "cpu cores"| uniq查看逻辑CPU的个数cat /proc/cpuinfo| grep "processor"| wc -l查看

2021-03-22 20:51:25 18

原创 让老照片重现光彩:Bringing Old Photos Back to Life(实战)

Bringing Old Photos Back to Life香港城市大学和微软亚洲研究院的“让老照片重现光彩”(Bringing Old Photos Back to Life)项目侧重于对老照片进行划痕修复和人脸效果增强,在老照片处理方面取得了很好的成绩,在这篇文章里我们介绍一下这个项目。论文地址:https://arxiv.org/abs/2004.09484Github项目:https://github.com/microsoft/Bringing-Old-Photos-Back-to-Li

2021-03-22 14:30:49 353 3

原创 关于正则表达式中的.*,.*?,.+?的理解

1. .*. 表示 匹配除换行符 \n 之外的任何单字符,*表示零次或多次。所以.*在一起就表示任意字符出现零次或多次。没有?表示贪婪模式。比如a.*b,它将会匹配最长的以a开始,以b结束的字符串。如果用它来搜索aabab的话,它会匹配整个字符串aabab。这被称为贪婪匹配。又比如模式src=`.*`, 它将会匹配最长的以 src=` 开始,以`结束的最长的字符串。用它来搜索 <img src=``test.jpg` width=`60px` height=`80px`/> 时,将会返回 s

2021-03-21 22:27:47 45

原创 如何在R代码中找到一个值的行号

如何在R代码中找到一个值的行号?例如:在以下一组值中,如何在第4列中找到特定值的行号?如何使用R代码命令找到列4中的值“1578”的行号。> mydata_2 sex age height_seca1 height_chad1 height_DL weight_alog11 F 19 1800 1797 180 70.02 F 19 1682 1670 167

2021-03-07 02:28:07 108

原创 cut用法简介

cut是以每一行为一个处理对象的,这种机制和sed是一样的。1、 cut一般以什么为依据呢? 也就是说,我怎么告诉cut我想定位到的剪切内容呢?cut命令主要是接受三个定位方法:第一,字节(bytes),用选项-b第二,字符(characters),用选项-第三,域(fields),用选项-f2、 以“字节”定位,给个最简单的例子?举个例子吧,当你执行ps命令时,会输出类似如下的内容:[rocrocket@rocrocket programming]$ whorocrocket :0

2021-02-28 11:27:45 394

原创 选择压力分析

如何进行选择压力分析。按照群体数量,选择压力分析的方法主要可分成两类:DNA多样性的计算(单个群体内分析)和多样性水平在不同亚群间的比较(多群体分析)。第一类方法DNA多样性的计算(单个群体内分析)。在动植物重测序领域,选择压力分析的方法大多数是在同一个物种内,进行多样性统计和比较。最基础的方法,也是重测序文章中用的最多的方法π值的计算。π值就是计算两两序列的差异度,然后求均值。下图有4条序列,它们如果进行两两比较,应该有6组比较。例如,序列1和2的差异度是0.1(10个碱基长度,1个差异位点),序

2021-02-23 11:00:21 271

原创 Python中“if __name__==‘__main__‘:”的详细解答。

__name__是魔法函数的一种1. __name__的理解1.1 为什么使用__name__属性?Python解释器在导入模块时,会将模块中没有缩进的代码全部执行一遍(模块就是一个独立的Python文件)。开发人员通常会在模块下方增加一些测试代码,为了避免这些测试代码在模块被导入后执行,可以利用__name__属性。1.2 __name__属性。__name__属性是Python的一个内置属性,记录了一个字符串。若是在当前文件,__name__ 是__main__。在hello文件中打

2021-02-20 22:04:13 29

原创 Trimmomatic

写在前面Trimmomatic工具是用于illumina二代测序数据的reads处理,主要对接头(adapter)序列和低质量序列进行过滤。下面是使用该工具处理双端测序(PE)数据时,常用参数的一些说明。参考文档Trimmomatic工具的参考文献Trimmomatic工具官网Trimmomatic工具使用手册软件使用执行命令## 双端测序数据使用方法# 使用v0.32版本:1. java -jar trimmomatic-0.32.jar PE \2. [-threads &lt

2021-02-03 10:22:11 156

原创 正则表达式基础

正则表达式基础1.1. 简单介绍正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别只在于不同的编程语言实现支持的语法数量不同;但不用担心,不被支持的语法通常是不常用的部分。如果已经在其他语言里使用过正则表达式,只需要简单看一看就可以上手了。下图展示了使用正则表达式进行匹配的流程:正则表达式的大致匹配过程是:依次

2021-01-17 17:19:25 28

原创 Python数据处理-pandas用法

Python pandas用法介绍在Python中,pandas是基于NumPy数组构建的,使数据预处理、清洗、分析工作变得更快更简单。pandas是专门为处理表格和混杂数据设计的,而NumPy更适合处理统一的数值数组数据。使用下面格式约定,引入pandas包:import pandas as pdpandas有两个主要数据结构:Series和DataFrame。SeriesSeries是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数**据标签(即索引)

2020-12-17 00:23:03 157

原创 Samtools应用指南-处理Sam与Bam文件

安装去官网下载想要的版本tar jxvf samtools-1.9.tar.bz2cd samtools-1.9./configure --prefix=全路径/samtools-1.9makemake install1.0之前的版本没有configure步骤下载后直接makeCOMMANDS1.viewview主要是将sam文件转换成bam文件;对bam文件进行各种操作,如数据排序(不属于本命令的功能)和提取(这些操作是对bam文件进行,因而当输入为sam文件的时候,不能进行该操作

2020-12-07 23:31:48 671

原创 Hisat2 Bowtie2比对结果解读

Bowtie2用户手册:http://bowtie-bio.sourceforge.net/bowtie2/manual.shtml在看比对结果前需要了解三个概念:1.Aligned concordantly 合理比对主要和比对参数:–fr/–rf/–ff 有关,默认是:–fr在参数–fr下:前两种比对就是合理比对,也即:concordantly,后两种比对会成为不合理比对,也即:aligned discordantly,如果两个reads距离太远也会成为不合理比对。2.Multiple ali

2020-12-07 23:12:01 890

原创 Linux shell标准输入,标准输出,错误输出

Linux shell标准输入,标准输出,错误输出文件文件描述符标准输入是文件描述符0。它是命令的输入,缺省是键盘,也可以是文件或其他命令的输出。标准输出是文件描述符1。它是命令的输出,缺省是屏幕,也可以是文件。标准错误是文件描述符2。这是命令错误的输出,缺省是屏幕,同样也可以是文件。重定向的使用有如下规律:1)标准输入0、输出1、错误2需要分别重定向,一个重定向只能改变它们中的一个。2)标准输入0和标准输出1可以省略。(当其出现重定向符号左侧时)3)文件描述符在重定向符号左侧时直接写即可,

2020-12-07 22:07:46 67

原创 matplotlib如何显示中文

python matplotlib如何显示中文、负号1.在.py文件最上面加上#-*- coding: utf-8 -*-以修改编码方式然后在文件头部加上import matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus']=False #用来正常显示负号附上字体说明:中文字体 说明‘SimHei’

2020-12-02 22:09:50 156

原创 linux环境使用计算器功能

linux环境下如何使用计算器功能输入bc然后就进入了计算器模式。退出则输入quit。使用示例示例一 命令行方式使用bc[root@localhost centos39]# bc bc 1.06Copyright 1991-1994, 1997, 1998, 2000 Free Software Foundation, Inc.This is free software with ABSOLUTELY NO WARRANTY.For details type `warranty'. 3

2020-10-22 19:55:10 52

原创 Linux中单引号,双引号,反引号

1.单引号单引号将其中的内容都作为了字符串来,忽略所有的命令和特殊字符,类似于一个字符串的用法echo 'This is a string'>>> This is a stringecho 'ls ./'>>> ls ./2.双引号双引号与单引号的区别在于其可以包含特殊字符(单引号直接输出内部字符串,不解析特殊字符;双引号内则会解析特殊字符),包括’, ", $, ,如果要忽略特殊字符,就可以利用\来转义,忽略特殊字符,作为普通字符输出:var =

2020-10-16 10:29:33 124

原创 VCF格式详解

VCF格式详解CHROM(chromosome):染色体POS - position:参考基因组variant碱基位置,如果是INDEL(插入缺失),位置是INDEL的第一个碱基位置ID - identifier: variant的ID。比如在dbSNP中有该SNP的id,则会在此行给出;若没有,则用’.'表示其为一个novel variant。REF - reference base(s):参考碱基,染色体上面的碱基,必须是ATCGN中的一个,N表示不确定碱基ALT - alternate ba

2020-10-06 15:54:12 603

原创 samtools flagstat命令简介

samtools flagstat命令简介:统计输入文件的相关数据并将这些数据输出至屏幕显示。每一项统计数据都由两部分组成,分别是QC pass和QC failed,表示通过QC的reads数据量和未通过QC的reads数量。以“PASS + FAILED”格式显示。还可以根据samtools的标志位显示相应的内容,但是这里不做讨论。 命令格式: samtools flagstat <in.bam> |<in.sam> | <in.cram>

2020-10-03 21:24:35 260

原创 BWA的使用

一、简介BWA,即Burrows-Wheeler-Alignment Tool。BWA 是一种能够将差异度较小的序列比对到一个较大的参考基因组上的软件包。它由三个不同的算法:BWA-backtrack: 是用来比对 Illumina 的序列的,reads 长度最长能到 100bp。BWA-SW: 用于比对 long-read ,支持的长度为 70bp-1Mbp;同时支持剪接性比对。BWA-MEM: 推荐使用的算法,支持较长的read长度,同时支持剪接性比对(split alignments),但是B

2020-10-01 14:02:40 933

原创 MCScanX使用说明

基因组共线性工具MCScanX使用说明MCScanX是检测基因共线性和进化分析的常用工具之一,2012发表至今引用数200+,作者之一的唐海宝老师是国内植物基因组学生信分析、软件开发领域的大拿,在学习使用MCScanx之前推荐先看看他08年介绍gene synteny和collinearity概念的science文章以及MCScanX软件算法文章。Tang H, Bowers J E, Wang X, et al. Synteny and Collinearity in Plant Genomes[J]

2020-09-30 16:28:08 804 1

原创 GTF/GFF文件转换

GFF 文件GFF全称为general feature format,这种格式主要是用来注释基因组。从Ensembl导出的GFF文件示例:X Ensembl Repeat 2419108 2419128 42 . . hid=trf; hstart=1; hend=21X Ensembl Repeat 2419108 2419410 2502 - . hid=AluSx; hstart...

2020-09-29 12:33:57 758

原创 if __name__ == ‘__main__‘ 如何正确理解?

if name == ‘main’ 如何正确理解?通俗的理解__name__ == ‘main’:假如你叫小明.py,在朋友眼中,你是小明(name == ‘小明’);在你自己眼中,你是你自己(name == ‘main’)。if name == 'main’的意思是:当.py文件被直接运行时,if name == 'main’之下的代码块将被运行;当.py文件以模块形式被导入时,if name == 'main’之下的代码块不被运行。1、这段代码的功能一个python的文件有两种使用的方法,第一是

2020-09-25 22:56:54 102

原创 fasta格式 图解

2020-09-25 17:52:45 147

原创 PyCharm自动添加文件头注释

位置:File->settings->Editor->File and Code Templates->Python Script在右上的输入框添加:#!/usr/bin/env python# -*- coding: utf-8 -*-# @Time : ${DATE} ${TIME}# @Author : Baimo# @Email : 123456789@xxx.com# @File : ${NAME}.py...

2020-09-25 17:29:23 18

原创 Python常用模块

os模块:os.remove() 删除文件 os.unlink() 删除文件 os.rename() 重命名文件 os.listdir() 列出指定目录下所有文件 os.chdir() 改变当前工作目录os.getcwd() 获取当前文件路径os.mkdir() 新建目录os.rmdir() 删除空目录(删除非空目录, 使用shutil.rmtree())os.makedirs() 创建多级目录os.removedirs() 删除多级目录os.stat(file) 获取文件属性o

2020-09-25 12:50:22 37

原创 sed 命令详解

root@www ~]# sed [-nefr] [动作]选项与参数:n :使用安静(silent)模式。在一般 sed 的用法中,所有来自 STDIN 的数据一般都会被列出到终端上。但如果加上 -n 参数后,则只有经过sed 特殊处理的那一行(或者动作)才会被列出来。-e :直接在命令列模式上进行 sed 的动作编辑;-f :直接将 sed 的动作写在一个文件内, -f filename...

2020-09-23 20:25:56 66

原创 samtools直接查看bam文件

SAM和BAM是序列比对之后常用的输出格式,比如tophat输出BAM格式,bowtie和bwa等都采用了SAM格式。BAM格式其实就是SAM格式的二进制格式,占用存储空间更小。samtools由中国学者开发,专门用于sam/bam格式文件的各种操作。1)查看BAM/SAM格式文件samtools view [‐bhuHS] [‐t in.refList] [‐o output] [‐f reqFlag] [‐F skipFlag] [‐q minMapQ] [‐l library] [‐r read‐

2020-09-23 20:25:16 3524

Python基础课件.pdf

python爬虫的全流程,学习后能迅速上手,提高工作效率

2021-02-21

数据可视化课件.pdf

Flask作为Web框架,它的作用主要是为了开发Web应用程序。那么我们首先来了解下Web应用程序。

2021-02-22

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除