自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(41)
  • 资源 (3)
  • 收藏
  • 关注

原创 R统计建模

文章目录@[toc]第 1 章 概率统计常识1.1 随机事件与概率1.1.1 随机事件1.1.1.1 随机事件1.1.1.2 随机事件间的关系1.1.1.3 随机事件的运算律1.1.2 概率1.1.2.2 概率的性质1.1.2.3 古典概型1.1.2.4 几何概型1.1.2.5 条件概率1.1.2.6 乘法公式、全概率公式、Bayes公式1.1.2.7 独立事件1.1.2.8 n重Bernoulli 试验及其概率计算1.2 随机变量及其分布1.2.1 随机变量的定义1.2.2 随机变量的分布函数1.2.3

2021-03-28 15:04:20 627

原创 AutomateTheBoringStuffWithPython

Python编程快速上手—让繁琐工作自动化 Automate The Boring Stuff With Python第一部分 Python编程基础第 1 章 Python 基础1.1 在交互式环境中输入表达式操作符**%///*-+操作指数取模/取余数整除/商数取整除乘减加1.2 整型、浮点型和字符串数据类型int float char1.3 字符串连接和复制连接:+>>>'Hello' + ',' + 'World'

2021-03-04 22:14:18 2544 1

原创 IterativeTransferLearningWithNeuralNetworkForClusteringAndCellTypeClassificationInscRNA-seqAnalysis

Iterative Transfer Learning with Neural Network for Clustering and CellType Classification in Single-cell RNA-seq Analysis ——20210301Background​ 单细胞RNA测序(scRNA-seq)分析的一个重要步骤是通过聚类来确定细胞群或类型。细胞类型的知识可以揭示细胞在组织、发育阶段和生物体中的异质性,并提高我们对细胞和基因功能在健康和疾病中的理解。但其高维性和遗传的

2021-03-03 00:48:03 869

原创 R 入门级 之 《R简介 && R和R Studio安装》 --200411

简介RR是一个有着统计分析功能及强大作图功能的软件系统,是由Ross Ihaka和Robert Gentleman1共同创立。R语言可以看作是由AT&T贝尔实验室所创的S语言发展出的一种方言。R是在GNU协议General Public Licence4下免费发行的,它的开发及维护 现在则由R开发核心小组R Development Core Team具体负责。R的安装文件有多种形式...

2020-04-11 15:30:17 640

原创 CSDN如何修改用户名

用户名当你用QQ或微信注册CSDN成功后,用户名便由系统自动生成。QQ注册的以"qq_"开头,微信注册以"wechat_"开头例如**https://blog.csdn.net/qq_42937176**用户名是注册时系统自动生成,具有唯一性和不可修改性so你就安心接受吧!!!不过昵称是可修改,同时具有唯一性的初始昵称为用户名,可以人为修改。但已有的用户昵称不能为己所用,所以好好给...

2019-12-09 20:52:01 428

原创 chr Palindromes

字符串处理var = ${}cat config | while read iddo sed -i "s/ /,/g" outM.txt ##字符替换 cat $id.txt | while read jd do echo ${var:${jd%,*}:${jd#*,}} >> chr$id.txt donedone

2021-01-18 21:55:41 130

原创 GATK4 简易用法 --20201213

ContentsJava command basicsUsing the gatk wrapper script (recommended)Adding GATK argumentsAdding Java argumentsAdding Spark argumentsExamples of real commands1. Java command basicsGATK follows the basic Java command-line syntax:java -jar progra

2020-12-13 21:19:05 1080

原创 肿瘤外显子数据分析 -- 20201119

WGS

2020-12-10 21:25:17 4889

原创 2020-12-09

qsub任务提交系统qsub -a [YY][MM][DD][hh][mm][ss] run.s#参数解析#指定节点数目 ppn指每个节点运行的cpu数量(4个小节点,每个48个CPU)#PBS -l nodes=1:ppn=16#指定合并到标准输出文件中#PBS -j oe#设置程序运行的最大时间192小时#PBS -l walltime=192:00:00#指定qsub的所有环境变量都传递到批处理作业中#PBS -V#输出文件#PBS -o /public/home/ta

2020-12-09 23:11:26 270

原创 10分钟让你了解R的基本数据操作:R 入门级 之 《R的管理绘图》 -- 200509

title: “R的管理绘图”author: “HHTING”date: “2020/5/9”output:word_document: defaulthtml_document:df_print: pagedpdf_document:keep_tex: yeslatex_engine: xelatexheader-includes: \usepackage{ctex}1. 打开多个绘图设备?device # view available drawing devicex11().

2020-05-10 19:55:39 360

原创 一个表格带你了解R的绘图函数

高级作图函数(high-level plotting functions)function功能plot(x)以x的元素值为纵坐标、以序号为横坐标绘图plot(x, y)x(在x-轴上)与y(在y-轴上)的二元作图sunflowerplot(x,y)同上 但是以相似坐标的点作为花朵,其花瓣数目为点的个数pie(x)饼图boxplot(x)盒形图(“box-and-whiskers”)stripchart(x)把x的值画在一条线段上,样本量较小时可

2020-05-09 21:48:04 519

原创 <Question4> of R & Biostatistics

Question大量检测已知正常人血浆载脂蛋白E总体平均水平为4.15mmol/L,总体分布近似于正态分布。某医师经抽样测得16例陈旧性心机梗死患者的血浆载脂蛋白E平均浓度为4.98mmol/L,标准差为2.78mmol/L。据此能否认为陈旧性心肌梗死患者的血浆载脂蛋白E平均浓度与正常人的平均浓度不一致?并给出置信区间(显著性水平)为研究某铁剂治疗和饮食治疗对营养性缺铁性贫血的效果,将...

2020-04-23 12:06:14 1430

原创 10分钟让你了解R的基本数据操作:R 入门级 之 《R的数据操作》 -- 200418

title: “R的数据操作”author: “HHTING”output:html_document:df_print: pagedword_document: defaultpdf_document:keep_tex: yeslatex_engine: xelatexheader-includes: \usepackage{ctex}R的数据操作对象R通过刻画对象的名...

2020-04-18 19:24:15 1647

原创 一张表格教会了我统计学常用的数据处理函数

函数功能sum(x)对x中的元素求和prod(x)对x中的元素求连乘积max(x)x中元素的最大值min(x)x中元素的最小值which.max(x)返回x中最大元素的下标which.min(x)返回x中最小元素的下标range(x)与c(min(x), max(x))作用相同length(x)x中元素的数目mea...

2020-04-17 22:26:32 444

原创 R 入门级 之 《对象类型的转换》 --200417

转换目标函数规则数值型as.numericFALSE → 0;TRUE → 1;“1”, “2”, . . . → 1, 2, . . .; “A”, . . . → NA逻辑型as.logical0 → FALSE;其它数字 → TRUE; “FALSE”, “F” → FALSE; “TRUE”, “T” → TRUE; 其它字符 → NA字符型as...

2020-04-17 11:13:01 183

原创 ts() of R

ts(data = NA, start = 1, end = numeric(), frequency = 1, deltat = 1, ts.eps = getOption("ts.eps"), class = , names = )ArgumentsFunctiondata一个向量或者矩阵start第一个观察值的时间,为一个数字或者是一个由两个整 数构成的...

2020-04-16 22:37:36 320

原创 R 你所不知道的那些随机序列生成函数,一个表格全给你

分布名称函数Gaussian(normal) rnorm(n, mean=0, sd=1)exponentialrexp(n, rate=1)gammargamma(n, shape, scale=1)Poissonrpois(n, lambda)Weibullrweibull(n, shape, scale=1)Cauchyrcauc...

2020-04-15 21:56:25 316

原创 write.table() | write.csv() | write.csv2() of R

write.table(x, file = “”, append = FALSE, quote = TRUE, sep = " ",eol = “\n”, na = “NA”, dec = “.”, row.names = TRUE,col.names = TRUE, qmethod = c(“escape”, “double”),fileEncoding = “”)write.csv(…...

2020-04-15 16:10:02 8922

原创 scan() of R

scan()data <- scan("data.csv", what = list(" ", 0, 0))scan()相较于read.table()可以指定变量的类型。当what被省略,scan()将创建一个数值型向量。如果读取的数据类型与缺省类型或指定类型不符,则返回错误信息。scan(file = “”, what = double(), nmax = -1, n = -1, ...

2020-04-15 15:47:21 417

原创 read.table() | read.csv() | read.csv2() | read.delim() | read.delim2() of R

read.table(file, header = FALSE, sep = “”, quote = “”’",dec = “.”, numerals = c(“allow.loss”, “warn.loss”, “no.loss”),row.names, col.names, as.is = !stringsAsFactors,na.strings = “NA”, colClasses =...

2020-04-14 21:28:53 1456

原创 R 入门级 之 《R的基本原理与概念》 -- 200412

Basic Principles and Concepts of R一、基本原理R是一种解释型语言,输入的命令可以直接被执行,不同于C等编译语言需要构成完整的程序才能运行。R的语法非常简单和直观。合法的R函数总是带有圆括号的形式,即使括号内没有内容(如,ls())。所有函数后都接有圆括号以区别于对象(object)。所有能使用的R函数都被包含在一个库(library) 中,该库存放在磁盘 ...

2020-04-12 15:24:47 528

原创 <Question3> of R & Biostatistics

第一题要求:在R环境中完成下述操作,并写出具体R代码。查看R当前工作目录,设置R工作目录为数据所在目录并查看该目录下的文件;将数据homework3_data.csv导入到R中;查看行列数及前5行数据以及数据类型;对数据中的测量值进行描述统计并绘制箱线图;下载并安装R包pwr,查看帮助文档了解用法。第二题R language application. Please use R ...

2020-04-11 16:50:55 554 1

原创 test

title: “test”output:pdf_document:latex_engine: xelatexword_document: defaulthtml_document:df_print: pagedknitr::opts_chunk$set(echo = TRUE)R MarkdownThis is an R Markdown document. Markdown...

2020-04-11 16:39:03 104

原创 生物统计学 之 简介

Key words:总体:研究的总对象个体:总体中的基本组成单元样本:从总体中抽出的若干个体的集合变量:相同性质的样本间的差异性表现或特征的数据量参量:参数,对一个总体特征的度量统计数:从样本计算所得的数值,是总参的估计值准确性:统计数接近真知的程度精确性:实验中同一试验指标的重复性观测值彼此接近的程度大小误差:实验中因不可控元素所导致的观测值与真值的偏离度错误:实验中人为因素...

2020-03-04 15:32:14 399

原创 生物信息学 之 序列比对

针对DNA、RNA以及蛋白质序列,我们需要对其进行序列相似性搜索,来研究分析不同序列在结构和功能上相同与差异相似性【similarity】/一致性【identity】 <==> 双序列比对( Pairwise sequence Alignment )同源性【homology】 <==> 多序列比对 (Multiple Sequence Alignmen...

2020-02-27 20:46:50 3270

原创 Python -- keywords

Keywordspython3.7共有33个关键词,分别是False True None and as assert break class continue def del elif else except finally for from global if import in is lambda nonlocal not or pass raise return try white wi...

2020-01-16 21:17:50 283

原创 Ipython

Ipython

2020-01-16 19:20:27 231

原创 生物信息学 之 fastQ

fastQ格式是保存核酸序列及其测序质量得分信息、由单个ASCⅡ字符表示的文本格式,是当前保存高通量测序结果的事实标准。格式(四行/序列)第一行: @序列标识符及描述信息第二行: 序列信息第三行: +序列的标识及描述信息(可选)第四行:FASTQ文件中,一个序列通常由四行组成:第一行以@开头,之后为序列的标识符以及描述信息(与FASTA格式的描述行类似)第二行为序列信息第三行...

2020-01-10 19:36:44 289

原创 ALGORITHMS == 算法刷题网站推荐

LeetcodeEnglish:https://leetcode.com/Chinese:https://leetcode-cn.com/OpenjudgeWebsite:http://openjudge.cn/HDUWebsite:http://acm.hdu.edu.cn/USTCWebsite:http://acm.ustc.edu.cn/ustcoj/FZUWebsit...

2020-01-02 15:41:25 272

原创 最短路径 -- Dijkstra算法

定义一个有向图D=(V, A),对每一个弧a=(v<sub>i</sub>, v<sub>j</sub>),相应地有权ω(a)=ω<sub>ij</sub>,又给定D中的两个顶点v<sub>s</sub>,v<sub>t</sub>。设P是D中从v<sub>s<...

2019-12-30 12:43:55 242

原创 最短路径 -- Dijkstra算法

定义一个有向图D=(V, A),对每一个弧a=(vi, vj),相应地有权ω(a)=ωij,又给定D中的两个顶点vs,vt。设P是D中从vs到vt的一条路径,定义路P的权是P中所有弧的权之和,记为ω§。最短路径问题就是要在所有从vs到vt的路中,求一条权最小的路,即求一条从vs到vt的路P0,使ω(P0)=min ω(P)在Dijkstra算法中,用P(v),T(v)分别表示点v的P标号和T标号...

2019-12-21 21:42:18 740

原创 运筹学 -- 简介

1. 线性规划与单纯形法2. 对偶理论和灵敏度分析3. 运输问题4. 线性目标规划5. 整数线性规划6. 动态规划7. 图与网络分析8. 排队论9. 存储论10. 对策论11. 决策论...

2019-12-16 11:03:08 412

原创 Tensorflow2.0.0 之 tf.placeholder

Inserts a placeholder for a tensor that will be always fed.tf.compat.v1.placeholder( dtype, shape=None, name=None)Important: This tensor will produce an error if evaluated. Its value m...

2019-12-15 21:27:50 10435

原创 LCS(Needleman_Wunsch算法)算法 (python实现)

最长公共子序列(longest common subsequence,LCS)# -*- coding: utf-8 -*-"""Created on Tue Nov 26 19:55:48 2019@author: HTING"""import numpy as npdef LCS(str1,str2): s = 0 l = np.zeros([len(st...

2019-12-15 14:20:08 566

原创 Levenshtein Distance (LD) 算法

Levenshtein Distance(莱文斯坦距离/编辑距离/Edit Distance):指两个字串之间,由一个转成另一个所需的最少编辑操作次数,如果它们的距离越大,说明它们越是不同。算法过程:- ①if(str1.length==0) return str2.length;if(str2.length==0) return str1.length;- ②init (n+1...

2019-12-15 14:15:40 262

原创 Anaconda 入门级 《Conda 入门》 -- 191205

在Windows上,以下所有命令均在Anaconda Prompt窗口中键入。Conda管理检查是否安装成功:conda --version or conda -V结果:conda 4.7.10更新conda:conda update condaif have Proceed ([y]/n)? y==> y环境管理创建新环境:conda create --name env_n...

2019-12-05 22:08:30 166

原创 Anaconda 入门级《Conda Packages》 --191205

Conda PackagesConda包是压缩的tarball文件(.tar.bz2)或.conda文件组成system-level librariesPython or other modulesexecutable programs and other componentsmetadata under the info/directorya collection of file...

2019-12-05 21:28:37 261

原创 Anaconda 入门级《安装&&更新》 --191205

Anaconda 安装官网下载地址:https://www.anaconda.com/distribution/机械式安装即可从旧版本更新Windows:打开“开始”菜单,然后选择Anaconda Prompt。macOS或Linux:打开终端窗口。输入以下命令:conda update condaconda update anaconda=VersionNumberVer...

2019-12-05 20:28:17 222

原创 Tensorflow入门 -- 191204

Definition使用图 (graph) 来表示计算任务.在被称之为 会话 (Session) 的上下文 (context) 中执行图.使用 tensor 表示数据.通过 变量 (Variable) 维护状态.使用 feed 和 fetch 可以为任意的操作(arbitrary operation) 赋值或者从其中获取数据.SummarizeGraph:图中的节点为op(op...

2019-12-04 20:59:16 189

原创 Machine Learning in Action ---- kNN

-- coding: utf-8 --“”"Created on Thu Nov 14 19:29:08 2019@author: HTING“”"导入科学计算包模块import numpy as np导入运算符模块import operator====================================================================...

2019-11-15 17:37:59 99

<Question4> of R & Biostatistics

(1)Assess whether there are differential expressions between two groups of each gene. (2)Use the Bonferroni method to correct for multiple comparisons in Problem (1). Which genes show statistically significant differential expression? (3)Use the FDR method to correct for multiple comparisons using an FDR = 0.05. Which genes show statistically significant differential expression?

2020-04-23

02R的数据操作.html

我们已经看到R通过一些对象来运行,当然首先这些对象是用它们的名称 和内容来刻画的,其次也通过对象的数据类型即属性来刻画。本节我们主要通过学习对数据对象的基本操作来学习R的基本入门语法。

2020-04-18

R基本原理和概念.html

R是一种解释型语言,输入的命令可以直接被执行,不同于C等编译语言需要构成完整的程序才能运行。R的语法非常简单和直观。合法的R函数总是带有圆括号的形式,即使括号内没有内容(如,ls())。所有函数后都接有圆括号以区别于对象(object)。 所有能使用的R函数都被包含在一个库(library) 中,该库存放在磁盘 的R HOME/library 目录下(R HOME 是最初安装R的地址)。这个目录下含有具有各种功能的包(packages),各个包也是按照目录的方式组织起来的。其中名为base的包可以算是R的核心,因为它内嵌了R语言中所有像数据读写与操作这些最基本的函数。在上述目录中的每个包内,都有一个子目录R,这个目录里又都含有一个与此包同名的文件(例如在包base中,有这样一个文件R HOME/library/base/R/base)。该文件正是存放所有函数的地方。

2020-04-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除