- 博客(41)
- 资源 (3)
- 收藏
- 关注
原创 R统计建模
文章目录@[toc]第 1 章 概率统计常识1.1 随机事件与概率1.1.1 随机事件1.1.1.1 随机事件1.1.1.2 随机事件间的关系1.1.1.3 随机事件的运算律1.1.2 概率1.1.2.2 概率的性质1.1.2.3 古典概型1.1.2.4 几何概型1.1.2.5 条件概率1.1.2.6 乘法公式、全概率公式、Bayes公式1.1.2.7 独立事件1.1.2.8 n重Bernoulli 试验及其概率计算1.2 随机变量及其分布1.2.1 随机变量的定义1.2.2 随机变量的分布函数1.2.3
2021-03-28 15:04:20 627
原创 AutomateTheBoringStuffWithPython
Python编程快速上手—让繁琐工作自动化 Automate The Boring Stuff With Python第一部分 Python编程基础第 1 章 Python 基础1.1 在交互式环境中输入表达式操作符**%///*-+操作指数取模/取余数整除/商数取整除乘减加1.2 整型、浮点型和字符串数据类型int float char1.3 字符串连接和复制连接:+>>>'Hello' + ',' + 'World'
2021-03-04 22:14:18 2544 1
原创 IterativeTransferLearningWithNeuralNetworkForClusteringAndCellTypeClassificationInscRNA-seqAnalysis
Iterative Transfer Learning with Neural Network for Clustering and CellType Classification in Single-cell RNA-seq Analysis ——20210301Background 单细胞RNA测序(scRNA-seq)分析的一个重要步骤是通过聚类来确定细胞群或类型。细胞类型的知识可以揭示细胞在组织、发育阶段和生物体中的异质性,并提高我们对细胞和基因功能在健康和疾病中的理解。但其高维性和遗传的
2021-03-03 00:48:03 869
原创 R 入门级 之 《R简介 && R和R Studio安装》 --200411
简介RR是一个有着统计分析功能及强大作图功能的软件系统,是由Ross Ihaka和Robert Gentleman1共同创立。R语言可以看作是由AT&T贝尔实验室所创的S语言发展出的一种方言。R是在GNU协议General Public Licence4下免费发行的,它的开发及维护 现在则由R开发核心小组R Development Core Team具体负责。R的安装文件有多种形式...
2020-04-11 15:30:17 640
原创 CSDN如何修改用户名
用户名当你用QQ或微信注册CSDN成功后,用户名便由系统自动生成。QQ注册的以"qq_"开头,微信注册以"wechat_"开头例如**https://blog.csdn.net/qq_42937176**用户名是注册时系统自动生成,具有唯一性和不可修改性so你就安心接受吧!!!不过昵称是可修改,同时具有唯一性的初始昵称为用户名,可以人为修改。但已有的用户昵称不能为己所用,所以好好给...
2019-12-09 20:52:01 428
原创 chr Palindromes
字符串处理var = ${}cat config | while read iddo sed -i "s/ /,/g" outM.txt ##字符替换 cat $id.txt | while read jd do echo ${var:${jd%,*}:${jd#*,}} >> chr$id.txt donedone
2021-01-18 21:55:41 130
原创 GATK4 简易用法 --20201213
ContentsJava command basicsUsing the gatk wrapper script (recommended)Adding GATK argumentsAdding Java argumentsAdding Spark argumentsExamples of real commands1. Java command basicsGATK follows the basic Java command-line syntax:java -jar progra
2020-12-13 21:19:05 1080
原创 2020-12-09
qsub任务提交系统qsub -a [YY][MM][DD][hh][mm][ss] run.s#参数解析#指定节点数目 ppn指每个节点运行的cpu数量(4个小节点,每个48个CPU)#PBS -l nodes=1:ppn=16#指定合并到标准输出文件中#PBS -j oe#设置程序运行的最大时间192小时#PBS -l walltime=192:00:00#指定qsub的所有环境变量都传递到批处理作业中#PBS -V#输出文件#PBS -o /public/home/ta
2020-12-09 23:11:26 270
原创 10分钟让你了解R的基本数据操作:R 入门级 之 《R的管理绘图》 -- 200509
title: “R的管理绘图”author: “HHTING”date: “2020/5/9”output:word_document: defaulthtml_document:df_print: pagedpdf_document:keep_tex: yeslatex_engine: xelatexheader-includes: \usepackage{ctex}1. 打开多个绘图设备?device # view available drawing devicex11().
2020-05-10 19:55:39 360
原创 一个表格带你了解R的绘图函数
高级作图函数(high-level plotting functions)function功能plot(x)以x的元素值为纵坐标、以序号为横坐标绘图plot(x, y)x(在x-轴上)与y(在y-轴上)的二元作图sunflowerplot(x,y)同上 但是以相似坐标的点作为花朵,其花瓣数目为点的个数pie(x)饼图boxplot(x)盒形图(“box-and-whiskers”)stripchart(x)把x的值画在一条线段上,样本量较小时可
2020-05-09 21:48:04 519
原创 <Question4> of R & Biostatistics
Question大量检测已知正常人血浆载脂蛋白E总体平均水平为4.15mmol/L,总体分布近似于正态分布。某医师经抽样测得16例陈旧性心机梗死患者的血浆载脂蛋白E平均浓度为4.98mmol/L,标准差为2.78mmol/L。据此能否认为陈旧性心肌梗死患者的血浆载脂蛋白E平均浓度与正常人的平均浓度不一致?并给出置信区间(显著性水平)为研究某铁剂治疗和饮食治疗对营养性缺铁性贫血的效果,将...
2020-04-23 12:06:14 1430
原创 10分钟让你了解R的基本数据操作:R 入门级 之 《R的数据操作》 -- 200418
title: “R的数据操作”author: “HHTING”output:html_document:df_print: pagedword_document: defaultpdf_document:keep_tex: yeslatex_engine: xelatexheader-includes: \usepackage{ctex}R的数据操作对象R通过刻画对象的名...
2020-04-18 19:24:15 1647
原创 一张表格教会了我统计学常用的数据处理函数
函数功能sum(x)对x中的元素求和prod(x)对x中的元素求连乘积max(x)x中元素的最大值min(x)x中元素的最小值which.max(x)返回x中最大元素的下标which.min(x)返回x中最小元素的下标range(x)与c(min(x), max(x))作用相同length(x)x中元素的数目mea...
2020-04-17 22:26:32 444
原创 R 入门级 之 《对象类型的转换》 --200417
转换目标函数规则数值型as.numericFALSE → 0;TRUE → 1;“1”, “2”, . . . → 1, 2, . . .; “A”, . . . → NA逻辑型as.logical0 → FALSE;其它数字 → TRUE; “FALSE”, “F” → FALSE; “TRUE”, “T” → TRUE; 其它字符 → NA字符型as...
2020-04-17 11:13:01 183
原创 ts() of R
ts(data = NA, start = 1, end = numeric(), frequency = 1, deltat = 1, ts.eps = getOption("ts.eps"), class = , names = )ArgumentsFunctiondata一个向量或者矩阵start第一个观察值的时间,为一个数字或者是一个由两个整 数构成的...
2020-04-16 22:37:36 320
原创 R 你所不知道的那些随机序列生成函数,一个表格全给你
分布名称函数Gaussian(normal) rnorm(n, mean=0, sd=1)exponentialrexp(n, rate=1)gammargamma(n, shape, scale=1)Poissonrpois(n, lambda)Weibullrweibull(n, shape, scale=1)Cauchyrcauc...
2020-04-15 21:56:25 316
原创 write.table() | write.csv() | write.csv2() of R
write.table(x, file = “”, append = FALSE, quote = TRUE, sep = " ",eol = “\n”, na = “NA”, dec = “.”, row.names = TRUE,col.names = TRUE, qmethod = c(“escape”, “double”),fileEncoding = “”)write.csv(…...
2020-04-15 16:10:02 8922
原创 scan() of R
scan()data <- scan("data.csv", what = list(" ", 0, 0))scan()相较于read.table()可以指定变量的类型。当what被省略,scan()将创建一个数值型向量。如果读取的数据类型与缺省类型或指定类型不符,则返回错误信息。scan(file = “”, what = double(), nmax = -1, n = -1, ...
2020-04-15 15:47:21 417
原创 read.table() | read.csv() | read.csv2() | read.delim() | read.delim2() of R
read.table(file, header = FALSE, sep = “”, quote = “”’",dec = “.”, numerals = c(“allow.loss”, “warn.loss”, “no.loss”),row.names, col.names, as.is = !stringsAsFactors,na.strings = “NA”, colClasses =...
2020-04-14 21:28:53 1456
原创 R 入门级 之 《R的基本原理与概念》 -- 200412
Basic Principles and Concepts of R一、基本原理R是一种解释型语言,输入的命令可以直接被执行,不同于C等编译语言需要构成完整的程序才能运行。R的语法非常简单和直观。合法的R函数总是带有圆括号的形式,即使括号内没有内容(如,ls())。所有函数后都接有圆括号以区别于对象(object)。所有能使用的R函数都被包含在一个库(library) 中,该库存放在磁盘 ...
2020-04-12 15:24:47 528
原创 <Question3> of R & Biostatistics
第一题要求:在R环境中完成下述操作,并写出具体R代码。查看R当前工作目录,设置R工作目录为数据所在目录并查看该目录下的文件;将数据homework3_data.csv导入到R中;查看行列数及前5行数据以及数据类型;对数据中的测量值进行描述统计并绘制箱线图;下载并安装R包pwr,查看帮助文档了解用法。第二题R language application. Please use R ...
2020-04-11 16:50:55 554 1
原创 test
title: “test”output:pdf_document:latex_engine: xelatexword_document: defaulthtml_document:df_print: pagedknitr::opts_chunk$set(echo = TRUE)R MarkdownThis is an R Markdown document. Markdown...
2020-04-11 16:39:03 104
原创 生物统计学 之 简介
Key words:总体:研究的总对象个体:总体中的基本组成单元样本:从总体中抽出的若干个体的集合变量:相同性质的样本间的差异性表现或特征的数据量参量:参数,对一个总体特征的度量统计数:从样本计算所得的数值,是总参的估计值准确性:统计数接近真知的程度精确性:实验中同一试验指标的重复性观测值彼此接近的程度大小误差:实验中因不可控元素所导致的观测值与真值的偏离度错误:实验中人为因素...
2020-03-04 15:32:14 399
原创 生物信息学 之 序列比对
针对DNA、RNA以及蛋白质序列,我们需要对其进行序列相似性搜索,来研究分析不同序列在结构和功能上相同与差异相似性【similarity】/一致性【identity】 <==> 双序列比对( Pairwise sequence Alignment )同源性【homology】 <==> 多序列比对 (Multiple Sequence Alignmen...
2020-02-27 20:46:50 3270
原创 Python -- keywords
Keywordspython3.7共有33个关键词,分别是False True None and as assert break class continue def del elif else except finally for from global if import in is lambda nonlocal not or pass raise return try white wi...
2020-01-16 21:17:50 283
原创 生物信息学 之 fastQ
fastQ格式是保存核酸序列及其测序质量得分信息、由单个ASCⅡ字符表示的文本格式,是当前保存高通量测序结果的事实标准。格式(四行/序列)第一行: @序列标识符及描述信息第二行: 序列信息第三行: +序列的标识及描述信息(可选)第四行:FASTQ文件中,一个序列通常由四行组成:第一行以@开头,之后为序列的标识符以及描述信息(与FASTA格式的描述行类似)第二行为序列信息第三行...
2020-01-10 19:36:44 289
原创 ALGORITHMS == 算法刷题网站推荐
LeetcodeEnglish:https://leetcode.com/Chinese:https://leetcode-cn.com/OpenjudgeWebsite:http://openjudge.cn/HDUWebsite:http://acm.hdu.edu.cn/USTCWebsite:http://acm.ustc.edu.cn/ustcoj/FZUWebsit...
2020-01-02 15:41:25 272
原创 最短路径 -- Dijkstra算法
定义一个有向图D=(V, A),对每一个弧a=(v<sub>i</sub>, v<sub>j</sub>),相应地有权ω(a)=ω<sub>ij</sub>,又给定D中的两个顶点v<sub>s</sub>,v<sub>t</sub>。设P是D中从v<sub>s<...
2019-12-30 12:43:55 242
原创 最短路径 -- Dijkstra算法
定义一个有向图D=(V, A),对每一个弧a=(vi, vj),相应地有权ω(a)=ωij,又给定D中的两个顶点vs,vt。设P是D中从vs到vt的一条路径,定义路P的权是P中所有弧的权之和,记为ω§。最短路径问题就是要在所有从vs到vt的路中,求一条权最小的路,即求一条从vs到vt的路P0,使ω(P0)=min ω(P)在Dijkstra算法中,用P(v),T(v)分别表示点v的P标号和T标号...
2019-12-21 21:42:18 740
原创 运筹学 -- 简介
1. 线性规划与单纯形法2. 对偶理论和灵敏度分析3. 运输问题4. 线性目标规划5. 整数线性规划6. 动态规划7. 图与网络分析8. 排队论9. 存储论10. 对策论11. 决策论...
2019-12-16 11:03:08 412
原创 Tensorflow2.0.0 之 tf.placeholder
Inserts a placeholder for a tensor that will be always fed.tf.compat.v1.placeholder( dtype, shape=None, name=None)Important: This tensor will produce an error if evaluated. Its value m...
2019-12-15 21:27:50 10435
原创 LCS(Needleman_Wunsch算法)算法 (python实现)
最长公共子序列(longest common subsequence,LCS)# -*- coding: utf-8 -*-"""Created on Tue Nov 26 19:55:48 2019@author: HTING"""import numpy as npdef LCS(str1,str2): s = 0 l = np.zeros([len(st...
2019-12-15 14:20:08 566
原创 Levenshtein Distance (LD) 算法
Levenshtein Distance(莱文斯坦距离/编辑距离/Edit Distance):指两个字串之间,由一个转成另一个所需的最少编辑操作次数,如果它们的距离越大,说明它们越是不同。算法过程:- ①if(str1.length==0) return str2.length;if(str2.length==0) return str1.length;- ②init (n+1...
2019-12-15 14:15:40 262
原创 Anaconda 入门级 《Conda 入门》 -- 191205
在Windows上,以下所有命令均在Anaconda Prompt窗口中键入。Conda管理检查是否安装成功:conda --version or conda -V结果:conda 4.7.10更新conda:conda update condaif have Proceed ([y]/n)? y==> y环境管理创建新环境:conda create --name env_n...
2019-12-05 22:08:30 166
原创 Anaconda 入门级《Conda Packages》 --191205
Conda PackagesConda包是压缩的tarball文件(.tar.bz2)或.conda文件组成system-level librariesPython or other modulesexecutable programs and other componentsmetadata under the info/directorya collection of file...
2019-12-05 21:28:37 261
原创 Anaconda 入门级《安装&&更新》 --191205
Anaconda 安装官网下载地址:https://www.anaconda.com/distribution/机械式安装即可从旧版本更新Windows:打开“开始”菜单,然后选择Anaconda Prompt。macOS或Linux:打开终端窗口。输入以下命令:conda update condaconda update anaconda=VersionNumberVer...
2019-12-05 20:28:17 222
原创 Tensorflow入门 -- 191204
Definition使用图 (graph) 来表示计算任务.在被称之为 会话 (Session) 的上下文 (context) 中执行图.使用 tensor 表示数据.通过 变量 (Variable) 维护状态.使用 feed 和 fetch 可以为任意的操作(arbitrary operation) 赋值或者从其中获取数据.SummarizeGraph:图中的节点为op(op...
2019-12-04 20:59:16 189
原创 Machine Learning in Action ---- kNN
-- coding: utf-8 --“”"Created on Thu Nov 14 19:29:08 2019@author: HTING“”"导入科学计算包模块import numpy as np导入运算符模块import operator====================================================================...
2019-11-15 17:37:59 99
<Question4> of R & Biostatistics
2020-04-23
02R的数据操作.html
2020-04-18
R基本原理和概念.html
2020-04-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人