自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(211)
  • 资源 (1)
  • 收藏
  • 关注

原创 sam格式总结

256: 代表这个序列不是主要的比对,一条序列可能比对到参考序列的多个位置,只有一个是首要的比对位置,其他都是次要的。8: 代表这个序列的另一端序列没有比对到参考序列上,比如这条序列是R1,它对应的R2端序列没有比对到参考序列上。153 = 128+16+8+1(R2比对到负链接,R1没有匹配上)163 = 128+32+2+1(R2完全匹配,R1比对到负链)99 = 64+32+2+1 (R2比对到负链,R1完全匹配)32 :代表这个序列对应的另一端序列比对到参考序列的负链上。

2024-09-03 16:48:50 315

原创 似然比检验、wald 检验以及拉格朗日乘子检验

此三大检验是对模型好坏进行检验的常用方法。

2024-08-20 16:34:20 106

原创 为什么白昼最长的地方不是在太阳的直射点

太阳直射:赤道地区接收到太阳的直接垂直照射。因为赤道几乎是地球的中心线,太阳光线在这里的入射角度最小,能量密度最大,导致该地区接收到的日射量最高,从而使地表温度升高。地球自转效应:地球自转会导致赤道地区在一天内更长时间地处于太阳直射下,这使得地表有更多时间吸收太阳能量,进一步增加温度。大气对流:赤道地区的高温促进了大气的上升运动,形成了强烈的对流。这种对流不仅加强了热量的传递和分布,也影响了该地区的气候模式。

2024-06-15 21:32:51 291

原创 TCGA masked cnv含义

Masked copy number segments are generated using the same method except that a filtering step is performed that removes the Y chromosome and probe sets that were previously indicated to be associated with frequent germline copy-number variation.

2024-06-04 14:24:59 105

原创 使用install.package()和从命令行R CMD INSTALL安装R包的区别

A major difference between installing R packages using the R package installer at the R command line and shell command line is that package dependencies must be resolved manually at the shell command line.从使用的角度讲没区别

2024-06-04 09:43:23 152

原创 HISAT2双端read比对结果解释

(51100+57804+33582+277922+1144382)/(4165142)=0.4803

2024-02-26 20:12:24 646

原创 R 设置错误信息的长度

最近运行代码报错,查看错误信息时发现错误信息只显示了一半,原因是错误信息太长了,默认的设置显示不完(默认设置有点傻),搜索了半天在解决了,解决方法是用下面的命令去设置输出错误信息的长度:options(warning.length = 5000)

2023-10-24 21:18:04 141

原创 PCA和LDA

PCA is an unsupervised method that tries to find the directions of maximum variance in the data. It projects the data onto a new set of orthogonal axes, called principal components, that capture as much of the variability as possible. The first principal c

2023-09-05 15:46:16 287

原创 MDS,PCoA和PCA

Non-metric的MDS就叫做Principal Coordinates Analysis(PCoA),它跟PCA的区别在于用距离矩阵代替了PCA中的观察值。MDS分为两种类型:1,metric MDS,它使用距离矩阵进行计算;2,Non-metric MDS,用距离的排序构造矩阵。MDS: A distance matrix.(这里的距离包含各种各样的距离,或者距离的rank)

2023-09-05 11:42:19 376

原创 平均值和方差的点估计、区间估计

0,预备知识0.1,中心极限定理0.2,均值的标准误差0.3,卡方分布1,总体均值的无偏估计量2.1,当总体方差已知时对样本均值的描述(Z统计量)2.2,当总体方差未知时对样本均值的描述(t统计量)3.1,当总体方差已知,或者大样本量(n>200,总体方差未知)时,总体均值的区间估计。(在实际操作过程中会对样本进行抽样,每次取n个数出来,算平均值,这些平均值的期望就是对总体方差的无偏估计)3.2,当总体方差未知,总体均值的区间估计。4.1,总体方差的点估计(对任何分布

2023-08-29 09:59:30 1105 2

原创 为什么样本方差(sample variance)的分母是 n-1?

https://www.zhihu.com/question/20099757

2023-08-28 20:24:26 93

转载 RR、OR和HR区别

1,在医学统计学中,有三个关于比值的概念,分别为相对危险度(relative risk,RR,也称 risk ratio)、风险比(hazard ratio,HR)和优势比(odds ratio,OR)。很多同行一看见这三个概念就容易混绕。在此,笔者拟谈谈如何正确理解这三个概念的区别和联系。我们以病因学研究为例,先谈谈 OR 与 RR 的区别,因为这两个指标均可以从四格表中衍生出来。我们先来看看两个关于吸烟与肺癌的例子:RR(Relative Risk) - 相对危险度RR(Relative Risk

2023-08-20 15:52:24 418

原创 拟牛顿法quasi-Newton method

拟牛顿法Quasi-Newton methods是一种以牛顿法为基础设计的,求解非线性方程组或连续的最优化问题函数的零点或极大、极小值的算法。当牛顿法中所要求计算的雅可比矩阵或Hessian矩阵难以甚至无法计算时,拟牛顿法便可派上用场。

2023-08-08 16:04:32 86

原创 医疗器械编号查看

2023-07-04 09:50:04 269

原创 python3中if和else只能执行一个

【代码】python3中if和else只能执行一个。

2023-07-02 21:49:23 557

原创 beta distribution (beta分布)

https://homepage.divms.uiowa.edu/~mbognar/applets/beta.html

2023-07-01 23:47:47 302

原创 GSEA p-value和FDR计算方法

Estimating Significance. We assess the significance of an observed ES by comparing it with the set of scores ESNULL computed with randomly assigned phenotypes.Multiple Hypothesis Testing.Create a histogram of all NES(S, π) over all S and π. Use this null d

2023-06-29 15:56:07 638

原创 bash常用命令

Reference。

2023-06-29 08:30:12 60

原创 最大似然估计(Maximum Likelihood Estimation)

如果我们拿到一组值,不知道这组值对应的分布的参数,甚至都不知道这组值服从何种分布,我们推测可能分布的参数,我们给这个参数取不同的值,计算这些点发生概率的乘积,这就是似然。我们要找到概率最大时(即最大似然)对应的参数值,此时的参数值最有可能是真实分布的参数值。在某个分布的参数已知的情况下,计算某个值(或一组值、一个区间)出现的概率,概率是用原因推测结果,给定某个分布,理论情况下事件发生的频率跟我们计算出来的概率是一样的。

2023-06-28 00:37:31 366

原创 batch normalization与layer normalization

batch normalization常用在CNN上,而用layer normalization用在RNN和transformer上更合适,因为序列数据的长度不一,导致有些特征在部分样本中没有,给基于特征的标准化带来了麻烦。

2023-05-05 20:37:36 315 1

原创 多层感知机(Multilayer Perceptron, MLP)

【代码】多层感知机(Multilayer Perceptron, MLP)

2023-05-02 18:56:58 328

原创 感知机介绍

Note:<>在数学中通常指求期望的意思。假设我们用感知机区分cat和dog,使用下面三个特征:x1: color of hair;cat 用+1表示,dog用-1表示(对应到σx\sigma(x)σx函数的话,当函数结果为1时,判定为cat,为0时,判定为dog)。三个特征对应有三个权重w1, w2, w3。

2023-05-02 12:43:45 656

原创 bismark和bsmap比对原理

任意取一条比对后的reads,经过PCR后得到BSW,BSWR,BSC,BSCR四种reads,因为BSW和BSWR完全互补,BSC和BSCR完全互补,我们只需要取BSW和BSCR去查看就好了(如果BSW能比对上,那么BSWR一定也可以比对上)。1,watson链和crick链都用来做参考基因组,这样只要容许有T比对到C或者T上,就可以实现所有的比对;2,只用watson链做参考基因组,既需要容许有T比对到C或者T上,又需要容许A比对到A或G上。

2023-04-26 11:08:33 1136

原创 为什么DNA选用T而RNA选用U

1,Thymine相比于Uracil,对光化学有更强的抵抗性,能保证DNA的稳定性;2,Uracil相比于Thymine,更不容易被氧化,Thymine在细胞核中接触不到氧,所以氧化作用对其伤害不大;Uracil在细胞核外,对氧化作用的抵抗更强。

2023-04-24 17:11:51 534

原创 chi-square, McNemar‘ exact, Mantel-Haenszel, Kappa, Fisher exact test区别

1,chi-square test2, McNemar’ exact test3,Mantel-Haenszel test4,Kappa test5,Fisher exact test

2023-04-03 19:06:00 1518

原创 MAC PS更换登记照背景颜色

1,导入图片,用快速选择工具或魔棒选择人物头像,然后反向选择,按delete键就可以将背景颜色去掉;2,将图片复制为一个新的图层;3,再新建一个图层,用油漆桶工具将该图层变成任意你想要的颜色;4,将步骤2的图层拖到步骤3的图层上,就基本完成了。5,用橡皮擦工具将图片不完美的地方擦除即可。...

2022-05-23 17:40:07 3595 1

转载 super(XXX, self).__init__()在类中的作用

这是对继承自父类的属性进行初始化,而且是用父类的初始化方法来初始化继承的属性.也就是说,子类继承了父类的所有属性和方法,class EfficientDetBackbone(nn.Module):def init(self, num_classes=80, compound_coef=0, load_weights=False, **kwargs):super(EfficientDetBackbone, self).init()比如上例中,先找到 EfficientDetBackbone的父类nn.

2021-12-11 09:26:44 724

原创 常用序列比对算法总结

常用比对算法总结

2021-12-07 09:49:57 5145

原创 MAC 合并多个jpg文件为PDF

1,将所有图片选中,用预览打开,这样所有的图片出现在同一个文件中;2,command + P ,就会出来打印界面;3,在打印界面将文件另存为PDF。

2021-10-12 10:49:22 1776

原创 R和R squared用法总结

1,RRRThe correlation coefficient, usually denoted by the symbol r, is a measure of the linear relationship between two variables, such as x and y. r is also called the product moment correlation coefficient, or Pearson’s correlation coefficient.2,R2R^2R2

2021-06-22 15:50:46 1353

原创 MAC电脑word关联endnote

1,关闭word,打开endnote2,点击customizer3,根据提示完成下面这些操作

2021-04-28 20:40:11 13006 3

原创 人类所有rRNA列表

|

2021-03-21 16:04:12 668

原创 WGCNA分析之一-------理清概念

1,定义WGCNA即Weighted gene co-expression network analysis,加权基因共表达网络分析。2,有什么用2.1 将共表达的一组基因放在一起研究,可以得到比单个上调、下调基因更多的信息;2.2 鉴定"hub gene"(即与其它基因关系密切的基因、处于中心位置的基因、有重要作用的基因);2.3 探究基因模块(一组共表达的基因)与性状(疾病状态)之间的关系。3,输入数据的格式RPKM,FPKM和标准化之后的counts值等等都可以。但必须是以样本为单位进行

2021-01-07 22:47:46 1767

原创 不同转录组测序方法总结

1,有参与无参的区别有参和无参指的是有无参考基因组,对于没有参考基因组的物种,采用如下的处理方法:无参考基因组的真核生物转录组项目使用Illumina测序平台,获得测序原始数据后,首先进行质控拼接,并进一步对拼接所得转录本进行功能注释、SNP、SSR标记开发等分析。在此基础上,也可以进行多个样本的差异基因表达分析和差异基因功能富集分析等,用于发现功能基因,为下一步研究提供方向。2,globin去除与否珠蛋白(globin)是一类能够通过铁卟啉环可逆性结合氧的呼吸性蛋白质,广泛存在于细菌、真菌、植物.

2021-01-03 00:26:17 12243

转载 Installation path not writeable in R

当你安装R包时,出现了这个错误,Installation path not writeable, unable to update packages。很有可能是因为你R包安装的位置存在两个。可以使用installed.packages()[, c(“Package”, “LibPath”)]来查看所有的R包位置。同时使用Sys.chmod(“file”,‘777’)其中file是你R包安装的位置,然后这个包就能正常使用了Referencehttps://zhuanlan.zhihu.com/p

2020-11-18 15:33:15 7835 3

原创 pycharm 改回插入模式

问题描述:用pycharm写代码时,发现突然变成了替换模式,即在代码块中间修改时,每敲上去一个字符,就会覆盖掉后面的字符。解决方案:按一下insert键就好了。来回按insert键就会在插入和替换模式之间切换。...

2020-11-17 22:03:11 10221 1

原创 test

# Naive Bayesfrom sklearn.naive_bayes import GaussianNBgnb = GaussianNB()gnb.fit(X_t, Y)gnb.score(GSE6575_X_t, GSE6575_Y)# SVMfrom sklearn import svmsvmcl = svm.SVC()svmcl.fit(X_t, Y)svmcl.score(GSE6575_X_t, GSE6575_Y)# Decision Treefrom sklea

2020-10-31 12:11:06 118

转载 张量、矩阵和向量的区别

Referencehttp://www.360doc.com/content/20/0113/21/32196507_886034162.shtml

2020-09-11 15:46:34 652

原创 HDF格式

1,什么是HDF格式HDF是Hierarchical Data Format的缩写,它是用来储存和管理大规模数据的格式。包括HDF4和HDF5两种,HDF4已经过时了,但The HDF Group任然在维护它,它的不足是最大支持的文件大小为2G,HDF5是HDF4的升级版,克服了很多HDF4的缺点。2,HDF5相比于HDF4,HDF5简化了文件结构,只包含两种主要的对象类型:1),数据集,它是同质类型的多维数组;2),群组,它是持有数据集和其他群组的容器结构。3,HDF5的组织结构1),为了

2020-08-16 21:14:38 4353

原创 R factor to numeric

在R中要将factor型数据转化为numeric型数据,必须先将factor转化为character型,不能跨越。> x <- factor(6)> class(x)[1] "factor"> y <- as.numeric(x)> y[1] 1> z <- as.numeric(as.character(x))> z[1] 6...

2020-08-12 17:33:47 372

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除