- 博客(219)
- 资源 (1)
- 收藏
- 关注
原创 gzip不同压缩等级的区别
Gzip supports different compression levels, which range from 1 (fastest, least compression) to 9 (slowest, most compression). Here’s what each level generally means:Level 1 (Fastest): This is the fastest compression level, which results in the least amount
2024-11-02 10:29:50 199
原创 孟德尔随机化
IVW的应用前提是所有的SNP均为有效的工具变量且相互之间完全独立。②加权中位数估计(Weighted median,WM):WM为所有的个体SNP效应值按照权重排序后得到的分布函数的中位数。当至少50%的信息来自于有效的工具变量时,WM可得到稳健的估计值。该基因型与年龄、性别等混杂因素无关。②估计工具变量对结局的作用,工具变量对结局的作用也是从所有的研究中估计出来的整体效应,这样可以拒绝单个研究的偏倚。①找工具变量,从其他研究中挑选特定基因作为工具变量,从基因库中挑选需要的和暴露相关的基因变量SNPs。
2024-10-07 16:42:54 358
原创 两个beta函数乘积积分的含义
这个积分实际上是在计算所有导致 ( X ) 取特定值 ( x ) 的 ( V ) 和 ( U ) 的组合的概率。由于 ( V ) 和 ( U ) 是独立的,我们可以分别对它们的概率密度函数进行积分。总之,两个Beta分布的卷积积分是一个强大的工具,它允许我们结合两个概率分布的信息,以预测它们的和或总和的分布。其中 ( B(\alpha, \beta) ) 是Beta函数,用于归一化概率密度函数,确保积分等于1。这个积分表示了所有可能的 ( V ) 和 ( U ) 的组合,它们的和等于 ( x ) 的概率。
2024-09-30 15:15:28 422
原创 sam格式总结
256: 代表这个序列不是主要的比对,一条序列可能比对到参考序列的多个位置,只有一个是首要的比对位置,其他都是次要的。8: 代表这个序列的另一端序列没有比对到参考序列上,比如这条序列是R1,它对应的R2端序列没有比对到参考序列上。153 = 128+16+8+1(R2比对到负链接,R1没有匹配上)163 = 128+32+2+1(R2完全匹配,R1比对到负链)99 = 64+32+2+1 (R2比对到负链,R1完全匹配)32 :代表这个序列对应的另一端序列比对到参考序列的负链上。
2024-09-03 16:48:50 419
原创 为什么白昼最长的地方不是在太阳的直射点
太阳直射:赤道地区接收到太阳的直接垂直照射。因为赤道几乎是地球的中心线,太阳光线在这里的入射角度最小,能量密度最大,导致该地区接收到的日射量最高,从而使地表温度升高。地球自转效应:地球自转会导致赤道地区在一天内更长时间地处于太阳直射下,这使得地表有更多时间吸收太阳能量,进一步增加温度。大气对流:赤道地区的高温促进了大气的上升运动,形成了强烈的对流。这种对流不仅加强了热量的传递和分布,也影响了该地区的气候模式。
2024-06-15 21:32:51 310
原创 TCGA masked cnv含义
Masked copy number segments are generated using the same method except that a filtering step is performed that removes the Y chromosome and probe sets that were previously indicated to be associated with frequent germline copy-number variation.
2024-06-04 14:24:59 111
原创 使用install.package()和从命令行R CMD INSTALL安装R包的区别
A major difference between installing R packages using the R package installer at the R command line and shell command line is that package dependencies must be resolved manually at the shell command line.从使用的角度讲没区别
2024-06-04 09:43:23 164
原创 R 设置错误信息的长度
最近运行代码报错,查看错误信息时发现错误信息只显示了一半,原因是错误信息太长了,默认的设置显示不完(默认设置有点傻),搜索了半天在解决了,解决方法是用下面的命令去设置输出错误信息的长度:options(warning.length = 5000)
2023-10-24 21:18:04 146
原创 PCA和LDA
PCA is an unsupervised method that tries to find the directions of maximum variance in the data. It projects the data onto a new set of orthogonal axes, called principal components, that capture as much of the variability as possible. The first principal c
2023-09-05 15:46:16 299
原创 MDS,PCoA和PCA
Non-metric的MDS就叫做Principal Coordinates Analysis(PCoA),它跟PCA的区别在于用距离矩阵代替了PCA中的观察值。MDS分为两种类型:1,metric MDS,它使用距离矩阵进行计算;2,Non-metric MDS,用距离的排序构造矩阵。MDS: A distance matrix.(这里的距离包含各种各样的距离,或者距离的rank)
2023-09-05 11:42:19 393
原创 平均值和方差的点估计、区间估计
0,预备知识0.1,中心极限定理0.2,均值的标准误差0.3,卡方分布1,总体均值的无偏估计量2.1,当总体方差已知时对样本均值的描述(Z统计量)2.2,当总体方差未知时对样本均值的描述(t统计量)3.1,当总体方差已知,或者大样本量(n>200,总体方差未知)时,总体均值的区间估计。(在实际操作过程中会对样本进行抽样,每次取n个数出来,算平均值,这些平均值的期望就是对总体方差的无偏估计)3.2,当总体方差未知,总体均值的区间估计。4.1,总体方差的点估计(对任何分布
2023-08-29 09:59:30 1240 2
原创 为什么样本方差(sample variance)的分母是 n-1?
https://www.zhihu.com/question/20099757
2023-08-28 20:24:26 104
转载 RR、OR和HR区别
1,在医学统计学中,有三个关于比值的概念,分别为相对危险度(relative risk,RR,也称 risk ratio)、风险比(hazard ratio,HR)和优势比(odds ratio,OR)。很多同行一看见这三个概念就容易混绕。在此,笔者拟谈谈如何正确理解这三个概念的区别和联系。我们以病因学研究为例,先谈谈 OR 与 RR 的区别,因为这两个指标均可以从四格表中衍生出来。我们先来看看两个关于吸烟与肺癌的例子:RR(Relative Risk) - 相对危险度RR(Relative Risk
2023-08-20 15:52:24 596
原创 拟牛顿法quasi-Newton method
拟牛顿法Quasi-Newton methods是一种以牛顿法为基础设计的,求解非线性方程组或连续的最优化问题函数的零点或极大、极小值的算法。当牛顿法中所要求计算的雅可比矩阵或Hessian矩阵难以甚至无法计算时,拟牛顿法便可派上用场。
2023-08-08 16:04:32 111
原创 beta distribution (beta分布)
https://homepage.divms.uiowa.edu/~mbognar/applets/beta.html
2023-07-01 23:47:47 327
原创 GSEA p-value和FDR计算方法
Estimating Significance. We assess the significance of an observed ES by comparing it with the set of scores ESNULL computed with randomly assigned phenotypes.Multiple Hypothesis Testing.Create a histogram of all NES(S, π) over all S and π. Use this null d
2023-06-29 15:56:07 676
原创 最大似然估计(Maximum Likelihood Estimation)
如果我们拿到一组值,不知道这组值对应的分布的参数,甚至都不知道这组值服从何种分布,我们推测可能分布的参数,我们给这个参数取不同的值,计算这些点发生概率的乘积,这就是似然。我们要找到概率最大时(即最大似然)对应的参数值,此时的参数值最有可能是真实分布的参数值。在某个分布的参数已知的情况下,计算某个值(或一组值、一个区间)出现的概率,概率是用原因推测结果,给定某个分布,理论情况下事件发生的频率跟我们计算出来的概率是一样的。
2023-06-28 00:37:31 391
原创 batch normalization与layer normalization
batch normalization常用在CNN上,而用layer normalization用在RNN和transformer上更合适,因为序列数据的长度不一,导致有些特征在部分样本中没有,给基于特征的标准化带来了麻烦。
2023-05-05 20:37:36 331 1
原创 感知机介绍
Note:<>在数学中通常指求期望的意思。假设我们用感知机区分cat和dog,使用下面三个特征:x1: color of hair;cat 用+1表示,dog用-1表示(对应到σx\sigma(x)σx函数的话,当函数结果为1时,判定为cat,为0时,判定为dog)。三个特征对应有三个权重w1, w2, w3。
2023-05-02 12:43:45 666
原创 bismark和bsmap比对原理
任意取一条比对后的reads,经过PCR后得到BSW,BSWR,BSC,BSCR四种reads,因为BSW和BSWR完全互补,BSC和BSCR完全互补,我们只需要取BSW和BSCR去查看就好了(如果BSW能比对上,那么BSWR一定也可以比对上)。1,watson链和crick链都用来做参考基因组,这样只要容许有T比对到C或者T上,就可以实现所有的比对;2,只用watson链做参考基因组,既需要容许有T比对到C或者T上,又需要容许A比对到A或G上。
2023-04-26 11:08:33 1165
原创 为什么DNA选用T而RNA选用U
1,Thymine相比于Uracil,对光化学有更强的抵抗性,能保证DNA的稳定性;2,Uracil相比于Thymine,更不容易被氧化,Thymine在细胞核中接触不到氧,所以氧化作用对其伤害不大;Uracil在细胞核外,对氧化作用的抵抗更强。
2023-04-24 17:11:51 610
原创 chi-square, McNemar‘ exact, Mantel-Haenszel, Kappa, Fisher exact test区别
1,chi-square test2, McNemar’ exact test3,Mantel-Haenszel test4,Kappa test5,Fisher exact test
2023-04-03 19:06:00 1655
原创 MAC PS更换登记照背景颜色
1,导入图片,用快速选择工具或魔棒选择人物头像,然后反向选择,按delete键就可以将背景颜色去掉;2,将图片复制为一个新的图层;3,再新建一个图层,用油漆桶工具将该图层变成任意你想要的颜色;4,将步骤2的图层拖到步骤3的图层上,就基本完成了。5,用橡皮擦工具将图片不完美的地方擦除即可。...
2022-05-23 17:40:07 3640 1
转载 super(XXX, self).__init__()在类中的作用
这是对继承自父类的属性进行初始化,而且是用父类的初始化方法来初始化继承的属性.也就是说,子类继承了父类的所有属性和方法,class EfficientDetBackbone(nn.Module):def init(self, num_classes=80, compound_coef=0, load_weights=False, **kwargs):super(EfficientDetBackbone, self).init()比如上例中,先找到 EfficientDetBackbone的父类nn.
2021-12-11 09:26:44 734
原创 MAC 合并多个jpg文件为PDF
1,将所有图片选中,用预览打开,这样所有的图片出现在同一个文件中;2,command + P ,就会出来打印界面;3,在打印界面将文件另存为PDF。
2021-10-12 10:49:22 1836
原创 R和R squared用法总结
1,RRRThe correlation coefficient, usually denoted by the symbol r, is a measure of the linear relationship between two variables, such as x and y. r is also called the product moment correlation coefficient, or Pearson’s correlation coefficient.2,R2R^2R2
2021-06-22 15:50:46 1412
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人