自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 转录组上游分析-PRJEB51986

数据:PRJEB51986,15个样本,每个样本分成四份测序,有4个SRR数据,将每个样本fastq质控过滤后合并做比对定量。

2024-03-09 21:12:39 175

原创 单细胞上游-单样本示例

在这里碰到了问题,运行失败但是没有提示,猜测是cellranger单独安装在cellranger环境中,但是fastpc安装在另一个环境rna中,故运行失败,conad activate rna后运行成功。其中GSM代表“Sample”,是一个实验中的每个独立样本的编号,SRR代表“Run”,是测序数据集的运行编号,即代表测序数据的片段编号。的一个样本GSM5456907,包含两个运行数据:SRR15178151,SRR15178152。一个GSM代表一个独立的生物学样本,可以有对应的SAMN编号。

2024-03-07 19:54:55 703

原创 【R语言】如何不优雅地修改10X数据文件名(

通过lapply()用Read10X( file.path(dir,pro)依次读入样本文件,样本文件夹会存入Seurat对象构建orig.ident。4.需要的数据:创建需要的正则表达式(用于转移文件),文件路径/改名需替代字符(用于文件改名)以GSE188545数据集为例,下载的每个GSM数据有三个文件,但命名并不规范,2.将每个GSM对应的三个文件移入对应文件夹。matrix.mtx:基因表达量信息。3.为每个文件夹的文件修改为标准名字。features.tsv:基因信息。

2024-03-07 00:36:03 153

原创 如何绘制分组热图?

其中annotation_colors为列表,有几类分组就设置几组颜色,每类分组的颜色信息为一个带行名的向量,行名为该类分组的颜色。annotation_row行注释,是一个数据框,对于行分组,列名为mat的行名,有几类分组annotation_row就有几列。数据:row:symbol/col:sample。

2024-03-07 00:30:53 202

原创 只有基因名,能做什么富集分析?

对于我这样的小白来说,芯片和转录组数据最常见的做法的取表达矩阵做差异分析获得logFC,标识change后取DEG再进行富集分析,但是随着学习的深入,还会有相关基因或其他目标基因需要进行富集分析,此时即使只有感兴趣的基因名,也是能做ORA富集分析的。

2024-03-07 00:14:02 946

原创 如何进行GSEA分析?

当我们设置好分组实验最后获得各组对基因的表达矩阵时,我们通常希望得到不同分组中具有差异表达的基因。如果进行常规差异分析,通过log2fc筛选差异基因,就是将筛选差异基因的标准聚集在单个基因的差异表达上。而实际上每个基因的差异表达造成的表型差异有所不同,有些基因虽然差异表达较小,但会造成较大的生理功能变化。并且生理功能通常是由一系列基因调控的,所以只将筛选标准聚集在单个基因差异表达上,可能会错过真正具有生物学含义的基因群差异。

2024-03-07 00:04:39 2109

原创 【倒霉bug】24/02/26

安装monocle包老是报错缺失程辑包,其他的都能单独安装,就是"qlcMatrix"一直找不到,上网查了一下,发现有帖子给出了"qlcMatrix"安装官网,可以下载往期版本。单独安装'sparsesvd','docopt'后终于装上了"qlcMatrix",

2024-02-26 17:11:44 805 2

原创 【学习记录】列联表检验、Kruskal-Wallis检验、Friedman检验

那么,在每个数据集上将算法从好到坏排名,得到算法在各个数据上的名次,如果有多个算法在同一数据集上性能相同,则平分名次,数据集d3中算法b和c的准确率相同,所以将2、3名平分给b和c,所以b和c的名次都是(2+3)/2=2.5。在大样本情况下:ni>5时,N越大,kw在零假设下近似服从自由度为(k-1)的卡方分布,此时KW 统计量可利用卡方分布进行检验(其中Ri为每组的秩和,Ni为每组的样本个数)。卡方统计量构造的核心思想是:理论频率和实际频率差异的加权平均,这个差异越小,表示独立性越好;

2023-12-19 18:25:51 2252 1

原创 【学习记录】隐马尔可夫模型预测习题

马尔可夫链(Markov chain):和中具有(Markov property)且存在于离散的指数集(index set)和(state space)内的即某随机变化的事物的状态,每次状态只取决于上一次。转移概率矩阵:在一次变化过程中各状态间的转移概率矩阵。比如在DNA复制中某一位点的碱基变换过程中,已知A-A,C-C,T-T,G-G的概率(不变),A-T,C-G(或反)的概率(转换),A-G,A-C,T-C,T-G(或反)的概率(颠换),这些变化概率在一定条件下都是固定的。

2023-12-19 18:00:01 876 1

原创 【学习记录-github】克隆库/本地文件上传(详细)

在哪个位置输入克隆命令就克隆在哪个位置(建议不要放C盘,此处为示范)在gitbash中输入克隆代码。右键-Options,看到gitbash中复制粘贴功能快捷键和常用不同,且鼠标选中即复制。有时候会因为网络原因http代理出现443问题。找到文件夹,随便新加入一个文件test.txt。建库后克隆github库,地址带库名。解决办法:取消http代理或者用魔法。本地库文件上传至github。出现以上说明克隆成功。

2023-12-18 21:42:21 397 1

原创 【学习记录】期末数理统计结论

2023-06-25 06:48:56 96

原创 【学习记录-R】自编函数进行单因素方差分析(等容或不等容)

计算meanx,meanj,sse,ssb,dfe,dft,dfT(样本总均值,每个水平样本均值,误差项平方和,水平项平方和,误差项平方和的自由度,水平项平方和自由度)该图有错误,G/F的自由度写成了(dft,dfT),应该改为(dft,dfe),该图有错误,G/F的自由度写成了(dft,dfT),应该改为(dft,dfe)输入值为长数据,怎么将其分开计算每个水平样本均值:二重for循环。计算fx样本得来的观测值,(ssb/dft)/(sse/dfe)计算p值,pf(fx,df1,dft,dfe)

2023-06-04 16:11:21 175

原创 【倒霉bug】0604

在一个地方摔倒两次u(;

2023-06-04 13:45:01 61

原创 【学习记录-R】自编函数计算两正态总体均值差的区间估计

自编函数计算两正态总体均值差的区间估计

2023-05-07 17:42:59 237

原创 【学习记录-R】以U检验为例解释单/双侧检验

一个朴素的证伪过程

2023-05-01 03:01:24 149

原创 【学习记录-R】自编函数进行U检验和区间估计(单样本)

【学习记录-R】自编函数进行单双侧和检验区间估计(单样本)

2023-05-01 02:50:48 573

原创 【学习记录-R】牛顿迭代解非线性方程组及单个方程

R语言实现牛顿迭代解方程组及单个方程

2023-04-29 22:29:12 1038

原创 【学习记录】数理统计三大分布

三大统计量及定理证明

2023-04-26 00:57:06 2970

原创 【倒霉bug】0224

bug

2023-02-24 10:46:28 250 3

原创 【学习记录】Dijkstra算法求有向图最短路径

Dijkstra算法求有向图最短路径

2022-12-19 00:40:48 342

原创 【学习记录】动态规划求最大公共子序列

动态规划求最大公共子序列

2022-12-18 02:13:36 62

原创 【学习记录-C】对文件输入输出

【学习记录-C】对文件输入输出

2022-10-18 21:39:09 96

原创 【leetcode】二叉树专项(二)

1.剑指 Offer II 054. 所有大于等于节点的值之和由于给出的树为搜索二叉树,其节点的左子树仅包含键小于节点键的节点。 节点的右子树仅包含键大于节点键的节点。 左右子树也必须是二叉搜索树。故一路遍历到最右节点即为其最大节点,最大节点 返回上一节点 的左节点 即为第二大的节点故遍历顺序为:re(root->left); 操作结构体;re(root->right);操作结构体:声明一个公共变量int n;在main()中赋值为0;可在re()中直接...

2022-04-11 11:20:44 386

原创 【leetcode】二叉树专项(一)

剑指 Offer II 055. 二叉搜索树迭代器写不出来只能解释一下官方的代码了不可修改部分:typedef struct {} BSTIterator;BSTIterator* bSTIteratorCreate(struct TreeNode* root) {}int bSTIteratorNext(BSTIterator* obj) {}bool bSTIteratorHasNext(BSTIterator* obj) {}void bSTItera.

2022-04-07 17:12:53 542

原创 【LeetCode】2.两数相加-C

题目 2. 两数相加给你两个 非空 的链表,表示两个非负的整数。它们每位数字都是按照 逆序 的方式存储的,并且每个节点只能存储 一位 数字。请你将两个数相加,并以相同形式返回一个表示和的链表。你可以假设除了数字 0 之外,这两个数都不会以 0 开头。case1:输入:l1 = [2,4,3], l2 = [5,6,4]输出:[7,0,8]解释:342 + 465 = 807.case2:输入:l1 = [9,9,9,9,9,9,9], l2 = [9,9,9,9]输..

2022-03-26 20:49:55 699 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除