今天也是个妖精头子呀-CSDN博客

原创用limma包进行多组差异表达分析

写在前面：最近在使用limma包进行差异表达分析，参考了网上许多教程都觉得说的云里雾里，很不清楚。经过我自己一段时间非常痛苦的钻研，弄明白了，解决了我的实际需求。于是决定将我的分析经验写下来，分享给需要的人。首先加载前期预处理好的表达矩阵。（我的原始表达矩阵文件已附在文后，大家有需要可以下载实践）setwd("E://Rworkplace")data<-read.table...

2020-03-15 00:20:16 38820 34

原创日拱一卒 | awk的基本操作

现在开一个新的专题，每天花半个小时的时间整理今天所学的内容，虽然这样的实践会有些琐碎，但是希望通过这种方式，来巩固每天所学的知识，并告诉自己每天是有积累的。

2025-06-09 20:04:07 281

原创日拱一卒 | RNA-seq质控分析（2）

之前对这些软件的认识通常是云里雾里的。知道要用哪个软件，从网上抄一些代码，然后改改，就直接用了，对软件的原理不甚了解。此为急需改变的现状。这个过程也许需要重复重复的进行，但是我庆幸自己在实践的过程中了。

2025-05-13 17:48:28 608

原创日拱一卒 | RNA-seq数据质控（1）

拿到测序得到的RNA-seq的fastq数据之后，首先需要对测序数据进行质控，检查一下数据的质量。那么如何进行质控呢？之前我对这个的理解总是云里雾里的，现在想对此认真地理一理。也希望我的学习结果可以分享给更多的人。

2025-05-08 21:04:09 629

原创日拱一卒| 从公司拿到的测序数据如何快速批量下载？【华为云，obsutil】

适用群体：服务器用户。公司将数据传到了华为云那边，我们通过下述操作直接将测序数据下载到服务器上，规避window下载慢且经常断联的问题。

2025-04-28 21:30:08 462

原创怀念之前心无旁骛学习的时刻，重回博客？

继续通过写博客的方式，整理实验记录。

2025-04-28 21:01:01 113

原创 ModuleNotFoundError: No module named ‘_sysconfigdata_x86_64_conda_cos7_linux_gnu‘

我执行正确的代码是，将长得很像的那个cos6文件，拷贝为缺失的文件cos7，这样顺利解决了问题。

2024-06-11 16:46:00 629

原创 Shell | shell脚本中使用cp指令（外两则）

（1）在定义变量的时候，等号两侧避免使用空格，否则无法识别；（3）使用cp指令的时候，可以将拷贝前后的目录定义为变量；（2）在指令中使用变量的时候，可以用双引号将变量括起来；

2024-05-24 22:23:19 493

原创 R语言 |一些常用的数据整理的技巧（二）

参考：https://blog.csdn.net/kunxitoothache/article/details/109897918。假设上述文件的名称为test.pbs。主要要注意的是“peak”NR的应用；

2024-04-22 16:50:46 1039

原创 R语言 | 一些常用的数据整理的技巧（一）

【代码】R语言 | 一些常用的数据整理的技巧（一）

2024-04-22 16:42:57 318

原创 GitHub登不上：修改hosts文件来解决（GitHub520，window）

4.搜索框输入cmd。打开cmd，输入ipconfig /flushdns。GitHub网站一直登不上去，后来参考上述网站的链接解决。3.将上述内容，复制到hosts文档的最后。2.打开window的下述目录下的文档。5.重新打开GitHub网站，顺利打开。1.复制下面的内容。

2024-03-04 15:15:30 1895 4

原创 Microsoft 365自定义安装软件

如图，在安装类型的步骤的时候，可以勾选自己想要的软件（而非一股脑儿的安装一大堆自己不需要的）。

2024-02-23 22:25:12 640

原创 Office2013 | Office Professional Plus 2013

使用指南。

2024-02-21 15:36:32 1018

原创磁盘清理 | 已经卸载的软件还出现在应用和功能里怎么办？

最近磁盘满了，需要删除一些平时不常用的软件，但是发现一个问题。就是已经删除的软件，仍然会出现在“应用与功能”中。作为一个强迫症，我想要有一个比较清爽的电脑，解决掉这些残留。注：我目前卸载软件都是通过以下步骤卸载的。即控制面板 ==> 程序 ==> 卸载程序来处理的。安装完成之后，解压到合适的位置。这样就可以把残留的内容全部删掉，就不再会在 [应用与功能] 这边显示了。然后，接下来，点击特定的你想要彻底删除的软件，选择“强制删除”。安装Geek Uninstaller,删除卸载残留。

2023-10-21 16:25:38 16861 4

原创 cannot coerce class ‘“igraph“’ to a data.frame

参考链接：https://lists.nongnu.org/archive/html/igraph-help/2018-02/msg00019.html。

2023-01-12 12:31:05 1896 1

原创 bash: line 5: bgzip: command not found

无。

2022-10-21 11:42:04 1616

原创 tar: Exiting with failure status due to previous errors

tar: Exiting with failure status due to previous errors

2022-10-21 10:11:33 813

原创 R语言画图 | ggplot2标注图中的感兴趣的点

解答：使用ggrepel package。

2022-09-02 20:45:25 918

原创 R语言画图 |geom_violin()

参考链接http//www.sthda.com/english/search/search.php#results。（2）通过使用RcolorBrewerpackag解决了set1颜色集中颜色不够的问题。（1）通过设置factor的level顺序，人为规定画图的顺序。

2022-07-17 18:30:12 1038

原创 R语言绘图 | geom_bar（）使用示例

在做项目的过程中，一般会有一些重复使用的代码，这个时候，就会想把他包装成函数。每次套用的时候，只需要改变输入就可获得相应的结果。

2022-07-17 15:23:36 1765

原创代码文件备份 | 6-30 组学数据差异分析

课程作业代码备份。

2022-06-30 19:38:13 306

原创 Perl语言的“解引用”法则

perl语言的解引用。

2022-06-09 19:03:03 280 1

原创 WGCNA与基因模块时空表达分析

分析目标：（1）梳理WGCNA的基本流程。（2）功能注释（3）对相应的基因模块进行时空表达特征评估一、WGCNA分析（基因共表达分析）我们有4000+个感兴趣的基因，希望通过这一步得到的结果是：按照基因之间的表达特征的相似性，将其分为若干基因模块（module）。本次实验使用的数据集（1）GSE25219-GPL5175数据集：https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE25219（2）GSE25219-GPL5175样本注.

2022-05-05 16:49:10 2805

原创 R基础学习 | 处理数据的技巧整理

这里总结一下，今天老师上课的内容。我觉得跟着老师，我能学到好多东西。我要消化。我突然觉得自己很卑微，因为有那么多东西需要学习的。但是复习的侧重点在：什么是自己知道的？什么是自己不知道的？缺什么补什么？R基础知识整理（查漏补缺）S1：identicalidentical(a,i) #既检验数值又检验数据类型i==m== 仅仅是数值的比较；identical 则同时包括数值和属性的比较；S2: stringasFactor=FALSEdf3 <- data.frame(a=.

2022-03-25 21:37:16 2308

原创单细胞基础分析 | 基因细胞类型特异性富集分析

本文目标是：通过分析单细胞的数据，根据已有的细胞分型，去看我们感兴趣的基因集在这些细胞类型中的富集情况。单细胞数据和bulk数据会有些不同，可能一些具体的技巧需要注意一下。1。切换到R4环境，加载RDS数据。conda activate r4R #进入到Rdata<-readRDS("merge_obj.rds") # 加载原始数据library(Seurat)#加载Seurat包levels(data) #查看数据集的level [1] "L5 IT" "L4 IT".

2022-03-21 17:25:21 1904 1

原创生物信息学分析 | 物种间的同源基因的批量注释

项目需求：现在以及大鼠的基因若干，想要转换成人类对应的同源基因的名及ID，怎么对应？解决策略：（几行代码就可以快速解决，感谢R）#安装好R包install.packages("homologene")library(homologene)homologene::taxData#Rattus norvegicus:10116 #Homo sapiens:9606###############################################################.

2022-03-18 13:58:13 1133

原创生物信息学 | 富集分析

主要目标：理解这个代码的主要的思路。想分析一下老师的这个富集分析的主要的思路是什么？一行一行的理解这个代码。# Get cell type mean of each genecellTypeMean <- t(apply(dat, 1, function(v) { tapply(v, droplevels(factor(cellSubtypes, levels=subtypeOrder)), mean)}))}（1） droplevels（）是什么意思> x <- c.

2022-03-17 19:01:50 1188

原创 affymatrix探针转换 | GPL5175探针对应的基因转换

一般情况下，有一些比较成熟的对应平台的注释数据集的R包。但是这个注释平台，我在Bioconductor上找了一圈都没有找到。只能通过最原始也最可靠的方法，从GEO数据集上去下载这部分的注释文件。以下展示全过程。我要检查的数据平台是：GPL5157。数据集的注释集链接为：https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL5175这个注释数据集比较难弄的地方在于，它的基因集注释的不太好。没有比较直接的可供提取的genesample的信息；在ge.

2022-03-17 18:26:17 6169 6

原创 R语言报错 | Error in scan(file = file）， line 5503 did not have 12 elements

一般是读取txt文件的时候遇到上述问题，原因是读取table的时候，不同的行有空格，导致列数不同，无法对齐。Error in scan(file = file, what = what, sep = sep, quote = quote, dec = dec, :line 5503 did not have 12 elements解决方法一般有三步：（1）跳过注释行。probe_test<-read.table("GPL5175-probe-annonation.txt",commen

2022-03-17 11:25:19 22490 7

原创出错记录：Error: package or namespace load failed for ‘DESeq2’：没有这个DLL ‘BiocParallel’：是不是没有为此架构安装？

出错记录：Error: package or namespace load failed for ‘DESeq2’ in library.dynam(lib, package, package.lib): 没有这个DLL ‘BiocParallel’：是不是没有为此架构安装？解决策略：强制重装缺失的那个R包。BiocManager::install("BiocParallel",force = TRUE)...

2022-03-15 16:19:46 3935

原创单细胞基础分析 | 对细胞按照基因marker进行分型（ACC脑区）

因项目的需求，需要对数据进行简单的分类，然后找差异表达基因。虽然我自知自己在这个过程中的很多方面并不理解透彻，很糊涂的去做。但是我愿意去尝试完成。现在开始跟着Seurat上面的教程一点点的来做。参考链接：https://satijalab.org/seurat/articles/pbmc3k_tutorial.html1、加载分析必须的包library(Seurat)library(dplyr)library(patchwork)2、加载10XGenomics 数据data<-.

2022-03-12 16:16:41 11307

原创代码文件备份 | 3-10：对arraymatrix数据进行初步筛选与分组差异表达分析

data<-read.table("GSE25219-GPL5175_series_matrix.txt",comment.char = "!",header = T)row.names(data)<-data[,1]data<-data[,-1]label<-read.table("label.txt")region<-read.table("region.txt")year<-read.table("year.txt")meta.data<-rbi

2022-03-11 00:01:10 424

原创 R语言 | R语言分析琐碎

首先，文件夹下应该存在三个文件，分别命名为：barcodes.tsv.gzmatrix.mtx.gzfeatures.tsv.gz然后使用Seurat包中的，Read10X方法读取。library(Seurat)data<-CreateSeuratObject(Read10X("./"),"ACC")如上，即读取成功！如何跳过注释行（如#），读取.txt文件。使用参数：comment.chardata<-read.table("GSE25219-GPL5175_ser.

2022-03-10 23:53:48 1730 1

原创 R语言绘图 | 安装包报错：‘configure‘ exists but is not executable、whether the C++ compiler supports the long lo

Error in library.dynam(lib, package, package.lib) : shared object ‘stringi.so’ not foundCalls: <Anonymous> ... loadNamespace -> namespaceImport -> loadNamespace -> library.dynamExecution haltedERROR: lazy loading failed for package ‘res

2022-03-05 21:29:10 1295

原创 R语言画图 | 如何看已知基因list的细胞类型特异性表达？

自己学东西，觉得举步维艰。网上的资源太多了，反而让人很容易陷入一种焦躁和慌乱中。不知道从哪里理出头绪来。是碎片化的，不成体系的。自己需要对信息进行过滤，整合成自己的方法。目标：加载作者的处理过的有细胞类型标签的数据，对数据进行差异表达分析，找到特定的组织中差异表达的基因。注明以下使用到的数据来源：http://development.psychencode.org/files/processed_data/scRNA-seq/Sestan.fetalHuman.Psychencode.Rdata.

2022-03-03 22:31:31 1427

result_data.csv

annotation.txt

gene_list.txt

GSE98793.txt

邮件合并操作生成的模板.docx

人事信息.xlsx

windowBuilder 的structure界面显示不出来