- 博客(46)
- 收藏
- 关注
原创 Could not get the file at http://www.quest.dcs.shef.ac.uk/wmt16_files_mmt/training.tar.gz. [RequestE
并将三个文件放在/root/.cache/torch/text/datasets/Multi30k(本目录根据个人有所变化)压缩文件可从以下链接下载:https://share.weiyun.com/wvtbBVWS。
2023-12-06 11:35:36
387
原创 R语言构建深度学习的框架:reticulate
进入/home/u19111010045/.local/share/r-miniconda/envs/r-reticulate的r-reticulate环境中,安装cudatoolkit==10.1.243。进入/home/u19111010045/.local/share/r-miniconda/envs/r-reticulate的r-reticulate环境中,安装tensorflow。同时将LD_LIBRARY_PATH的路径上增加libcudart.so.10.1所在库。
2023-07-05 19:11:51
695
原创 AttributeError: partially initialized module xxx has no attribute ‘XXX‘
解决方案:查看sys.path中是否包含了重复的路径,如果包括了,去掉重复的路径,重新加载module XXX即可。
2023-06-21 11:37:19
5545
原创 R语言 删除在多组数据中重复的数据
#删除在多组数据中重复的数据set1 <- c("1","2","7","9","12","13","15","17","19","23")set2 <- c("2","4","7","13","9","12","28","11")set3 <- c("3","9","19","20")bind_set <- c(set1,set2,set3)bind_setduplicate_set <- bind_set[duplicated(bind_set)] #筛选数据里
2021-09-12 16:30:13
1649
原创 Error in .jcall(“RJavaTools“, “Ljava/lang/Object;“, “invokeMethod“, cl, : java.lang.OutOfMemoryE
目前存在的问题:代码运行中Error in .jcall(“RJavaTools”, “Ljava/lang/Object;”, “invokeMethod”, cl, :java.lang.OutOfMemoryError: Java heap space参考解决办法https://blog.csdn.net/u012110870/article/details/104339396使用openxlsx这个R包...
2021-09-01 23:45:38
1173
原创 monocle的算法
参考内容https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-019-2599-6monocles分析差异基因利用了一个广义加和模型:generalized addictive model (depending on smoothing functions)。Y:the gene expression levelXi:the predictor variable that expresses the cell c
2021-09-01 23:44:41
260
原创 细胞类型注释
细胞类型注释:根据细胞的特征基因(marker基因)进行注释,一般情况是预先并不知道该特征基因对应的细胞类型,所以需要通过用细胞的特征基因对细胞类型进行注释,判断。注释的方法:2. 自动注释:SingleR, Cellassign, Celaref, Garnett, scTPA, Cell Blast, scCATCH.SingleR注释:main大类注释fine小类注释手动注释:经典的细胞marker, 来自于文献整理。...
2021-08-10 10:00:12
7026
原创 R进行批量文件的重命名
allfile <- list.files()for (f in allfile) { newname <- sub(".csv",".xlsx",f) #for循环内的每行是运行命令行,不是参数,不能加“,” file.rename(f,newname) }dir()
2021-08-01 21:27:24
1190
原创 apply函数
apply函数运用矩阵进行计算,一行或一列地运行用法:apply(array, margin, function)参数含义:array: 计算的数据margin: 按行或列计算function: 运行的函数运行代码:matrix <- matrix(c(1:10), nrow = 5, ncol = 6)rows <- apply(matrix, 1, sum) # 1 is rowcols <- apply(matrix,2,sum) # 2 is col运行结
2021-07-29 15:02:23
751
原创 单细胞测序在非小细胞肺癌T细胞中的应用
单细胞测序获得非小细胞肺癌的T细胞特征图谱参考内容https://www.bilibili.com/video/BV1za4y1v7gF/?spm_id_from=trigger_reload对这篇文章一点感觉也没有,感觉就是一群细胞。从1.2万样本中获得细胞并进行单细胞测序。对T细胞样本进行分成16类,并且确定细胞类型,细胞的特征基因。首先研究的是CD8+T细胞的发育过程和由肿瘤影响的单细胞发育过程。患者预后和CD4+调节性T细胞的探索。并且研究CD8+的T细胞...
2021-07-28 21:38:19
248
原创 AlphaFold2
DeepMind的AlphaFold 2解读! 蛋白质折叠的AI突破!https://www.bilibili.com/video/BV1Bh411Z74n/?spm_id_from=trigger_reloadhttps://www.bilibili.com/video/BV1Bo4y197Yv?from=search&seid=13773497593136628881https://www.bilibili.com/video/BV1cT4y1M7jK?from=search&s
2021-07-27 14:00:49
832
原创 R 字符串分割
RGENES = "ABLIM1, ACTN1, AIF1, APBA2, APEX1, ARHGAP45, ARHGEF18, ATM, BACH2, BEX4, C1orf162, C1orf228, C6orf48, CA6, CAMK4, CCR7, CD248, CD55, CEP68, COQ8A, DGKA, EEF2, EIF3E, EIF3L, EPHX2, EXOSC8, FAM102A, FAM117B"Gene = strsplit(GENES,split = ",", perl
2021-07-23 13:24:41
631
原创 单细胞测序的marker基因
参考内容single cell marker 基因数据库https://www.jianshu.com/p/9d7789cc6d97CellMarker:用来做细胞标记,很nicehttps://zhuanlan.zhihu.com/p/300613622数据库:cellMarkerhttp://bio-bigdata.hrbmu.edu.cn/CellMarker/search.jsp?species=Human&tissue=Blood&cellname=B%20
2021-07-23 13:19:41
3221
原创 R对文件夹下所有文件统一处理
设定工作目录: setwd()将文件夹下所有文件名输入给1个变量: list.files()构建获取文件的路径: paste函数读取文件个数,以确定循环次数: length()依次读取文件: for循环循环操作输出文件library(rtracklayer)gtf = import("E:\\lab\\gencode.v29.annotation.gtf")gtf = as.data.frame(gtf)colnames(gtf)head(gtf)gtf_gene <- g.
2021-07-23 00:05:13
2013
原创 GEO数据库数据下载
GEO(Gene Expression Ommius datasets):该数据库搜集了大量表达谱,甲基化,lncRNA,miRNA,CNV等芯片数据该数据信息包括了:GPL:GEO Platform 数据平台GSM: GEO Sample 样本的IDGSE: GEO Series 研究IDGDS: GEO Datasets 数据集的ID该数据类型包括了:SOFT:包括了探针与基因对应关系的注释文件,样本单独表达量,所有信息文件。MINIML : XML格式的所有数据Series
2021-07-21 17:21:54
1713
原创 安装miniconda 及 生物学软件
安装miniconda参考内容https://www.bilibili.com/video/BV1MV41117SD?from=search&seid=14095988536494616638下载安装miniconda的bash脚本mimiconda有不同平台的,由于我使用的是linux,因此采用linux版本的miniconda: Miniconda3-latest-Linux-x86_64.sh下载成功后,直接运行安装的脚本。设置miniconda安装目录安装成功后,激活co
2021-07-21 15:28:38
412
原创 Rtudio,plot不出图
Rtudio,plot不出图法1dev.off()dev.new()如果不行,重启RSTUDIO,再不行,就重启电脑吧。重启是解决人生烦恼的必备良药法2我捉摸着你的问题答案就在Pane Layout里面,把下拉框没显示的选择项打开,Plots打勾法3在画图之前先执行:dev.off() 就好了法4请更新至最新的R版本结果,全部无用...
2021-07-09 11:26:14
5740
原创 R包 splatter
splatter包如何下载?splatter包是模拟单细胞测测序数据的R包,可以从Bioconductor官网上下载。如何寻找帮助理解运行splatter包?了解splatter包的帮助信息可在R上通过以下方式寻求帮助。library(help = "splatter")该方式会在R的control界面上显示帮助信息。其次在安装包的安装位置找到doc文件夹,里面有小品文,可获得相关帮助信息:R-script, html, pdf。在Bioconductor官网上,对于每一个R包,也有R
2021-07-09 11:15:05
640
原创 PCA降维
PCA主成分分析:principle component analysis参考内容:什么是主成分分析PCA:https://www.bilibili.com/video/BV1E5411E71z/主成分分析是为了给数据降维,减少数据的存储内存。例如:位于平面坐标系的二维数据信息降低到一维平面。该图表明示例降维的情况PCA就是要找到这么一个坐标系,从而降低数据的维度。PCA中有两个内容:主成分1和主成分2主成分1:在坐标系该位置降维的信息量很大,各个数据点投影到该位置方差最大。主成分2:
2021-07-09 10:21:28
100
原创 scRNA-seq Course 学习
昨天和今天都在学习scRNA-seq测序的教程。scRNA-seq是对单个细胞进行测序分析,便于研究细胞的异质性。scRNA-seq和bulk-RNA-seq相似,区别只在于研究的细胞数量,后者是对同一组织的大量细胞进行转录组的分析,而前者是对单个细胞进行转录组分析。scRNA-seq的流程是制备单细胞,单细胞水平测序,数据分析。昨天看到了分离单细胞和测序平台的方法上。在分离单细胞方法有mirco-well plate、micro-fluid seq, droplet seq,分别是让细胞在微板上
2021-07-07 15:04:56
6065
原创 numpy包学习笔记ing
###### numpy的学习笔记# numpy:快速,科学计算的包import numpy as np#(一)通过numpy创建数组#1.用列表的形式生成数组a = np.array([1,2,3,4,5,6])np.array([1,2,3,4,5,6])print(type(np.array([1,2,3,4,5,6])))#2.生成数组,并定义数据类型np.array([22,23,45],dtype = np.int)#3.生成矩阵np.array([[1,2,3],[
2021-07-06 15:13:44
86
原创 安装不同来源R包的方法
R语言是一个强大的数据分析工具,其强大之处在于多种R包用于实现各种各样的功能。接下来介绍不同来源R包的安装方法参考链接:“R语言入门之R包的安装” : https://zhuanlan.zhihu.com/p/1290699101)R官网 (https://www.r-project.org/)查看所安装包是否在R上:https://cran.r-project.org/如果在R官网中,那么可以在Rstudio上输入以下命令install.packages("fitdistrplus")如
2021-07-06 15:06:45
1339
原创 2021-04-21
头文件&库文件2.https://blog.csdn.net/weixin_42458272/article/details/106193786https://zhuanlan.zhihu.com/p/128099583lo文件 https://blog.csdn.net/shenyan008/article/details/8176380o: 编译的目标文件a : 静态库so:动态链接库(共享库 share)pkg-config 命令#-cflags 查..
2021-07-03 21:45:24
85
原创 可操作 转载 安装cpan软件包&软件包
1、查看是否安装cpan软件包:#rpm -qa |grep perl-CPAN2、如果没有安装,则进行安装:#yum install perl-CPAN*3、安装完成后,则可以通过cpan来安装相应模块。比如我要安装IPC::System::Simple模块:#cpan IPC::System::Simple………4、安装完成后,查看文档:#perldoc IPC::System::Simple将会列出相应的用法和说明。Linux上安装Perl模块的两种方法Linux/Unix下
2021-07-03 21:45:11
759
原创 2021-04-26 线性代数 第1周
线性代数第一周第1讲线性代数绪论线性代数应用案例:交通网络流量代数重建投入产出问题网页等级简单种群增长问题第2讲 矩阵
2021-07-03 21:43:09
175
原创 2021/05/11
linux shell:根据文件大小读取筛选内容:#! /bin/bashfor file in $(ls ./ | grep sequence.txt)doecho $filelength=$(sed -n '2p' $file)number=$(echo ${#length})echo $numberif (($number > 500)) && (($number < 1500));thensed -n '1,2p' $file >> seq
2021-07-03 21:42:48
55
原创 基因序列的保守性分值
phyloP46way_placental: PhyloP预测结果(dbNSFP version3.0),基于46个哺乳动物物种的多序列比对得到位点的保守性分值,分值越大,位点越保守。该分值考虑的是变异位点的保守性,而非考虑该位点上的碱基,所以无论该位点上是同义突变还是非同义突变,score都相同。该分值用来寻找具有功能重要性的位点,利用这些score值,能够推断出疾病易感性位点http://www.360doc.cn/mip/966143054.htmlpython3.8with open("C:\
2021-07-03 21:42:33
4333
1
原创 python2
python2Python程序语言指定任何非0和非空(null)值为true,0 或者 null为false,所以Python中的 1 代表 True,0代表False.
2021-07-03 21:42:07
68
原创 2021-05-07 Perl_一种拥有各种语言功能的梦幻脚本语言——第6章 哈希
第六章 哈希胖箭头:=>哈希是一种数据结构,数据结构是保存数据的容器。哈希的顺序是随机的,是不保证顺序的。keys是一个函数#:将perl语句注释掉。
2021-07-02 21:47:37
114
原创 2021-05-07 Perl_一种拥有各种语言功能的梦幻脚本语言 第4章 子程序-1
第四章 子程序-1子程序sub,子程序中的私有变量my (m,m,m,n);长度可变的参数列表;shift @_;
2021-07-02 21:47:08
61
原创 2021-05-07 Perl_一种拥有各种语言功能的梦幻脚本语言 第5章 文件句柄
第五章:文件句柄if语句后面需要加入{ },从而继续操作后续文件。
2021-07-02 21:46:33
65
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人