自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 收藏
  • 关注

原创 gdb调试C++程序出现Missing separate debuginfos

打开配置文件 vim /etc/yum.repos.d/CentOS-Debuginfo.repo。然后glibc-2.17-324.el7_9.x86_64总是装不上。已加载插件:fastestmirror, langpacks。把enabled=0改成enabled=1即可。

2023-07-07 10:57:10 337

原创 Clion中文乱码问题

3.IDE的最右下方,把utf-8改为GBK。1.打开Clion-文件-设置。2.编辑器-文件编码。

2023-06-29 09:27:07 166

原创 Anaconda国内镜像源配置

阿里云 http://mirrors.aliyun.com/pypi/simple/中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simple/豆瓣 https://pypi.douban.com/simple/

2023-06-06 13:16:45 420

原创 Anaconda中启动jupyter notebook 发生AttributeError: type object ‘IOLoop‘ has no attribute ‘initialized‘

然后继续启动notebook又产生了另外一个错误。

2023-06-05 16:04:05 830

原创 求一个数字的数根

实现一个算法求一个数字的树根

2022-08-18 21:03:55 341

原创 在Linux上配置Jupyter Notebook

服务器上的jupyter notebook配置

2022-08-14 09:12:17 1219

原创 实现链式队列

实现链式队列入队,出队的方法。

2022-08-12 14:37:04 150

原创 MySQL密码正确却登录失败

系统版本$ lsb_release -aNo LSB modules are available.Distributor ID: UbuntuDescription: Ubuntu 21.04Release: 21.04Codename: hirsuteCentos pass掉,好像和Ubuntu的处理不太一样错误提示:# mysql -uroot -pEnter password: ERROR 1045 (28000): Access denied for user 'root'@

2021-11-27 18:36:34 3872 1

原创 macbook air从win10回到macOS Sierra

心塞历程某天不小心点了升级到mac big sur发现非常不流畅,估计老苹果的原因了;很头疼就一脑热,把big sur 变成了 win10,用了一段时间,发热严重(100℃都有,不知道cpu检测是不是出了问题,疑惑),续航严重下滑,终于某天受不了想回到macOS本来想从某宝买个OS镜像,一通安装下来,最后找资料,发现还有更简单的,就是考验网速步骤如下macbook关机情况下,先按住command+r不放,再按下开机键直到出现网络图标,大概就是类似一个地球在转圈,command+r就可以松开了

2021-11-21 10:39:00 4586

原创 短序列比对利器-bwa

官方文档安装#直接conda简单粗暴了 or 去官网下载安装conda install bwa简介即Burrows-Wheeler-Alignment Tool。**BWA 是一种能够将差异度较小的序列比对到一个较大的参考基因组上的软件包。**它由三个不同的算法:BWA-MEM: 推荐使用的算法,支持较长的read长度,同时支持剪接性比对(split alignments),但是BWA-MEM是更新的算法,也更快,更准确,且 BWA-MEM 对于 70bp-100bp 的 Illumina

2021-11-01 10:08:34 1713

原创 task7b-TP53突变与否的TNBC病人基因表达相关性改变

作业链接作业内容重复这个散点图背景知识TNBC-三阴性乳腺癌三阴乳腺癌是指乳腺癌免疫组化结果:雌激素受体(ER)、孕激素受体(PR)和人表皮生长因子受体2(Her-2)均为阴性的乳腺癌。三阴性乳腺癌容易早期发生广泛转移,如脑转移、骨转移等情况。所以,化疗在三阴性乳腺癌当中地位很重要。当然,复发高峰在手术以后头三年,过了复发高峰以后,预后也还是非常好的一种恶性肿瘤,具体要看分期如何、病人身体状况,以及接受什么样治疗等。下载数据并提取1.从TCGA.BRCA.sampleMap%2FBRCA

2021-10-19 15:44:27 586

原创 task7a-10个细胞系仅1个表达你的基因

作业链接1.下载CCLE数据库的RNA-seq的表达矩阵https://depmap.org/portal/download/?release=CCLE+2019&release=Fusion&release=DNA+Copy+Number下载CCLE_RNAseq_rsem_genes_tpm_20180929.txt.gz这个数据集2.提取BREAST的细胞系TPM数据library(data.table)library(dplyr)CCLE_RNAseq_tpm =

2021-10-19 15:42:16 379

原创 task6b-哦别做梦了-TP53在TCGA的肝癌的有配对样本病人的转录组数据表达量配对图

作业链接​0.作业题目从ucsc的xena浏览器里面下载感兴趣癌症,比如肝癌的表达矩阵(counts值)然后根据样本名字拿到有配对的几十个病人的癌症和正常对照数据(部分癌症数据并没有对照)接着提取感兴趣基因(比如TP53)的表达量最后套用上面的绘图代码即可!1.数据下载下载网址​![1634287851(1).jpg](https://img-blog.csdnimg.cn/img_convert/68a30dad6b1cbf8b3b17646a6e09e842.png#client

2021-10-15 23:53:43 899

原创 task5b-验证lncRNA只有部分具有polyA尾结构

​题目:下载人和鼠的gtf文件,以及转录本fasta序列文件,自己去探索一下:gtf文件记录了多少个基因,多少个是蛋白编码基因;多少个是lncRNA呢?其中各自的具有polyA尾结构的比例是多少呢?背景知识真核生物的mRNA都是有polyA尾巴结构lncRNA只有部分具有polyA尾结构数据下载Genocode刚好有人和小鼠的gtf文件以及转录本fasta序列文件#humanwget -c 'http://ftp.ebi.ac.uk/pub/databases/gencode/Ge

2021-10-03 23:46:56 1155

原创 task5a-什么,基因只剩下了三分之一

作业题目去gencode数据库拿到最新的人类的gtf文件,仅仅是挑选蛋白编码基因即可,约2万个,然后把基因名字按照字母顺序排好,取前面的三分之一,对它进行一些基因分布特征的检验,比如是否集中于某条染色体,或者其它一切你能想到的检验。下载数据wget -c 'http://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_38/gencode.v38.chr_patch_hapl_scaff.annotation.gtf.gz'挑

2021-10-03 23:44:14 119

原创 task4c-研究最热门的基因是什么

作业链接作业题目gene2pubmed.gz 约50M文件里面的信息太丰富了,有1333万行信息,仅仅是人类就有159万行的文献,涉及到3万9千的基因数量,绝大部分基因都是如过眼云烟,很少人去研究它。我们的TP53能拔得头彩也是不容易,但它也有自己的发展规律,希望大家可以更细致去探索 ftp://ftp.ncbi.nlm.nih.gov//gene 里面的文件。比如这样的top 100的基因词云,其实可以做出来最近30年的变化规律,只需要你去找到文献的时间年份信息,进行拆分,每个年份独立统计绘图即可

2021-10-01 17:13:44 224

原创 linux系统镜像官方下载地址

Centos镜像https://www.centos.org/download/这里选择的是centos7,64位系统选择国内的镜像即可选择第一个镜像文件下载Ubuntu镜像ubuntu 后面跟LTS(Long Term Support ),就是长期支持的意思Ubuntu kylin,跟这个叫做优麒麟版;唯一官方中文衍生版,做最有中国味的操作系统用过kylin,中文支持友好,就是不适合放虚拟机里,有点慢我选择了这个14的桌面版,放虚拟机里下载地址:https://releases.

2021-09-27 15:53:51 2607

原创 R语言中的Rtools的安装以及环境变量配置

方式1-直接通过R语言的命令安装#Rtools不能通过常规install.packages()命令进行安装,需要通过installr包进行安装install.packages("installr")install.packages("stringr") ###依赖包library(stringr)library(installr)install.Rtools()方式2-官网下载安装https://mirrors.tuna.tsinghua.edu.cn/CRAN/bin/windo

2021-09-27 11:04:18 41327 5

原创 常用的linux基础命令

mkdir;mkdir mydata #创建mydata的目录rm;vi/vim;lsls;ll -thman-非常有用的命令man ls 查看ls的帮助文档cdcd - #回到上次的路径下cd … #回到家目录下cd dir #切换到dir路径下mvrename #重命名cp;scp/rsyncsort;uniqcathead/taillessless -SN压缩/解压缩gzip;tar下载wget;软链接ln -s本地上传下载sz/rz效率神器

2021-09-23 18:44:06 156

原创 task4a_TCGA_Pan_Cancer

把tcga大计划的CNS级别文章标题画一个词云给自己的浏览器装个XPATH点击XPATH然后写入://*/div[1]/div/div/div/div/ul/li[2]/a直接复制右边的33篇文章标题,存为TCGA_33_title.txt即可file <- scan('TCGA_33_title.txt',sep='\n',what='',encoding="UTF-8")txtList = lapply(file, strsplit,"\\s+") #使用空格符号进行分词txt

2021-09-23 11:30:53 177

原创 task4b_Nature_Pan_Cancer_词云

把tcga大计划的CNS级别文章标题画一个词云获取网页的泛癌文章标题,目前一共24篇get_title <- function(url){ web <- xml2::read_html(url, encoding = "utf-8") #解析url urlpage <- XML::htmlParse(web) #解析xml title = XML::xpathSApply(urlpage, '//*[@id="content"]/div[3]/section/articl

2021-09-23 09:49:00 126

原创 task3a_gmt函数

gmt文件定义gmt格式是多列注释文件,列与列之间都是TAB分割。第1列: 是基因所属基因集的名字,可以是通路名字,也可以是自己定义的任何名字。第2列 :官方提供的格式是URL,可以是任意字符串。第3列-第n列: 后面是基因集内基因的名字,有几个写几列。library(clusterProfiler)data(gcSample) #加载gcSample数据集#第一列用X1-X8,第二列无内容用‘NA’代替,第三列-第N列为基因的entrenz id#文件以制表符分隔开get_gmt

2021-09-22 20:54:56 518

原创 task3b-词云

作业链接library(jiebaR)library(wordcloud2)#读入数据分隔符是‘\n’,字符编码是‘UTF-8’,what=''表示以字符串类型读入file <- scan('ciyun.txt',sep='\n',what='',encoding="UTF-8")txtList = lapply(file, strsplit,"\\s+") #使用空格符号进行分词txtChar = tolower(unlist(txtList))txtChar <- txt

2021-09-22 19:21:21 119

原创 GO and KEGG富集分析

GO基因本体涉及的基因和基因产物词汇分为三大类,涵盖生物学的三个方面:细胞组分(cellular component)CC:细胞的每个部分和细胞外环境。分子功能(molecular function)MF:可以描述为分子水平的活性(activity),如催化(catalytic)或结合(binding)活性。生物过程(biological process)BP:生物学过程系指由一个或多个分子功能有序组合而产生的系列事件。其定义有广义和狭义之分,在词义上可以区分为泛指和特指。一般规律是,一个过程是由多

2021-09-15 16:36:48 3374

原创 task2-基于小鼠的基因集数据库资源

作业链接-基于小鼠的基因集数据库资源许多不同的物种间都具有同源性。现代分子生物学中的同源性描述的是基因与基因之间相似关系,它表明的是两个相比较的序列之间的匹配程度。一般来说,如果两条基因序列相似性达80% ,就可以把它们称为“同源基因(homologousgene)”。下载地址# http://bioinf.wehi.edu.au/software/MSigDB/human_H_v5p2.rdata# http://bioinf.wehi.edu.au/software/MSigDB/mouse_H

2021-09-13 18:39:56 312

原创 R语言常用的数据操作函数整理

typora-copy-images-to: …\zhengzx\mk图片保存apply族函数–提高代码效率神器R是统计学家整出来的,是一种统计领域的软件工具。面向数组(array-oriented)的语法,它更像数学,方便科学家将数学公式转化为R代码。在使用R时,要尽量用array的方式思考,避免for循环,多用apply族函数代替vector是一维的array,dataframe可以看作特殊的list。applyapply(array, margin, FUN, …)在array上,沿ma.

2021-09-08 23:03:00 1124

原创 NCBI-homologene数据库的初步探索

HomoloGene数据库就是用来查找物种间对应的同源基因ftp地址:ftp://ftp.ncbi.nih.gov/pub/HomoloGene/build68/homologene.datahomologene.data存放着不同物种之间同源基因的对应关系nohup wget -c 'ftp://ftp.ncbi.nih.gov/pub/HomoloGene/build68/homologene.data' & #下载数据echo -e "HID(HomoloGene_group_i

2021-09-08 22:45:06 1335

原创 task1-人鼠基因转换之首字母大写

library("hash") #加载能用哈希数据结构的包human_gene <- c("PTPRC","EPCAM","MME","CD3G","CD3E","CD68","CD79A") #若干人类基因upper_low <- function(var) { hash_letters <- hash( toupper( letters ), letters ) position=1 for(letter in strsplit(var,split = "")[[

2021-09-07 23:51:15 467

原创 生信技能树-task1-人类基因组外显子区域长度

目标:统计人类基因组外显子区域长度题目数据来源为:ftp://ftp.ncbi.nlm.nih.gov/pub/CCDS/current_human/CCDS.current.txtperl实现open F,"CCDS.current.txt";while(<F>){#一行一行读取数据 next if /^#/;#pass掉带#符号开头的行,即首行 chomp;#去掉末尾的换行符 @arr=split /\t/;#以制表符切割读取的每一行数据 next unles

2021-09-07 22:46:14 880

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除