生物信息
文章平均质量分 79
root_lty
这个作者很懒,什么都没留下…
展开
-
line 1213 did not have 4 elements
read.table中有一个参数 comment.char = “”默认情况下,read.table 用 # 作为注释标识字符。如果碰到该字符(除了在被引用的字符串内),该行中随后的内容将会被忽略。只含有空白和注释的行被当作空白行。如果确认数据文件中没有注释内容,用 comment.char = “” 会比较安全 (也可能让速度比较快)。例子:我的文件中他默认的时候是#以后的内容被注释了,因此读入的时候一直报错因此如果确认数据文件中没有注释内容,用 comment.char = “” 就不会原创 2020-07-03 10:24:35 · 4798 阅读 · 0 评论 -
XML包 安装之 ERROR: configuration failed for package ‘XML’
安装XML时候报错如下所示:安装相应的libxml2-devel的环境就好,我的系统是centos,Ubuntu的话应该是ibxml2-dev原创 2020-06-25 12:23:36 · 5007 阅读 · 1 评论 -
pubmed搜索基因的小技巧
PubMed中搜一个基因比如“P53”然后你会发现下面出现了一个基因的信息框,其中会显示出这些信息:1)P53基因和功能相关的8770篇文献2)NCBI的Gene数据库中的数据3)不同物种的P53基因点击到Gene的数据库的话,然后点击人类的P53,就进入了这样熟悉的Gene的界面。当然,在这样的Gene的界面中,我们仍然可以找到PubMed。就在右侧的Related Information这一栏下面:PubMed、PubMed(GeneRIF)、PubMed(OMIM)和PubMed(原创 2020-06-21 20:52:19 · 7720 阅读 · 1 评论 -
R 读入fastq文件
##--构建函数--##seq_import <- function( file ){ seq <- readLines(file) # 读入序列,每个元素存入一行 seq <- seq[seq != ""] # 去除空行 is.anno <- regexpr("^>", seq, perl=T) # 正则匹配(regular expression)注释行,是注释行为1,否则为-1 seq.anno <- seq[ which(is.anno == 1)原创 2020-06-21 17:03:47 · 5069 阅读 · 1 评论 -
基于负二项分布模拟基因表达谱
1. RNA-seq为什么是负二项分布?2.负二项分布解释3.DESeq2基于负二项分布找差异基因4.生物信息学基础知识15.生物信息学基础知识26.广义线性回归模型7.广义线性回归模型...原创 2020-03-26 16:25:29 · 1846 阅读 · 1 评论 -
高斯混合聚类
1.高斯混合聚类https://blog.csdn.net/lotusng/article/details/799907242.最大似然估计http://fangs.in/post/thinkstats/likelihood/https://blog.csdn.net/u014182497/article/details/822524563.代码链接https://blog.csdn.n...原创 2020-01-09 22:56:57 · 212 阅读 · 0 评论 -
NLP 之 transformer
1 Transformer模型Transformer由论文《Attention is All You Need》提出,现在是谷歌云TPU推荐的参考模型。Transformer模型是2018年5月提出的,可以替代传统RNN和CNN的一种新的架构,用来实现机器翻译,论文名称是attention is all you need。无论是RNN还是CNN,在处理NLP任务时都有缺陷。CNN是其先天的卷积...原创 2020-01-10 10:53:07 · 645 阅读 · 0 评论 -
MYSQL 报错 Got a packet bigger than 'max_allowed_packet' bytes
查看max_allowed_packet最大允许包输入命令 show VARIABLES like ‘%max_allowed_packet%’;回车即可查看max_allowed_packet最大允许包,解释一下包大小这个东西:简单来说就是mysql把当前执行的mysql语句看作是一个包,而对这个包大小的限制是对当前mysql语句长度的限制。显示如下±---------------...原创 2019-11-06 16:29:38 · 183 阅读 · 0 评论 -
Foldchange
foldChange<-function(inData,classLabel){#Calculating all probes’ FC valuesampleIdsCase<-which(classLabel0);#0 tumersampleIdsControl<-which(classLabel1);#1 normalprobeFC<-rep(0,nrow(in...原创 2019-10-25 16:51:56 · 840 阅读 · 0 评论 -
Unable to find an inherited method for function
library(dplyr)library(conflicted)##############################有些方法,譬如select ,会报错 :Unable to find an inherited method for function ‘select’ for signature ‘“data.frame”’这是因为不同的包之间关于select方法有冲突libr...原创 2019-08-20 13:36:44 · 11486 阅读 · 1 评论 -
MYSQL 乱码问题
由于MySQL编码原因会导致数据库出现乱码。解决办法:修改MySQL数据库字符编码为UTF-8,UTF-8包含全世界所有国家需要用到的字符,是国际编码。具体操作:1、进入MySQL控制台mysql -uroot -p #输入密码进入status; #查看当前MySQL运行状态,如下图所示:系统运维 www.osyunwei.com 温馨提醒:系统运维原创内容©版权所有,转载请注...原创 2019-03-30 22:03:43 · 771 阅读 · 0 评论 -
热图的绘制
R中的一个pheatmap包 library(pheatmap) pheatmap(mat, color = colorRampPalette(rev(brewer.pal(n = 7, name = “RdYlBu”)))(100), kmeans_k = NA, breaks = NA, border_color = “grey60”, cellwidth = NA, cellh转载 2017-05-06 14:52:08 · 1561 阅读 · 0 评论 -
materials about "miR-501 Alters Susceptibility to HCC"
1.哈迪--温伯格平衡定律(Hardy–Weinberg equilibrium):在一个有性生殖的种群中,种群足够大,种群内个体随机交配,没有突变,没有新基因的加入,没有自然先择,种群中各等位基因的频率代代保持稳定不变. 即: 一是等位基因频率逐代不变,因此在这个座位基因库不会进化。二基因型频率将以p^2,2pq和q^2的比例存在于随机交配的以后的各代中。群体的基因型频率以这个比率存在时就称为转载 2017-05-11 20:48:55 · 579 阅读 · 0 评论 -
无尺度网络的鲁棒性和脆弱(小世界网络)
无标度网络 在网络理论中,无尺度网络(或称无标度网络)是带有一类特性的复杂网络,其典型特征是在网络中的大部分节点只和很少节点连接(节点的’度‘很小),而有极少的节点与非常多的节点连接(节点的’度‘非常高)。这种关键的节点(称为“枢纽”或“集散节点”)的存在使得无尺度网络对意外故障有强大的承受能力,但面对协同性攻击时则显得脆弱。现实有1000个节点的BA模型网络中的许多网络都带有无尺度的特性转载 2017-04-29 19:38:35 · 9896 阅读 · 0 评论