生物信息
guomutian911
这个作者很懒,什么都没留下…
展开
-
一幅图看懂Python编程
原创 2016-12-11 08:19:41 · 3261 阅读 · 0 评论 -
【已解决】通过PMID或PMCID下载sc-Seq基因数据集
PMID和PMCID的区别在于编号的系统不一样,PMID是PubMed为每一篇文献给予的特定编号,而PMCID是PMC为每一篇文献给予的特定编号。有PMID号码的文献一定会有PMCID号码,而有PMCID号码的文献并不一定有PMID号码。在 PubMed 查询文献的时候,经常会看到PMID和PMCID号码,而有的文献只有PMID号码,而没有PMCID号码。两者之间有何区别和联系?兴趣驱使,原创 2018-01-13 16:26:20 · 6391 阅读 · 0 评论 -
【基因表达数据处理】从RAW测序数据,到FPKM的过程
FPKM, Fragments Kilobase of exon model per millon mapped reads, which can be used to indicate the expression (abundance) characteristics of genes. Now I will describe operation about obtaining inter转载 2017-10-03 15:05:27 · 7143 阅读 · 0 评论 -
【通俗解释】余弦相似度
相似度度量(Similarity),即计算个体间的相似程度,相似度度量的值越小,说明个体间相似度越小,相似度的值越大说明个体差异越大。对于多个不同的文本或者短文本对话消息要来计算他们之间的相似度如何,一个好的做法就是将这些文本中词语,映射到向量空间,形成文本中文字和向量数据的映射关系,通过计算几个或者多个不同的向量的差异的大小,来计算文本的相似度。下面介绍一个详细成熟的向量空间余弦相似度方转载 2017-06-11 09:58:06 · 6005 阅读 · 1 评论 -
WGS,WES,RNA-seq组与ChIP-seq之间的异同
全外显子(Whole-exome sequencing)测序是啥?转录组(RNA-seq)测序是啥?ChIP-seq又是啥?它们之间有什么差别么?傻傻分不清,不用怕,多学习下就会了,下面让我们一起来从平均测序深度和区域覆盖度的角度来区分它们吧!1 基础概念平均测序深度:指定区域内得到的所有碱基数目与该区域的长度的比值,如果是全基因组,就是整个测序的碱基数目除以基因组的大小。转载 2017-04-21 11:30:46 · 22423 阅读 · 2 评论 -
【比较面】真核生物和原核生物的异同
相同点:1、均为细胞结构的生物.有细胞膜和细胞质和核糖体.2、均能以自身特定的方式繁殖后代.3、它们的遗传物质都是核酸.(除“朊病毒”只含有蛋白质)4、在繁殖过程当中均能体现遗传和变异现象.不同点:主要区别:1.原核细胞:细胞质中缺少结构复杂的细胞器(只有核糖体这中细胞器)真核细胞:细胞质中含有结构复杂的细胞器(如线粒体、叶绿体、高尔基体、内质网、核糖体、中心体、溶酶体、液泡等).2.原核生物:结原创 2017-04-21 11:23:09 · 5241 阅读 · 0 评论 -
【已解决】nimfa 环境的详细搭建过程 + 各种依赖库的安装、下载、调试
为方便交流学习,工具已整理上传至CSDN。作者:玉林师范学院计算机系 guomutian911。开源包下载地址:待补充...1、 安装eclipse开发工具(直接解压,桌面添加快捷方式) 2、 Eclipse的运行需要Java环境,安装jdk(是否安装好可在cmd中测试,无需配置path) 3、 安装Pydev插件(该插件使eclipe具备开发py原创 2017-01-13 11:37:04 · 4193 阅读 · 2 评论 -
【已解决】Win7搭建Python环境:Eclipse + PyDev插件
安装Python从网站上下载最新的版本,从http://python.org/download/下载。安装过程与其他Windows软件类似。目前稳定版本为Python 2.7.6和Python 3.3.4。在Windows命令行中使用Python如果你想要从Windows命令行调用Python,那么需要先设置Python环境变量。对于Windows,点击控制面板->系统->原创 2017-01-12 09:14:49 · 676 阅读 · 0 评论 -
【已解决】R语言,如何切换镜像?
这个技巧很重要,一般来说,R语言自带的install.packages函数来安装一个包时,都是用的默认的镜像!如果你是用的Rstudio这个IDE,你的默认镜像就是: https://cran.rstudio.com/如果你直接用的R语言,那么就是:"http://cran.us.r-project.org" 但是一般你安装的时候会提醒你选择。而我们一般需要更改成自原创 2017-01-14 16:22:44 · 50041 阅读 · 3 评论 -
信息熵与分类算法
在介绍熵之前,先从另一个概念说起:信息量世界杯决赛的两支球队中,哪支球队获得了冠军?在对球队实力没有任何了解的情况下,每支球队夺冠的概率都是1/2,所以谁获得冠军这条信息的信息量是 - log2 1/2 = 1 bit。如果信息是四强中的球队谁获得了冠军,它的信息量是 - log2 1/4 = 2 bit。其实这正好对应了计算机对数字的表示,如果用二进制表示,每一位出现0和转载 2016-12-06 22:09:54 · 3136 阅读 · 0 评论 -
NMF算法简介及python实现
基本原理NMF,非负矩阵分解,它的目标很明确,就是将大矩阵分解成两个小矩阵,使得这两个小矩阵相乘后能够还原到大矩阵。而非负表示分解的矩阵都不包含负 值。 从应用的角度来说,矩阵分解能够用于发现两种实体间的潜在特征,一个最常见的应用就是协同过滤中的预测打分值,而从协同过滤的这个角度来说,非负也很容易 理解:打分都是正的,不会出现负值。在例如Netflix或MovieLens这样的推荐转载 2016-11-19 13:33:51 · 3754 阅读 · 0 评论 -
白话NMF(Non-negative Matrix Factorization)——Matlab 实现
NMF——非负矩阵分解。如果你事先了解PMF[概率矩阵分解]的话,那么其实只要在PMF的基础上多加上一点,就是NMF了。 方法一: 在PMF中使用SGD【随机梯度下降】进行优化时,使用如下的迭代公式: 其中P、Q分别代表原始矩阵R的两个维度的隐含矩阵,在推荐应用中,一般讲P看做用户矩阵、Q看做物品矩阵。 从公式中不转载 2016-11-19 11:38:11 · 6789 阅读 · 2 评论 -
【通俗理解】显著性检验,T-test,P-value
备注:源:https://www.cnblogs.com/hdu-zsk/p/6293721.html显著性检验,判定实验结果是否由随机误差导致的。举例很好,很清楚虽然样本中,均值苏州销售额大于郑州,但T-test发现这是随机导致的,P>0.05,当样本量足够大可能他们的销售额就没有差异了假设:两个样本集之间不存在任何区别结果:在显著性水平α =0.05的情况下,p&...原创 2018-08-12 11:14:21 · 90642 阅读 · 4 评论