技术文档
文章平均质量分 67
探索者v
这个作者很懒,什么都没留下…
展开
-
【一起学生信】认识MAPQ
目录MAPQ 定义MAPQ的影响因素欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导...原创 2019-04-15 01:22:20 · 4573 阅读 · 0 评论 -
ggplot2 左右两个y轴
两个ggplot 图合并到一起,一个x轴两个y轴raw_data <- read_delim('./data/GO_pathway.txt', delim = '\t')head(raw_data)library(dplyr)library(Cairo)double_y_axis <- function(p1, p2){ g1 <- ggplot_gtable(ggplot_build(p原创 2016-01-03 16:59:36 · 14521 阅读 · 4 评论 -
ggplot2 保存图片 字体不协调
在使用R语言ggplot2 package画图时,导出图片总会遇到标题字体与图片不协调的情况,下面提出一种解决方案library(Cairo)library(ggplot2)p <- ggplot(mtcars, aes(factor(cyl)))# By default, uses stat="bin", which gives the count in each categoryp <-原创 2016-01-03 17:08:20 · 11269 阅读 · 0 评论 -
【跟着stackoverflow学Pandas】--Converting a Pandas GroupBy object to DataFrame-Groupby对象转换为DataFrame
我们在对数据进行清洗时,经常要用到split-apply-combine,首先对数据按照一定的标准进行split(分组),然后对每组数据进行apply(处理),最后把结果combine(合并),在这一系列操作中就必须要用到 pandas的groupby函数。原创 2017-09-17 16:19:05 · 6719 阅读 · 0 评论 -
【R】R语言指定包安装目录
仅针对Linux操作系统。查看R安装目录R # 进入R软件.libPaths()方法1 在 ~/.bashrc 中设置export R_LIBS_USER=/your/path然后采用 install.packages("ggplot2", repos='http://cran.rstudio.com/') 即可将包安装在自己制定的 /your/path 这样做的优点是别人source你的环境原创 2017-08-29 09:33:13 · 23999 阅读 · 0 评论 -
【perl】cpan 非root安装perl模块
处于无奈才用perl的,相比python,不喜欢perl。。。以下写入你的 .bashrc 或 .zshrc 文件,然后sourcesoftware=/your/path#cpan installexport PERL_LOCAL_LIB_ROOT="${software}/PERL5"export PERL_MB_OPT="--install_base ${software}/PERL5"e原创 2017-08-28 23:22:13 · 6705 阅读 · 0 评论 -
python-multiprocessing 多进程并行计算
#16.6.1.1. The Process classfrom multiprocessing import Processimport osimport timestart_time = time.time()def info(title): print(title) if hasattr(os, 'getppid'): # only available on原创 2017-08-13 14:59:33 · 17394 阅读 · 1 评论 -
【跟着stackoverflow学Pandas】- apply、applymap、map 三者使用差异
## Difference between map, applymap and apply methods in Pandas - map、apply、applymap 三者使用差异https://stackoverflow.com/questions/19798153/difference-between-map-applymap-and-apply-methods-in-pandas原创 2017-08-19 14:49:24 · 14602 阅读 · 0 评论 -
【跟着stackoverflow学Pandas】-How do I get the row count of a Pandas dataframe-获取DataFrame行数
最近做一个系列博客,跟着stackoverflow学Pandas。专栏地址:http://blog.csdn.net/column/details/16726.html以 pandas作为关键词,在stackoverflow中进行搜索,随后安照 votes 数目进行排序: https://stackoverflow.com/questions/tagged/pandas?sort=votes&p原创 2017-08-19 14:07:28 · 13598 阅读 · 0 评论 -
【跟着stackoverflow学Pandas】“Large data” work flows using pandas-pandas大数据处理流程
原文在: https://stackoverflow.com/questions/14262433/large-data-work-flows-using-pandas文中提到了利用pandas对HDFStore的操作,因为我平时没有接触过特别大的数据,所以对这里不是很熟悉,所以我计划先略过该篇。等我了解了,在做进一步整理。原创 2017-08-04 19:02:39 · 6325 阅读 · 0 评论 -
Illumina Fastq Q-score
Illumina Nextseq500 Miseq HiseqXten 测序仪 Q-score均采用下面的编码格式,仅作简要介绍。Q-scoreQ-score 在fastq中每个序列的第4行,代表测序错误的概率。Quality Score Q(X) ## Error Probability P(~X) Q40 ##原创 2017-07-25 15:52:54 · 8522 阅读 · 0 评论 -
python.snippet
python 的代码片段, 拿出来分享。#!/usr/bin/env python# -*- coding: utf-8 -*-"""desc"""# ---------# Change Logs:## ---------__author__ = 'Pidong'__email__ = '***'__version__ = '1.0.1'__status__ = 'Producti原创 2017-07-25 13:57:23 · 7219 阅读 · 0 评论 -
【跟着stackoverflow学Pandas】Renaming columns in pandas-列的重命名
Renaming columns in pandas - 列的重命名https://stackoverflow.com/questions/11346283/renaming-columns-in-pandas### 方法1```python>>> df = pd.DataFrame({'$a':[1,2], '$b': [10,20]})>>> df.columns = ['a', 'b']原创 2017-08-03 19:19:21 · 9306 阅读 · 0 评论 -
【error】postgresql relation does not exist
最近刚刚使用postgresql遇到很多问题。postgresql relation does not exist使用postgresql 查询 AAA 数据表时,提示 postgresql relation does not exist ,可是 SELECT tablename FROM pg_tables;AAA 表是存在的,好奇怪。搜索之后发现,是因为引号的问题。PostgreS原创 2017-10-18 15:37:30 · 56598 阅读 · 0 评论 -
【error】pg_dump no matching tables were found
pg_dump 备份数据时,提示 no matching tables were found, 可是表明明是存在的。最后发现,是引号的问题,于是加了双引号,可还是不行。最终在Stack Overflow发现了答案。https://stackoverflow.com/questions/13905162/postgres-dump-specific-table-with-a-capital-lett原创 2017-10-18 15:42:53 · 7080 阅读 · 3 评论 -
【一起学生信】群体结构图形—structure堆叠图
1、structure图的由来图1 假设群体亚群数等于3(k=3)的情况下的structure分析结果“Structure图”名词本身来自这种图形的分析软件——STRUCTURE。这个软件是由斯坦福大学Pritchard实验室开发的一款群体结构分析软件,最早在2000年发表在《Genetics》上[1]。图2 structure惊人的引用次数Structure软件分析达到的目的...转载 2019-02-14 16:25:58 · 13061 阅读 · 0 评论 -
【深入UCSC Genome Browser】Repeats-Self Chain
人类基因组大约有3,000,000,000个碱基对其中50%-69%是重复序列,包括转座子(SINES、LINES、Long Terminal Repeats)以及低复杂区域(比如homopolymers 和 CAG重复)和假基因(大片段重复引起)。Self Chain就是UCSC中查看大片段重复的工具。描述self chain 是染色体之间相似性的比较,相比如segdup,它修改了...原创 2018-12-06 20:49:14 · 1612 阅读 · 0 评论 -
【IP被禁用】ssh Connection refused
1. ssh 访问某云服务器ssh root@XX.XX.XXX.XXX ssh: connect to host XX.XX.XXX.XXX port 22: Connection refused 2. 换用其他服务器(跟本地不同IP)跳转,可以登录服务器。怀疑本地IP被云服务器加入黑名单3. 查看secure log 日志```sudo less /var/log/s...原创 2018-11-06 09:36:35 · 12496 阅读 · 2 评论 -
【一起学生信】 bwa -M 参数解读
bwa mem 比对时,会有一个 -M 参数,bwa官方给出的解释是 mark shorter split hits as secondary。-M 参数用来处理同一个reads比对到参考基因组上不同位置的情况。不加 -M如果加入 -M 参数,这种情况bam中的 flag= 2048 ( supplementary alignment ) # 必须做好hg19的indexbwa原创 2018-01-11 18:36:54 · 8822 阅读 · 0 评论 -
【跟着stackoverflow学Pandas】add one row in a pandas.DataFrame -DataFrame添加行
## add one row in a pandas.DataFrame -DataFrame添加行https://stackoverflow.com/questions/10715965/add-one-row-in-a-pandas-dataframe不得不说,这个问题在stackoverflow有10个回答,303 votes,339k views但是最终没有得出一个比较好的答案。原创 2017-08-05 21:52:01 · 22663 阅读 · 0 评论 -
层次聚类算法的原理及实现Hierarchical Clustering
层次聚类(HIERARCHICAL CLUSTERING)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点。创建聚类树有自下而上合并和自上而下分裂两种方法,本篇文章介绍合并方法。转载 2017-12-06 15:45:49 · 4077 阅读 · 0 评论 -
Python format 使用实例
如果需要{}是自己实际需要的字符,需要用{{}}作为转义 以下转自: https://pyformat.info/Basic formattingSimple positional formatting is probably the most common use-case. Use it if the order of your arguments is not likely to chang转载 2017-12-12 14:59:25 · 2901 阅读 · 0 评论 -
Bash 老司机也可能忽视的 10 大编程细节
Bash,作为大部分 Linux 发行版的出厂预设 Shell,因其晦涩难懂的语法设置,以及需要特别留心的编程细节,几乎成为 Linux 区别于其他操作系统的代名词。针对 Bash 中一些极容易出错的细节,我们在这里总结了 10 条编程注意事项,希望对各位泛 Linux 环境的开发者有所裨益。原文来自一位名叫 Julia Evans 的开发者博客,雷锋网编译。作为一名 Bash 脚本编写经验超过转载 2017-12-11 11:24:07 · 1684 阅读 · 0 评论 -
【python-tips】非root权限安装pip、其他包
很多时候我们拿到服务器的账号,只是一个普通用户,没有root权限,这没有关系。关键是没有pip、没有必要的python包。参考Stack Overflow给出解决方案,适用于python2.7, python3.x安装pipwget https://raw.github.com/pypa/pip/master/contrib/get-pip.pypython get-pip.py --user这里原创 2017-08-25 19:26:31 · 22283 阅读 · 2 评论 -
UCSC 人类参考基因组hg19数据下载
This directory contains a dump of the UCSC genome annotation database forthe Feb. 2009 assembly of the human genome (hg19, GRCh37 Genome ReferenceConsortium Human Reference 37 (GCA_000001405.1)).T转载 2017-11-14 21:39:15 · 14168 阅读 · 0 评论 -
一代、二代、三代测序技术原理与比较
从1977年第一代DNA测序技术(Sanger法)1,发展至今三十多年时间,测序技术已取得了相当大的发展,从第一代到第三代乃至第四代,测序读长从长到短,再从短到长。虽然就当前形势看来第二代短读长测序技术在全球测序市场上仍然占有着绝对的优势位置,但第三和第四代测序技术也已在这一两年的时间中快速发展着。测序技术的每一次变革,也都对基因组研究,疾病医疗研究,药物研发,育种等领域产生巨大的推动作用。在这里我主要对当前的测序技术以及它们的测序原理做一个简单的小结。转载 2017-11-10 14:08:02 · 282368 阅读 · 16 评论 -
【跟着stackoverflow学Pandas】 - Adding new column to existing DataFrame in Python pandas - Pandas 添加列
Adding new column to existing DataFrame in Python pandas - Pandas 添加列原创 2017-08-07 23:13:13 · 10744 阅读 · 0 评论 -
【跟着stackoverflow学Pandas】Delete column from pandas DataFrame-删除列
Delete column from pandas DataFrame - 删除列stackoverflow 地址:https://stackoverflow.com/questions/13411544/delete-column-from-pandas-dataframepandas 官方给出了对列的操作,可以参考:http://pandas.pydata.org/pandas-docs/stabl原创 2017-08-04 18:51:47 · 8214 阅读 · 0 评论 -
【跟着stackoverflow学Pandas】How to iterate over rows in a DataFrame in Pandas-DataFrame按行迭代
How to iterate over rows in a DataFrame in Pandas-DataFrame按行迭代原创 2017-08-05 11:17:04 · 11356 阅读 · 0 评论 -
pillow jpeg is required unless explicitly disabled using --disable-jpeg
ubuntu 安装 pillow 报错pip install PillowValueError: jpeg is required unless explicitly disabled using --disable-jpeg, aborting解决(官方文档解决, https://pillow.readthedocs.org/en/3.0.0/installati原创 2016-01-07 17:24:01 · 18873 阅读 · 0 评论 -
django foreignkey外键使用 相当于left join
django外键使用 一对一因为django中处于安全和方便将数据库中的表封装成模型,所以很多sql原生的功能无法使用, 比如 left join,但是我们可以使用外键(foreignkey)来满足表表直接的关系。设置模型# 在models.py 中添加# Person 模型有两个外键, School和Province# class Province(models.Model): n原创 2016-01-05 16:24:49 · 18398 阅读 · 0 评论 -
python 路径函数
本文在http://www.jb51.net/article/21007.htm的基础上修改1: os.listdir(path) //path为目录 功能相当于在path目录下执行dir命令,返回为list类型 print(os.listdir(‘..’)) 2: os.path.walk(path,visit,arg) path :是将要遍历的目录 visit :是一个函数指原创 2016-01-21 15:48:41 · 4646 阅读 · 0 评论 -
python lxml包学习笔记
python lxml包用于解析XML和html文件,可以使用xpath和css定位元素,个人认为相对于BeautifulSoup功能更加强大,更加灵活。本文根据lxml官方文档和自己的理解列出常用的函数, 本文代码为python3.4, lxml2.0 lxml:http://lxml.de/ 支持:python2 python3解析XML, 以pubmed文献数据库文本解析为例导原创 2015-12-31 16:05:55 · 19419 阅读 · 0 评论 -
XML包使用
最近更新请参照 http://cangfengzhe.github.comhtmlParse(url)解析网页,或XMLxml 转换成data.frame“`r library(XML) library(plyr) url_path_pre <- ‘http://www.rcsb.org/pdb/rest/describePDB?structureId=4hhb,1hhb’ query原创 2015-06-17 18:05:57 · 2567 阅读 · 0 评论 -
R语言sem包实现通径分析
结构方程模型(Structural Equation Modeling,SEM)是一种建立、估计和检验因果关系模型的方法。模型中既包含有可观测的显在变量,也可能包含无法直接观测的潜在变量。结构方程模型可以替代多重回归、通径分析、因子分析、协方差分析等方法,清晰分析单项指标对总体的作用和单项指标间的相互关系。本文主要应用R语言的sem包实现通径分析. 如当自变量数目比较多,且自变量间相互关系比较复原创 2015-11-09 10:18:09 · 27760 阅读 · 11 评论 -
R语言 并行处理
具体的不懂,只记录实现parallel packageR自带的包,可以实现并行处理。library(parallel)detectCores(logical = F) #获得实际核数cl <- makeCluster(getOption("cl.cores", 4)) # 设置并行核数为4clusterExport(cl=cl, varlist=c("text.var", "ntv", "原创 2015-06-17 18:12:58 · 12920 阅读 · 0 评论 -
mac mysql 插入中文乱码
参考 http://www.cnblogs.com/Logen/p/3562215.html一、场景呈现 Mac 下Eclipse+mysql开发j2ee的时候,在页面像数据库中插入中文数据的时候,数据库会报错。而且即使插入成功,在控制台或者其他可视化数据库操作软件看数据发现都是??,错误的原因是数据库的编码问题。 二、问题解决方案 假设下文是对mysql基本转载 2015-10-02 18:08:48 · 3739 阅读 · 0 评论 -
R语言与统计笔记
正态性检验Shapiro-Wilk Normality Test样本量在3-5000时使用 shapiro.test(x) x a numeric vector of data values. Missing values are allowed, but the number of non-missing values must be between 3 and 5000.## ## shp原创 2015-06-17 18:09:38 · 5730 阅读 · 0 评论 -
R语言常用函数集合
meltmelt(data, id.vars, measure.vars, variable.name = "variable", ..., na.rm = FALSE, value.name = "value", factorsAsStrings = TRUE)id.vars 表示固定不变的列 measure.vars 控制变量,需要处理的列,将这些列名作为某一列的数值 variabl原创 2015-06-17 18:08:05 · 14578 阅读 · 0 评论 -
ggplot2 学习
theme(axis.text.x=element_text(angle=90, size=8, vjust=0.8)) 旋转x轴标题theme(plot.margin = unit(c(0.1, 0, 0, 0),"cm")) 为图片设置margin, 顺序遵循 上右下左library(gridExtra)grid.arrange(g1, g2, g3, g4, main, sub, lef原创 2015-06-17 18:01:20 · 4213 阅读 · 0 评论