[置顶] R语言 非标准化求值(Non-standard evaluation, NSE)

R语言 非标准化求值(Non-standard evaluation, NSE)非标准化求值(Non-standard evaluation, NSE)在R语言中起着重要的作用,在交互式数据操作中可以简化操作。Hadley Wickham大神的ggplot2,dplyr,plyr 等神器均用到了NSE,但是理解起来比较困难,我们这里做简单介绍. 先来简单认识一下几个函数。substitute我们在...
阅读(4831) 评论(3)

Illumina Fastq Q-score

Illumina Nextseq500 Miseq HiseqXten 测序仪 Q-score均采用下面的编码格式,仅作简要介绍。Q-scoreQ-score 在fastq中每个序列的第4行,代表测序错误的概率。Quality Score Q(X) ## Error Probability P(~X) Q40 ##...
阅读(11) 评论(0)

python.snippet

python 的代码片段, 拿出来分享。#!/usr/bin/env python # -*- coding: utf-8 -*-""" desc """# --------- # Change Logs: # # ---------__author__ = 'Pidong' __email__ = '***' __version__ = '1.0.1' __status__ = 'Producti...
阅读(9) 评论(0)

Dockerfile 模版

最近一直在用docker,总结了一个靠谱的模版,分享给大家。From ubuntu:14.04MAINTAINER pidong.li@genetronhealth.comRUN echo deb http://mirrors.163.com/ubuntu/ trusty main restricted universe multiverse>/etc/apt/sources.list RUN ec...
阅读(18) 评论(0)

pip国内镜像(清华大学镜像)

网上搜到的pip国内镜像大部分是豆瓣的 http://pypi.douban.com/simple/ 但是根本不全,很多包没有所以推荐清华大学的https://pypi.tuna.tsinghua.edu.cn/simple临时使用可以在使用pip的时候加参数-i https://pypi.tuna.tsinghua.edu.cn/simple 例如:pip install -i https://...
阅读(27) 评论(0)

Celery分布式应用

最近有应用需要部署到不同的服务器上运行,但是有没有PBS这样的调度系统,就想起来Python的调度神器 Celery。现在针对我的实际应用做一些记录。1. 安装因为我并不注重结果而是把命令拿到不同的机器上运行,所以消息代理和结果保存我都选择了 Redis# 只需要在一台服务器上安装 redis,其他服务器均使用该服务器redis即可 sudo apt-get install redis-server...
阅读(33) 评论(0)

ValueError: A 0.7-series setuptools cannot be installed with distribute.

在安装python的distribute时会遇到这个问题: ValueError: A 0.7-series setuptools cannot be installed with distribute.原因是 Distribute 不允许安装 Setuptools 0.7+ ,所以需要把Distribute 和 Setuptools 全部删除掉,重新安装 rm */lib/python2.7/...
阅读(73) 评论(0)

Kendo UI grid API 获取 filter 后的所有数据

Kendo UI grid 在处理表格数据上,方便、快捷。 出于需要,希望在 filter 表格后,得到所有的表格数据,当然可以在后台获取,但是通过kendo ui 的API在前端处理更为便捷。// 获取 #grid 下的datasource var dataSource = $("#grid").data("kendoGrid").dataSource;// 获取过滤条件 var filters...
阅读(1017) 评论(0)

python 随机抽取Fastq文件

参考 http://pythonforbiologists.com/index.php/randomly-sampling-reads-from-a-fastq-file/最近要做一个二代测序的模拟,所以网上找了个小脚本,做了些注释,希望能够帮助大家。from __future__ import division import randomnumber_to_sample = 3000000 nu...
阅读(741) 评论(0)

Linux更改ftp端口和Forklift破解keygen

Linux更改ftp端口和Forklift破解keygen在报错了无数次后,找到了对的方法。。。 首先ftp默认传输端口号是20,系统对ftp监听端口号是21,你要改两个端口号,这两个端口号不能与系统中的其他端口号冲突,先来查看一下,假如你数据传输端口号改成2015,监听改成2016,输入以下代码。 netstat -tunlp | grep 2015 netstat -tunlp | gr...
阅读(655) 评论(0)

python-装饰器封装try-exception

本文更新地址:http://blog.csdn.net/tanzuozhev 采用try-exception是python捕获异常的常用方式,但在代码频繁的使用着实麻烦,所以采用装饰器对try-catch进行了封装。import sys,traceback def try_except(f): def handle_problems(*args, **kwargs): try...
阅读(3386) 评论(0)

R语言手动计算主成分分析(PCA)及其在R函数的实现

R语言手动计算主成分分析(PCA)及其在R函数的实现了解PCA的原理,但总是无法用R语言实现,这次算是有个教程。  转自:http://blog.163.com/xiaoji0106@126/blog/static/13613466120133185842687/       主成分分析(principal component analysis,PCA)是一种降维技术,把多个变量化为能够反映原始变...
阅读(4705) 评论(0)

R语言-绘制ROC曲线

浅谈ROC曲线机器学习中很常见的一个大类就是二元分类器。很多二元分类器会产生一个概率预测值,而非仅仅是0-1预测值。我们可以使用某个临界点(例如0.5),以划分哪些预测为1,哪些预测为0。得到二元预测值后,可以构建一个混淆矩阵来评价二元分类器的预测效果。所有的训练数据都会落入这个矩阵中,而对角线上的数字代表了预测正确的数目,即True Positive+True Nagetive。同时可以相应算出...
阅读(8434) 评论(2)

ggplot2-一页多图(不同来源, 灵活绘制)

本文更新地址:http://blog.csdn.net/tanzuozhev本文在 http://www.cookbook-r.com/Graphs/Multiple_graphs_on_one_page_(ggplot2)/ 的基础上加入了自己的理解ggplot2 的分面(facet)可以绘制一页多图, 但是必须是来自同一个数据集的图形,局限性很大. 如果我们有多个不同来源的图形,想绘制到一张图...
阅读(5222) 评论(0)

ggplot2-分面(facet) 一页多图

ggplot2的数据分面就是根据数据中的不同分组,绘制多个图形....
阅读(4656) 评论(0)

ggplot2-为图形添加直线

ggplot2 为图形添加直线...
阅读(6186) 评论(0)
73条 共5页1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:338634次
    • 积分:3780
    • 等级:
    • 排名:千里之外
    • 原创:51篇
    • 转载:11篇
    • 译文:11篇
    • 评论:22条
    博客专栏
    最新评论