自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

求知:数据科学家之路

爱学习爱女神

  • 博客(196)
  • 收藏
  • 关注

原创 ADMM(alternating direction method of multipliers)

这个学期,老师让我们研究ADMM算法,这次就从表面来介绍下ADMM算法,待下次再详细具体的对ADMM进行梳理下。斯坦福的S. Boyd, N. Parikh, E. Chu, B. Peleato, and J. Eckstein在2011发表了论文:《Distributed Optimization and Statistical Learning via the Alternating Dire

2016-12-10 20:01:01 8024

原创 python:用setup.py安装第三方包packages

这次来介绍下python第三方包的安装,前面介绍了3种方式,我们这次再介绍一种方式。前两种方式见下面的链接。pip installhttp://blog.csdn.net/xxzhangx/article/details/52740227easy_install 与 pip.exe installhttp://blog.csdn.net/xxzhangx/article/details/52337

2016-12-10 15:17:56 147410 4

原创 重叠区间的个数

题目:给定多个可能的重叠的区间,找出重叠区间的个数。伪代码:区间的定义如下:class Interval{ int start; //起点 int end; //止点 Interval (int a,int b){ start =a; end = b; }}首先,要定义区间的类,实现Comparable接口,含有起点与止点的值和类型,还要重写用于排序的compa

2016-12-09 22:11:20 3075

原创 R语言:lengths计算列表list中元素的个数

这次介绍一个大家可能会用到的函数,但是又与我们常用的函数有所区别。lengths一看,还以为是length函数,我们要介绍的函数后面多了一个s,专门用于计算列表list的长度,下面用例子来呈现我们的函数。首先,我们先来介绍length函数,再来介绍lengths,最后对两个差异的地方进行对比,查看区别。length Get or set the length of vectors (includ

2016-12-09 21:19:17 73771

原创 matlab 调用mex -setup问题

装了visual studio 2015,可是在matlab中调用失败了。>> mex -setupError using mexNo supported compiler or SDK was found. For options, visit http://www.mathworks.com/support/compilers/R2015a/win64.html.尝试去装SDK,还是不行。

2016-12-08 14:08:31 9528 6

原创 最大下标距离

题目 : 给定一个整型数组,找出最大的下标距离j−1j-1,当且仅当A[i]<A[j]A[i]<A[j]和i<ji<j。伪代码int maxIndexDistance(int A[]){ if (A==null || A.length<2) return 0; boolean inDescSeq[] = new boolean[A.length]; int min = A[0],n=A

2016-12-07 14:47:15 760 1

原创 数组旋转

题目:返回将一维数组向右旋转k个位置的结果。比如,一维数组{1,2,3,4,5},当k=2时,返回结果是{4,5,1,2,3}。要求常数级空间复杂度,允许修改原有数组。伪代码这里写代码片R语言R语言实现这个功能上,采用两种方式:R语言自带的rev函数自己写的翻转函数R语言带的rev函数rotateK <- function(a,k){ if (is.null(a) || length(

2016-12-05 13:17:46 1714

原创 R语言:翻转

这期介绍数组、字符串的翻转,元素间翻转,元素内翻转,采用rev、str_rev函数,并给出几个例子。rev元素间翻转> x <- c(1:5, 5:3)> x[1] 1 2 3 4 5 5 4 3> rev(x)[1] 3 4 5 5 4 3 2 1> x <- c("ABC", "DEF", "GHIJ")> rev(x)[1] "GHIJ" "DEF" "ABC" str_rev

2016-12-05 12:33:46 9142

原创 R语言:图形

常用的图形,这里给出案例:barplot条形图、单向量条形图> attach(mtcars)The following object is masked from package:ggplot2: mpg> names(mtcars) [1] "mpg" "cyl" "disp" "hp" "drat" "wt" [7] "qsec" "vs" "am"

2016-12-04 23:44:04 2036

原创 R语言软件版本自动更新

这次介绍如何利用R语言命令自动更新你所使用的R语言软件的版本。 代码如下:install.packages("installr")library(installr)updateR()运行命令后,出现如下的提示: ok,保证网络畅通 下载完后会提示安装,安装目录,安装成功后,提示是否将old library复制到new library中。

2016-12-04 22:48:27 22776 2

原创 两数之和(三)

题目:设计一个类,包含如下两个成员函数: Save(int input) 插入一个整数到一个整数集合里。 Test(int target) 检验是否存在两个数和为输入值。如果存在这两个数,则返回true;否则返回false。注意:允许有相同的元素。伪代码:这里写代码片R语言:two_numbers_3<-function(a){ s= unique(a) for

2016-12-02 12:48:14 560

原创 两数之和(二)

题目:给定一个整型的数组,找出其中的两个数使其和为某个指定的值,并返回这两个数的下标(数组下标是从0开始)。假设数组元素的值各不相同,则要求时间复杂度为O(n),n为数组的长度。伪代码:这里写代码片R语言:> res <- list()> index <- list()> k =0> i = 1> two_sum_2<-function(a,target){ if (is.null(

2016-12-02 00:15:51 677

原创 两数之和 (一)

题目: 给定一个整型数组,是否能找出其中的两个数使其和为某个指定的值?伪代码:boolean hasSum(int[] A, int target){ boolean res = false; if(A ==null || A.length<2) return res; Arrays.sort(A); int i =0,j=A.length-1; wh

2016-12-01 12:55:36 1487

原创 Linux : E: Unable to locate package XXX

在使用Linux下载packages时报错:-----好多不认识的------------E: Unable to locate package scipy遇到这种问题,通常是由于镜像源没有更新下。 更新命令如下:sudo apt-get update然后稍等下,等更新完再去使用。 ok 了,可以使用了。

2016-11-23 21:15:47 7662

原创 [Anaconda] command not found: conda

参考文章:http://blog.csdn.net/u013581118/article/details/52081987在你的主目录(自己的权限目录)下,使用下面的命令:export PATH=~/anaconda2/bin:$PATHconda --v 如果结果是你的anaconda2的版本号,那就成功了!

2016-11-22 21:56:46 20348 9

原创 R与mongodb

本文系谷歌时发现,代码很好,注释全面,故先码过来,有需要的可以先学习。#http://cran.r-project.org/web/packages/rmongodb/vignettes/rmongodb_introduction.htmllibrary(rmongodb)# Connecting R to MongoDB ------------------------------------

2016-11-15 16:50:21 2798 1

转载 余弦距离、欧氏距离和杰卡德相似性度量的对比分析

本文系转载,发现分析的很好,就转过来咯。哈哈哈原文: http://www.cnblogs.com/chaosimple/p/3160839.html http://blog.sina.com.cn/s/blog_4b59de07010166z9.html1、余弦距离 余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。向量,是多维空间中有方向的

2016-11-14 12:44:30 2098

原创 R语言:计算各种距离

在做分类时常常需要估算不同样本之间的相似性(Similarity Measurement),这时通常采用的方法就是计算样本间”距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。本文的目的就是对常用的相似性度量做一个总结。本文目录:闵可夫斯基距离欧氏距离曼哈顿距离切比雪夫距离标准化欧式距离马氏距离夹角余弦汉明距离杰卡德距离&杰卡德相似系数相关系

2016-11-13 23:40:20 77645 10

原创 R语言技巧:对读取常用的集中格式的介绍

这期主要介绍几种常用格式的读取方法索引,内容如下:读取csv格式read_csvread.csv读取excel文件read_excel-用gdata读取excel文件读取spss 软件的sav格式文件read_sav两个方式读取sav格式文件读取sas软件的sas格式文件read_sas读取stata软件的stata格式文件read_stata

2016-11-07 16:57:35 767 1

原创 R语言技巧:对stata软件文档来读取

前面几期介绍了如下内容:读取excel文件 对比方法读取csv格式文件对比方法read.csv读取sav格式文件读取spss 的sav格式文件读取sas软件的sas格式的文件本期介绍读取stata软件的文件 下面来给出代码的格式:library(haven)dataset <- read_stata(NULL)View(dataset)关于对stata软件文件的读取,可以查看其帮助文

2016-11-07 15:32:51 6567

原创 R语言技巧:读取sas软件的sas格式文件

前面几期介绍了如下内容:读取excel文件 对比方法读取csv格式文件对比方法read.csv读取sav格式文件读取spss 的sav格式文件这期介绍读取sas软件的sas格式文件,代码如下:library(haven)dataset <- read_sas(NULL)View(dataset)关于read_sas函数的具体用法,请参考其帮助文档。

2016-11-07 15:26:13 15854 2

原创 R语言技巧:读取spss的sav格式文件

上几期介绍了R语言读取excel、csv格式,这期将介绍读取SPSS软件的数据。前面有一次介绍了2种读取方式,结合着学习下。前面几期:读取excel文件 对比方法读取csv格式文件对比方法read.csv读取sav格式文件读取spss 的sav格式文件这期介绍haven包读取sav格式文件library(haven)dataset <- read_sav(NULL)View(datase

2016-11-07 15:20:03 27678

原创 R语言技巧:读取excel文件

上一期介绍了读取:csv格式这期介绍读取excel文件。代码如下:library(readxl)dataset <- read_excel(NULL)View(dataset)关于read_excel 函数,见其帮助文档前面介绍了另外一种读取excel文件的方式,可以对比下。 采用gdata包来读取。gdata包读取excel文件

2016-11-07 15:05:05 15198

原创 R语言技巧:读csv格式的文件

最近Rsudio更新https://www.rstudio.com/products/rstudio/download/了,对我们常用的几种文件格式都作用了封装,直接点击按钮就可以对文件读取啦,感觉好强大好神奇的说。下面来一个个的给出代码!library(readr)dataset <- read_csv(NULL)View(dataset)当然,你也许会问,已经有了read.csv函数,为啥还

2016-11-07 14:59:59 17905

原创 LaTeX系列:基本框架

用latex写文档的基本套路这里给出若干个框架,跟着框架来写,学latex就很容易啦! 注:这里的若干个是到后面还会增加的缘故。第一个例子代码如下\documentclass[11pt]{article}%=========================宏包区=================%\usepackage{CJK}%==============================

2016-11-07 14:41:38 1706

转载 Lasso思想及算法

本文转载自:http://liuzg202.blog.163.com/blog/static/294271962010102592332511、只有这么几个人在做LASSO,他们都是大牛,你可以直接GOOGLE他们的主页,看他们在这块发了什么文章。 yu bin, zhu ji, zhang tong, hui zou, yuan ming, Nicolai Meinshausen, Peter

2016-11-02 00:24:31 16914 3

原创 R语言:读取excel的perl问题

刚给朋友实验读取excel文件出错了,我的电脑却没有问题。报的错误是:Error in findPerl(verbose = verbose) : perl executable not found. Use perl= argument to specify the correct path. Error in file.exists(tfn) : invalid 'file' argumentb

2016-11-01 20:22:37 6048 1

原创 R语言:读取中文数据乱码的解决方案

R语言不是中国人开发的,自然对中文的处理上没有特别考虑,但是我们依然可以处理。一个例子,R语言读取excel表的中文数据,关于excel表的读取请看博客R语言包gdata读取excel文件。setwd("..")#设置工作目录getwd()#查看工作目录> a<-read.xls("watermelon.xlsx",sheet=1,header =T)> a 缂栧彿 鑹叉辰 鏍硅拏 鏁插

2016-11-01 18:26:27 40728 5

原创 R语言:小数点位数的设置

R语言中对小数点的位数的设置经常用数据分析,有时不同的文件的小数位数不一样,但是我们可以让它们的位数保持一致的,下面的介绍就是设置小数位数。使用options函数> options(digits) 默认为7位> a=0.234333323#9位> a[1] 0.2343333下面开始设置下> options(digits=3)> a=0.34434434#8位> a[1] 0.344

2016-10-30 22:29:15 67978 2

原创 git常用的命令

git配置这篇博客中有对git配置的介绍,具体的请看图片。这里将讲当你把github在本地配置好后,然后将github上的库克隆到本地后的操作。将介绍一下几个命令:git add git commit git statusgit loggit push 克隆git clone git@github.com:zhangdm/LaTeX.git将你要提交的文件放到克隆到本地的文件夹中。

2016-10-28 19:48:08 336

原创 git 问题:permission denied

使用git 克隆clone时报错,查询好久,终于解决。在Git Bash中输入命令:ssh-keygen -t rsa -C &quot;邮箱&quot;#获取pub密钥 cat ~/.ssh/id_rsa.pub将以ssh-rsa开头的一长段字符复制到后面一幅图的中。 将已有的删除,新建New SSH key,title随意起一个,ssh-rsa开的复制到key中。 测试使用代码:ssh -T git@g

2016-10-28 00:11:17 17449

原创 R语言:斐波那契数列

用R语言实现斐波那契数列#斐波那契数列#1,1,2,3,5,8,13,21,34,....a=1;b=1qing <- function(x){ for (i in 1:5){ print(a) c = a +b a =b b =c } }qing(5)[1] 1[1] 1[1] 2[1] 3[1] 5# c = a +b 将a+b 赋

2016-10-27 19:55:47 21179 1

原创 读《我喜欢这个功利的世界》

终于打咪蒙的《我喜欢这个功利的世界》读完,感觉很好,改变了我很多想法,少了偏见。有正三观的功效,很棒很棒!

2016-10-26 23:26:11 1043

原创 R语言:自定义函数

R语言系列:自定义function在用R语言做各种事物时,用户自定义函数是不可或缺的。这期来讲讲如何自定义R的function。首先要介绍的是function的基本框架:myfunction <- function(arg1, arg2, ... ){statementsreturn(object)}函数名称为myfunction arg1,arg2 为参数statements 为函数

2016-10-25 17:28:48 94483 3

原创 TCGA数据下载:R包RTCGAToolbox介绍

前面介绍了3种获取TCGA数据的方法:使用TCGA2STAT、TCGAbiolinks、RTCGA。这里再介绍一个包:RTCGAToolbox包,这个包是我最为推荐的,原因是我使用时它下载数据最快、最为稳定可靠。 RTCGAToolbox下载方法## try http:// if https:// URLs are not supportedsource("https://bioconduc

2016-10-24 18:35:12 8155 17

原创 TCGA数据下载:R包RTCGA介绍

前几天去外地参加婚礼,中间耽误了好些时间,没能做好持续更新博客,感到罪过好大啊。想到自己始终以Scalers的持续迭代进步为导航准绳,这次中断了,做了蛮久的事又要重新再来。 根据博文 TCGA数据下载方法简介中的顺序J继续来介绍R包RTCGA包。 R包下载## try http:// if https:// URLs are not supportedsource("https://bio

2016-10-23 13:24:16 7126

原创 学习的事

学习的事,很重要,很好玩,真的!兄弟聊天 说到学习,今天又被刷新了思想。这个事来自和我的一个兄弟的交谈,说到他最近找工作,尽快如何,年薪多少等。他已经签约了,可是仍有点不满意,相比他的室友,他的年薪极其的低,不够人家的一半,对于相同的专业,同为一个宿舍住的,每天一起学习的,找的工作薪水竟然比人家少一半。这个事真的很让他没面子,说起来好笑。我问了原因,莫非人家的代码能力比你强?他解释道,其实室友的

2016-10-15 23:38:55 519 1

原创 TCGA数据下载:R包TCGAbiolinks介绍

昨天介绍了TCGA2STAT这个R包,今天来继续根据博文 TCGA数据下载方法简介中的顺序来介绍R包TCGAbiolinks包,其下载数据类型类似于TCGA2STAT,但是又比它难懂。 R包的下载## try http:// if https:// URLs are not supportedsource("https://bioc.ism.ac.jp/biocLite.R")biocLi

2016-10-14 23:56:15 19705 2

原创 TCGA数据下载:R包TCGA2STAT介绍

上期介绍了若干种获取TCGA数据的方法,今天这期会落点于TCGA2STAT这个R包的介绍上,一步步的来说明下载方法,哪些数据是可以下载到的。 R包的下载install.packages("TCGA2STAT")选择如何的镜像,咱们在中国,就选择china,这样的话下载速度会很快,也容易安装R包成功。 可下载的数据1、 RNASeq ,默认是count类型,是指下载raw read cou

2016-10-13 23:18:10 10308 10

原创 进步

想想自己好久没有感觉到进步的速度了,有点焦虑、有点有点悲伤如何你在较长的周期内没有进步,你会怎么办?也许你认为这个是事在人为吧,进步不可以强求,随时间的迭代,我们自然被时间拖拉带动自己的进步。可这样的进步,你可以忍受吗?被时间拖拉硬拽,最后你还会是你吗?时间会让你丢失颜色,人已变化,那个时候,只留下你跟不上社会的样子,别的也不剩下什么了。被时间拖拽,不如自己强力推动进步。关于进步,也许有很多鸡汤博

2016-10-13 18:22:39 738 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除