自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

求知:数据科学家之路

爱学习爱女神

  • 博客(20)
  • 收藏
  • 关注

原创 机器学习:方差Variance与偏差Bias

在评估机器学习算法时,会经常涉及到方差与偏差,在网上找到很好说明两者的图:

2016-12-18 13:00:38 670 1

原创 R语言:快速读取txt文件

用R语言来读取600多M的txt文件,使用常用的read.table,太费时间。想起之前用readr包来读取csv、spss的、sas、excel的很快,便尝试了翻。直接上代码:> library(readr)> a1=Sys.time()> BRCA_RNAseqGene<-read_delim("20151101-BRCA-RNAseqGene.txt", "\t", escape_dou

2016-12-16 18:13:09 23753

原创 R语言:PPS抽样

今天有朋友咨询我怎么写PPS抽样的代码,试着找了下,找到一个实现PPS抽样的R包。百度百科: PPS 抽样是指按概率比例抽样,属于概率抽样中的一种。是指在多阶段抽样中,尤其是二阶段抽样中,初级抽样单位被抽中的机率取决于其初级抽样单位的规模大小,初级抽样单位规模越大,被抽中的机会就越大,初级抽样单位规模越小,被抽中的机率就越小。就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中

2016-12-15 22:52:07 10456

原创 altify:用微软的深度学习理解图片

github上有个项目叫altify,使用微软的视觉学习来理解图片,地址:https://github.com/ParhamP/altify下面直接上代码,学习使用。1、altify 打开cmd,输入:pip install altify便可以下载和安装altify包2、登陆微软的深度学习服务,并订阅免费的服务: 网址:https://www.microsoft.com/cognitive-se

2016-12-15 13:46:56 949

原创 R语言:Sys.sleep()与Sys.time()

R语言实现获取当前的时间以及让语言计算停顿下,这次介绍三个函数:Sys.sleep()Sys.time()proc.time()Sys.sleep() 让R语言在做计算时停顿下,减缓运行速度#睡眠2秒Sys.sleep(2)Sys.time() 获取当前的系统时间,达到秒的精度。> Sys.time()[1] "2016-12-14 23:52:10 CST"proc.time()

2016-12-15 00:10:45 18143

原创 通用的机器学习框架

这里介绍了机器学习的套路,详细的请参见这个博客:http://blog.kaggle.com/2016/07/21/approaching-almost-any-machine-learning-problem-abhishek-thakur/

2016-12-12 12:33:21 600

原创 在windows下使用jupyter notebook

在查询ipynb文件时发现了在windows下使用ipython的方法,这次就来做下介绍。1,首先,安装Anaconda,网址为:https://www.continuum.io/downloads/,下载与你电脑版本对应的,安装好。2,在电脑左下角的开始处搜索:jupyter notebook,并点击它打开,会出现一个黑色的弹窗, 很快在浏览器中自动打开一个界面, 3,使用ipython功能

2016-12-12 11:35:33 17425

原创 ADMM(alternating direction method of multipliers)

这个学期,老师让我们研究ADMM算法,这次就从表面来介绍下ADMM算法,待下次再详细具体的对ADMM进行梳理下。斯坦福的S. Boyd, N. Parikh, E. Chu, B. Peleato, and J. Eckstein在2011发表了论文:《Distributed Optimization and Statistical Learning via the Alternating Dire

2016-12-10 20:01:01 8024

原创 python:用setup.py安装第三方包packages

这次来介绍下python第三方包的安装,前面介绍了3种方式,我们这次再介绍一种方式。前两种方式见下面的链接。pip installhttp://blog.csdn.net/xxzhangx/article/details/52740227easy_install 与 pip.exe installhttp://blog.csdn.net/xxzhangx/article/details/52337

2016-12-10 15:17:56 147358 4

原创 重叠区间的个数

题目:给定多个可能的重叠的区间,找出重叠区间的个数。伪代码:区间的定义如下:class Interval{ int start; //起点 int end; //止点 Interval (int a,int b){ start =a; end = b; }}首先,要定义区间的类,实现Comparable接口,含有起点与止点的值和类型,还要重写用于排序的compa

2016-12-09 22:11:20 3075

原创 R语言:lengths计算列表list中元素的个数

这次介绍一个大家可能会用到的函数,但是又与我们常用的函数有所区别。lengths一看,还以为是length函数,我们要介绍的函数后面多了一个s,专门用于计算列表list的长度,下面用例子来呈现我们的函数。首先,我们先来介绍length函数,再来介绍lengths,最后对两个差异的地方进行对比,查看区别。length Get or set the length of vectors (includ

2016-12-09 21:19:17 73766

原创 matlab 调用mex -setup问题

装了visual studio 2015,可是在matlab中调用失败了。>> mex -setupError using mexNo supported compiler or SDK was found. For options, visit http://www.mathworks.com/support/compilers/R2015a/win64.html.尝试去装SDK,还是不行。

2016-12-08 14:08:31 9528 6

原创 最大下标距离

题目 : 给定一个整型数组,找出最大的下标距离j−1j-1,当且仅当A[i]<A[j]A[i]<A[j]和i<ji<j。伪代码int maxIndexDistance(int A[]){ if (A==null || A.length<2) return 0; boolean inDescSeq[] = new boolean[A.length]; int min = A[0],n=A

2016-12-07 14:47:15 760 1

原创 数组旋转

题目:返回将一维数组向右旋转k个位置的结果。比如,一维数组{1,2,3,4,5},当k=2时,返回结果是{4,5,1,2,3}。要求常数级空间复杂度,允许修改原有数组。伪代码这里写代码片R语言R语言实现这个功能上,采用两种方式:R语言自带的rev函数自己写的翻转函数R语言带的rev函数rotateK <- function(a,k){ if (is.null(a) || length(

2016-12-05 13:17:46 1714

原创 R语言:翻转

这期介绍数组、字符串的翻转,元素间翻转,元素内翻转,采用rev、str_rev函数,并给出几个例子。rev元素间翻转> x <- c(1:5, 5:3)> x[1] 1 2 3 4 5 5 4 3> rev(x)[1] 3 4 5 5 4 3 2 1> x <- c("ABC", "DEF", "GHIJ")> rev(x)[1] "GHIJ" "DEF" "ABC" str_rev

2016-12-05 12:33:46 9141

原创 R语言:图形

常用的图形,这里给出案例:barplot条形图、单向量条形图> attach(mtcars)The following object is masked from package:ggplot2: mpg> names(mtcars) [1] "mpg" "cyl" "disp" "hp" "drat" "wt" [7] "qsec" "vs" "am"

2016-12-04 23:44:04 2036

原创 R语言软件版本自动更新

这次介绍如何利用R语言命令自动更新你所使用的R语言软件的版本。 代码如下:install.packages("installr")library(installr)updateR()运行命令后,出现如下的提示: ok,保证网络畅通 下载完后会提示安装,安装目录,安装成功后,提示是否将old library复制到new library中。

2016-12-04 22:48:27 22768 2

原创 两数之和(三)

题目:设计一个类,包含如下两个成员函数: Save(int input) 插入一个整数到一个整数集合里。 Test(int target) 检验是否存在两个数和为输入值。如果存在这两个数,则返回true;否则返回false。注意:允许有相同的元素。伪代码:这里写代码片R语言:two_numbers_3<-function(a){ s= unique(a) for

2016-12-02 12:48:14 560

原创 两数之和(二)

题目:给定一个整型的数组,找出其中的两个数使其和为某个指定的值,并返回这两个数的下标(数组下标是从0开始)。假设数组元素的值各不相同,则要求时间复杂度为O(n),n为数组的长度。伪代码:这里写代码片R语言:> res <- list()> index <- list()> k =0> i = 1> two_sum_2<-function(a,target){ if (is.null(

2016-12-02 00:15:51 677

原创 两数之和 (一)

题目: 给定一个整型数组,是否能找出其中的两个数使其和为某个指定的值?伪代码:boolean hasSum(int[] A, int target){ boolean res = false; if(A ==null || A.length<2) return res; Arrays.sort(A); int i =0,j=A.length-1; wh

2016-12-01 12:55:36 1487

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除