- 博客(22)
- 收藏
- 关注
原创 Fedora17安装 rhabse时Thrift安装错误解决方法
thrift安装后就可以安装thbase,在R中,执行R CMD INSTALL rhbase_1.1.1.tar.gz会出现如下的错误:找不到TProcess.h执行pkg-config –cflags thrift如果没有任何输出,则需要执行export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig/这样再安装rhbase时可能还是会出现
2014-03-20 10:19:23 1136
原创 logistic regression与R
logistic regression可以用在CTR(Click Through Rate)预估上,即通常所说的点击率预估。点击率预估的意义在于,在电子商务中,可以通过把点击率高的商品放在首页或者重点推荐给用户,这样用户可以有更大的机会看见这些易受欢迎的商品,这样就可以促进销量,提高商家的利润。logistic函数也成sigmoid函数是在logistic回归中使用的函数,其形式为$35*d_
2014-03-17 21:25:04 1971
原创 Fedora17下MPI的安装及配置
linux下MPI的版本为openmpi,在fedora下安装很容易,执行:yum install openmpi openmpi-devel一句命令就安装完毕,但是安装完之后输入mpi+Tab会发现命令没有自动不全,说明openmpi没有被安装到系统默认的搜索路径中,需要配置一下,执行:whereis openmpi输出为openmpi: /lib/openmpi /usr/
2014-03-17 20:37:46 2231
原创 fedora17中hadoop2.2.0在eclipse下运行wordcount
hadoop2.2.0的eclipse插件在http://download.csdn.net/detail/acm_er6/6964345
2014-03-17 15:30:34 1345 2
转载 R语言的数据转换: split – apply – combine 模式
在数据分析中,有许多问题可以由类似的类型和方法步骤解决,可称之为模式,设计模式或者分析模式。下面要讨论的是数据转换的一个常用模式:split – apply – combine。其解决之道,在R语言中,有3种方式:(1) for 显式循环,但是这种方式的缺点也很明显,代码长,易出错,也难以并行化;(2) 拜R语言的向量计算特点所赐,在R当中,大多数问题不需要用显示循环方式,而代之以base
2014-03-16 12:00:15 1726
原创 R中安装rgl时“configure: error: missing required library GL”错误的解决方法
今天使用R时需要画一张3D图,于是在R中安装rgl包,由于依赖关系,安装过程中会提示如下的错误,根据提示可以看到是因为没有GL库,所以就需要安装gl的包,在Fedora17中开源的gl包为mesa,所以在root下需要执行yum install mesa*就可以把相关的包以及开发包下载并安装。安装好之后在R下继续执行install.pakages("rgl"),系统还是会报一样的错误,这时
2014-03-15 23:50:22 4207 1
原创 R软件读取中文编码的数据错误解决方法
今天下载了一个csv文件,用vim打开后发现乱码,编码出现了问题,vim中文编码是UTF-8,我觉得这个文件可能是GBK,所以出现了问题,所以需要设置vim,打开家目录下的.vimrc文件,如果没有就新建一个,在里面添加set encoding=utf-8set fileencodings=ucs-bom,utf-8,cp936set fileencoding=gb2312set terme
2014-03-12 11:53:15 3881
原创 大数据之起步搭开发环境
上个星期电脑被我搞坏了之后很多软件就没再安装了,昨天看到阿里宣传的大数据比赛,于是连夜开始重新安装数据挖掘的各种软件,下面就记录一下,也算是记下我比赛的进程吧:系统:3.9.10-100.fc17.i686.PAE包管理软件为Yum,有了Yum,再也不担心软件安装的依赖性问题,首先安装Java,由于之前安装Textlive中依赖Java,所以这里就没必要再安装了,有了Java后就安装Mah
2014-03-11 08:41:29 1192
原创 binary-search之Scheme实现
这里有具体的讨论,并配有C的代码,https://github.com/julycoding/The-Art-Of-Programming-By-July/blob/master/ebook/zh/25.0.md
2014-03-09 00:48:38 966
原创 亲和数问题--求解500万以内的亲和数之—Scheme语言实现
https://github.com/julycoding/The-Art-Of-Programming-By-July/blob/master/ebook/zh/06.0.md
2014-03-06 19:46:45 1323
原创 Scheme进阶学习
复杂的操作当然就涉及到如何操作过程了,过程与数据的地位是一样的,所以过程的使用就变化多端,学会各种操作过程的方法也就掌握了Scheme的精华。
2014-03-06 09:48:29 1375 1
原创 使用autoconf和automake创建小项目
用了两天将之前的Snake游戏重新组织了一下,使用autoconf和automake按照GNU的安装软件组织布局重新编译并测试安装通过,第一次做这样的事情,很多知识查了很多资料才弄明白,最后克服了困难,可以把snakes安装到电脑上了。下面就描述一下,希望能帮到其他新手。
2014-03-04 08:35:36 1202
翻译 洗牌算法-神级算法来源
##### 2.3.5、How comes the Magic Conclusion?Our problem has been resolved, but this chapter has not been completed,how comes the Magic Conclusion that determines the perfect shuffle algorithm: if
2014-03-01 20:45:25 1068
翻译 洗牌算法3-完美洗牌算法
#### 2.3、Perfect shuffle algorithm perfect_shuffle3##### 2.3.1、cycle_leader algorithmEither perfect_shuffle1, or perfect_shuffle2, these two algorithms do not reach the time complexity of O (N) an
2014-03-01 14:23:42 962
翻译 洗牌算法2-分治
###Solution 2 、Perfect shuffle algorithmWho has played poker knows,an in-shuffle of a deck of cards is done by cutting the deck into two equal halves and interleaving them perfectly, with the first
2014-03-01 10:54:48 1049
翻译 洗牌算法1-蛮力搜索
中文版本见https://github.com/lmdyyh/The-Art-Of-Programming-By-July/tree/master/ebook/zhTopic Details:There is an array of length 2n {a1, a2, a3, ..., an, b1, b2, b3, ..., bn}, hope to be {a1, b1, a2, b
2014-03-01 10:49:29 924
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人