- 博客(42)
- 资源 (22)
- 收藏
- 关注
原创 centos6.4安装R
主要R的版本是3.2.3 否则会需要安装其他的lib包,在linux下 一、在centos的linux下安装R环境,主要做RServer1、安装前所需的各种包(有的话可省略):yum install gcc gcc-c++ yum install gcc-gfortranyum install readline-develyum install libXt-deve
2017-03-27 16:21:41 705
转载 解惑rJava R与Java的高速通道
转载请注明出处:http://blog.fens.me/r-rjava-java前言Java语言在工业界长期处于霸主地位,Java语法、JVM、JDK、Java开源库,在近10年得到了爆发式的发展,几乎覆盖了应用开发的所有领域。伴随着Java的全领域发展,问题也随之而来了。语法越来越复杂,近似的项目越来越多,学好Java变得很难。对于没有IT背景的统计人员,学用Java更是难于
2017-03-23 14:28:50 367
转载 Rsession让Java调用R更简单
写了好几篇关于Rserve的文章了,Rserve作为R语言的通信接口,已经成为了R语言扩展的重要通道。大数据时代的到来,让原本小众的R语言,不经意间挤进了开发语言前20名。同时,具有多种编程语言背景的IT工程师们,开始进入R的社区,帮助R语言快速进化。Rserve提供了一个通信的接口,通过封装可以让R引擎嵌入到其他语言里。目录Rsession介绍Rsession下载
2017-03-23 14:07:36 2899 2
转载 Rserve的R语言客户端RSclient
RSclient是实现Rserve通信的R语言客户端程序,对于统计人员使用RSclient调用Rserve运行R语言脚本,感觉会很奇怪。但对于实际应用架构来说却是很有帮助的,不仅可以统一Rserve的接口,还可以从架构上实现R语言的跨虚拟机的分步式程序设计。目录Rserve和RSclient介绍Rserve系统环境RSclient安装RSclient的APIRS
2017-03-23 13:48:27 867
转载 R语言服务器程序 Rserve详解
转载请注明出处:http://blog.fens.me/r-rserve-server/前言Rserve作为一个R语言与其他语言的通信(TCP/IP)接口,被多个项目所依赖。Rserve服务端配置和运行都非常简单,客户端由多种语言实现,像C/C++, Java等。R也有自己的客户端实现 RSclient 项目,将在下文介绍。本文详细剖析Rserve作为服务器端应
2017-03-23 13:25:43 9612 1
转载 Rserve与Java的跨平台通信
转载请注明出处:http://blog.fens.me/r-rserve-java/前言现在主流的异构跨平台通信组件Apache Thrift已经火遍大江南北,支持15种编程语言,但是到目前为止还没有加入R语言。要让R实现跨平台的通信,就只能从R的社区中找方案,像rJava,RCpp,rpy都是2种语言结合的方案,这些方案类似地会把R引擎加载到其他的语言内存环境。优点是
2017-03-23 13:15:12 318
转载 R语言中的常用函数
语言的数学运算和一些简单的函数整理如下:向量可以进行那些常规的算术运算,不同长度的向量可以相加,这种情况下最短的向量将被循环使用。 改变编译环境的语言(英语)Sys.setenv(LANGUAGE="en") > x > a > x * a[1] 10 20 30 40 > x + a[1] 11 12
2017-03-22 13:24:42 4889
转载 R学习日记——时间序列分析之ARIMA模型预测
今天学习ARIMA预测时间序列。 指数平滑法对于预测来说是非常有帮助的,而且它对时间序列上面连续的值之间相关性没有要求。但是,如果你想使用指数平滑法计算出预测区间, 那么预测误差必须是不相关的, 而且必须是服从零均值、 方差不变的正态分布。即使指数平滑法对时间序列连续数值之间相关性没有要求,在某种情况下, 我们可以通过考虑数据之间的相关性来创建更好的预测模型。自回归移动平均模型(
2017-03-22 10:40:06 1515
转载 RUtils -- 建立在Rserve之上的Java与R语言通信工具集
注1:RUtils是我偶然发现的一个工具包,它建立在Rserve之上,可以很大程度上简化我们的程序,关于Rserve网络上有很多相关的内容,这里不对其进行介绍,比如这里:http://blog.fens.me/r-rserve-java/注2:以下内容有很大一部分是“翻译”自官方网站,详情请点开“参考资料”中的链接查看。简介 RUtils是一个用于Ja
2017-03-22 10:16:08 868 1
转载 使用Rserve远程执行R脚本
Rserve介绍 Rserve是一个基于TCP/IP协议的,允许R语言与其他语言通信的C/S结构的程序,支持C/C++,Java,PHP,Python,Ruby,Nodejs等。 Rserve提供远程连接,认证,文件传输等功能。我们可以设计R做为后台服务,处理统计建模,数据分析,绘图等的任务。 详细介绍请参照官方网站:https://rforge
2017-03-22 09:39:22 4668
转载 Weka-无监督属性过滤器-AddExpression MathExpression
AddExpression过滤器是通过将一个数学函数应用于数值型属性而生成1个新的属性。其中,可以支持+、-、*、/、和^,函数log、abs、cos、exp、sqrt、floor、ceil、rint、tan、sin,属性通过索引加前缀a确定,例如a7表示第7个属性;MathExpression过滤器与AddExpression过滤器类似,该过滤器只是修改现有属性,不创建新属性。所
2017-03-17 16:08:06 1775
原创 weka数据集中特征的新增、删除、复制、添加ID
public class AttributeProcess {/*** 删除特征* 第一种方法,在remove类中设置option属性,-R 表示字段范围,删除1 2字段* Remove remove1=new Remove(); remove1.setOptions(new String[]{"-R","1,2"});
2017-03-17 15:26:13 3076
转载 Weka-filter类-选择样本[5]
目前有3个方法可以研究下:RemovePercentage,RemoveRange,RemoveWithValuesRemovePercentage:顾名思义,根据百分比选择样本RemoveRange:根据序号选择样本RemoveWithValues:根据某字段的设定值选择样本然后,为减少文章重复的内容,我们先看这几个方法的不同的
2017-03-17 15:11:48 1982
转载 weka-Oracle数据库连接及以ARFF文件导出[2]
weka 在 eclipse 直接连接Oracle 取数据,需要修改weka包中的配置文件。在使用weka包连接数据库前,我们先研究 eclipse 如何连接oracle取数据1,eclipse 连接oracle取数据[java] view plain copyimport java.sql
2017-03-17 14:04:24 428
转载 Weka文件读取及导出
1,weka文件读取分3类,分别为:ARFF(weka自身文件读取),CSV(文本文件读取),数据库直接读取1.1,ARFF(weka自身文件读取),比较容易直接使用Instances类即可1.2,CSV文件读取需要使用dataSource类[java] view plain copyimp
2017-03-17 14:01:43 4809 2
转载 R语言画曲线图
本文以1950年到2010年期间我国的火灾统计数据为例,数据如下所示:(0)加载数据dataE:\\MyDocument\\p\\Data\\1950~2010火灾情况.csv") x=t(data[1]) y=t(data[2]) z=t(data[3])w=t(data[4])maxy=max(y) maxz=max(z) maxw=max(w) (
2017-03-11 16:33:12 9530
原创 Maven 手动添加 JAR 包到本地仓库
很多的情况下,比如我们需要从github上下载jar。但是maven拉取不到,所以可以手动的执行命令安装jarMaven 安装 JAR 包的命令是:mvn install:install-file -Dfile=jar包的位置 -DgroupId=上面的groupId -DartifactId=上面的artifactId -Dversion=上面的version -Dp
2017-03-10 13:27:23 644
转载 fastjson 使用方法
Fastjson介绍Fastjson是一个Java语言编写的JSON处理器。1、遵循http://json.org标准,为其官方网站收录的参考实现之一。2、功能qiang打,支持JDK的各种类型,包括基本的JavaBean、Collection、Map、Date、Enum、泛型。3、无依赖,不需要例外额外的jar,能够直接跑在JDK上。4、开源,使用Apache License 2.0
2017-03-10 10:54:12 247
转载 Java集成Weka做线性回归的例子
之前研究完分类的逻辑回归,继续搞一下线性回归看看。线性回归在数据挖掘领域应也是非常常见,即根据现有的数据集(行向量组成的矩阵),(训练)模拟出一个合适的规律(函数),来推测任何新给出的数据组合(向量)应该得到的值。具体的描述可以参见各种博客,怎么推导的看来看去一知半解,但总而言之结果也简单,就是计算得到一个“适当”的多元线性函数Y=a0+a1*x1+a2*x2+a3*x3+…+ak*xk。
2017-03-09 13:38:50 1520
转载 Canopy聚类算法
只有这个算法思想比较对,其他 的都没有一开始的remove: 原网址:http://www.shahuwang.com/?p=1021 Canopy Clustering 这个算法是2000年提出来的,此后与Hadoop配合,已经成为一个比较流行的算法了。确切的说,这个算法获得的并不是最终结果,它是为其他算法服务的,比如k-means算法。它能有效地降低k-means算法中计算点之间距离的
2017-03-09 09:43:22 1132
转载 调用WEKA包进行kmeans聚类(java)
所用数据文件:data1.txt[plain] view plain copy print?@RELATION data1 @ATTRIBUTE one REAL @ATTRIBUTE two REAL @DATA 0.184000 0.482000 0.152000 0.
2017-03-09 09:00:10 718
转载 weka数据预测 分类回归 方法 参数 总结
1.线性回归(LinearRegression)1.1原理在统计学中,线性回归是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。1.2最小二乘法原理线性回归模型经常用最小二乘逼近来拟合,但他们也可能用别的方
2017-03-07 16:20:03 4199 1
转载 ibatis与spring整合
这两天一直在研究ibatis与spring的整合 一个小小的demo搞的我头晕目眩的,但程序一旦跑起来了,突然有一种豁然开朗,重见天日,感觉生活很美好的感觉!,也许,这就是那一行行的代码带给我们的不同享受吧。呵呵,废话就不多说了。在此先引用几句别人的资料。。。spring通过DAO模式,提供了对iBATIS的良好支持。SqlMapClient对象是iBATIS中的主要对象,我们可以
2017-03-07 15:20:43 373
转载 MyBatis学习总结(八)——Mybatis3.x与Spring4.x整合
http://www.cnblogs.com/xdp-gacl/p/4271627.html一、搭建开发环境1.1、使用Maven创建Web项目 执行如下命令:mvn archetype:create -DgroupId=me.gacl -DartifactId=spring4-mybatis3 -DarchetypeArtifactId=maven-archetype-
2017-03-07 15:19:35 305
转载 weka的二次开发
http://www.programcreek.com/java-api-examples/index.php?api=weka.classifiers.trees.RandomForesthttp://www.programcreek.com/java-api-examples/index.php?api=weka.filters.unsupervised.attribute.Tim
2017-03-07 14:09:01 649
原创 Java调用weka的各种聚类算法
package com.lh.cluster;import java.io.BufferedOutputStream;import java.io.File;import java.io.FileOutputStream;import java.io.PrintStream;import weka.clusterers.EM;import weka.clustere
2017-03-07 13:30:08 3851
转载 通过weka.jar包来进行数据预处理
打开eclipse ,在对应的工程下右击,选择Build Path ->选择Configure Build Path ->选择Libraries ->点击Add External JARs ->然后到你的jar包所在路径选择它。即可。一、特征选择[java] view plain copy print?package
2017-03-07 13:22:50 3007
转载 调用WEKA包进行kmeans聚类(java)
所用数据文件:data1.txt[plain] view plain copy print?@RELATION data1 @ATTRIBUTE one REAL @ATTRIBUTE two REAL @DATA 0.184000 0.482000 0.152000 0.
2017-03-07 13:10:57 2163
转载 java调用Weka中神经网络的算法(从数据库中取数据)
http://blog.csdn.net/shuijingyezihehe/article/details/38331005本文中使用的weka版本为3.6版本,参阅的API也是3.6的相关的包(weka.jar,weka-src.jar,libsvm.jar.wlsvm.jar)可以在以下链接下载:http://pan.baidu.com/s/1kTHW3un
2017-03-07 12:59:05 2489 2
转载 Spring MVC+Mybatis+Maven+Velocity+Mysql整合实例
spring MVC+Mybatis+Maven+Velocity+MySQL整合实例http://blog.csdn.net/a123demi/article/details/43156479 一Maven工程目录二Spring mvc mybatis maven实现Mysql数据库表数据Maven依赖引入pomxml实体类UserEntityjava业务逻辑接口Serv
2017-03-07 10:29:27 648
转载 前后端分离springmvc和RESTful理解
1. 理解MVCMVC是一种经典的设计模式,全名为Model-View-Controller,即模型-视图-控制器。其中,模型是用于封装数据的载体,例如,在Java中一般通过一个简单的POJO(Plain Ordinary Java Object)来表示,其本质是一个普通的Java Bean,包含一系列的成员变量及其getter/setter方法。对于视图而言,它更加偏重于展现
2017-03-06 09:27:00 3313
转载 Restful风格API接口开发springMVC篇
Restful风格的API是一种软件架构风格,设计风格而不是标准,只是提供了一组设计原则和约束条件。它主要用于客户端和服务器交互类的软件。基于这个风格设计的软件可以更简洁,更有层次,更易于实现缓存等机制。在Restful风格中,用户请求的url使用同一个url而用请求方式:get,post,delete,put...等方式对请求的处理方法进行区分,这样可以在前后台分离式的开发中使得前端开发
2017-03-06 09:24:11 4282
转载 【REST】REST、RESTFUL的理解以及SpringMVC实现Restful编程
网上有相关很多rest的文章,本人看着实在是晦涩,太抽象了,很难看懂。其实HTTP 1.1协议的整体软件架构就可以说是REST架构了解REST得知道5个名字:1、资源 Resource资源就是服务器上获取到的东西都可以说是资源,一条用户记录,一个用户的密码,一张图片等等都是2、资源的表述 Representation就是资源的格式,是HTML、XML
2017-03-06 09:19:33 306
转载 springMVC整合FastJson实现RestFul风格API
首先,直接来web.xml文件[html] view plain copy xml version="1.0" encoding="utf-8"?> web-app version="2.4" xmlns="http://java.sun.com/xml/ns/j2ee" xmlns:xsi="http://www
2017-03-06 09:08:57 403
转载 DWR+SpringMVC整合的3种方式之三
方式三:这种方式和方式二差不多,主要使用annotation配置和注解 说明:这种的耦合度也是和方式二差不多,本人最推荐用方式一,写的清楚,配置也清楚。这种方式的时候也遇到了一个很无语的问题,我原来使用的是maven下载的dwr-3.0.M1.jar包,然后运行jetty没错,显示jsp的时候就一直报下面这个错误:org.springframework.beans.factory.
2017-03-06 09:07:13 661
转载 eclipse部署,在tomcat中找不到eclipse发布的项目。eclipse更改项目发布路径
在新版的eclipse中,配置好项目,发布之后,发现在tomcat的webapps下找不到该项目,而是在d:\workspace\.metadata\.plugins\org.eclipse.wst.server.core\tmp0\wtpwebapps下,解决办法就是重新配置一下eclipse在tomcat下对项目的发布路径。 首先在工作面板中找到“servers”,然后右键
2017-03-03 15:35:10 473
转载 scrapy-redis使用详解
描述:1.使用两台机器,一台是win10,一台是centos7,分别在两台机器上部署scrapy来进行分布式抓取一个网站2.centos7的ip地址为192.168.1.112,用来作为redis的master端,win10的机器作为slave3.master的爬虫运行时会把提取到的url封装成request放到redis中的数据库:“dmoz:requests”,并且从该
2017-03-03 13:30:24 2114
转载 5个好用的开源数据挖掘软件
5 of the Best Free and Open Source Data Mining SoftwareThe process of extracting patterns from data is called data mining. It is recognized as an essential tool by modern business since it is able
2017-03-03 13:11:09 1471
转载 【SPMF开源数据挖掘平台入门】MaxSP算法使用说明
前段时间,由于项目中用到了序列挖掘的算法,师兄推荐我用用SPMF。在此做个记录。 首先简单介绍一下SPMF:SPMF是一个采用Java开发的开源数据挖掘平台。它提供了51种数据挖掘算法实现,用于:序列模式挖掘,关联规则挖掘,frequent itemset 挖掘,顺序规则挖掘,聚类HOME PAGE:http://www.philippe-fournier-viger.
2017-03-03 13:00:02 5707
转载 storm学习笔记
http://blog.csdn.net/sheen1991/article/details/51745673Storm学习笔记一、简介本文使用的Storm版本为1.0.1Storm是一个免费开源的分布式实时计算系统,它使得可靠地处理无限的数据流更加容易,可以实时的处理Hadoop的批量任务。Storm简单易用,且支持各种主流的程序语言。St
2017-03-03 11:02:33 681
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人