自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

comaple

comaple的博客,专注java后台开发,专注java数据挖掘。hadoop以及实时流计算引擎storm。正致力于mahout的深入研究。

  • 博客(49)
  • 资源 (41)
  • 收藏
  • 关注

原创 R语言数据分析系列之九 - 逻辑回归

本节将一下逻辑回归和R语言实现,逻辑回归(LR,LogisticRegression)其实属于广义回归模型,根据因变量的类型和服从的分布可以分为,普通多元线性回归模型,和逻辑回归,逻辑回归是指因变量是离散并且取值范围为{0,1}两类,如果离散变量取值是多项即变为 multi-class classification,所以LR模型是一个二分类模型,可以用来做CTR预测等。那么我们现在来引出逻辑回归如何做二分类问题。

2015-04-15 17:46:08 40590

原创 R语言数据分析系列之八

再谈多项式回归,本节再次提及多项式回归分析,理解过拟合现象,并深入cross-validation(交叉验证),regularization(正则化)框架,来避免产生过拟合现象,从更加深入的角度探讨理论基础以及基于R如何将理想照进现实。

2015-04-10 15:35:39 22017 4

原创 R语言数据分析系列之七

R语言数据分析系列之七,回归分析建模是数据分析里面很重要的一个应用之一,即通过使用已有的自变量的值建立某种关系,来预测未知变量(因变量)的值。如果因变量是连续的那就是回归分析,如果因变量为离散的,可以理解为是分类。

2015-04-09 14:42:53 24841

原创 R语言数据分析系列之六

R语言数据分析系列之六,探索性数据分析,数据初探

2015-04-02 15:46:09 8685

原创 R语言数据分析系列之五

R语言数据分析系列之五,R语言数据可视化

2015-04-01 15:09:42 12768

原创 R语言数据分析系列之四

R语言数据分析系列之四,随机分布以及函数

2015-03-31 15:26:45 4848

原创 R语言数据分析系列之三

R语言数据分析系列之三

2015-03-30 14:50:03 12833

原创 R语言数据分析系列之二

R语言数据分析系列之二

2015-03-27 17:46:51 4651 1

原创 R语言数据分析系列之一

R语言数据分析系列之一,R 数据类型。

2015-03-26 15:30:06 3491

原创 大数据,机器学习的时代到来

物联网,人工智能,机器学习,大数据,大数据医疗,大数据服务

2015-03-22 23:18:52 1945

原创 mahout 实用教程之一

mahout 实用教程 (一)                                                                            —by comaple.zhang 本文力求把mahout从使用的角度为读者建立一个框架,为后续的使用打下基础。本文为原创文章转载请注明原网址http://blog.csdn.net/comaple,谢谢。

2013-05-19 20:21:00 9624 1

原创 Sector/Sphere 比hadoop快2-4倍

Sector/Sphere                                                                                                                           ————by comaple.zhangHigh Performance Distributed File Syst

2013-02-08 15:25:00 3125

原创 storm与spring框架集成问题

storm与spring框架集成问题                                                                                            ——by comaple.zhang              在进行storm与spring集成时,本来想着一次就能成功,抱着很大的希望可是运行时竟然报了个java.

2013-01-29 10:19:31 7602 4

原创 storm 实战及实例讲解(三)

storm 实战及实例讲解(三)                                     ——comaple.zhang                                                                                              ——2012-09-13            本讲将接

2012-09-13 17:27:37 11428

原创 storm 实战及实例讲解(二)

storm 实战及实例讲解(二)

2012-09-12 14:20:45 14947 3

原创 storm网上中文资料搜集大全

storm 网上中文资料搜集大全                                                       ——comaple.zhang             其实,如果英文还算可以的话建议直接去看官方的英文文档。storm关键概念和这个相对应的这里有一篇我觉得翻译不错的文章storm关键概念中文我会为大家找一些中文方面的资料,以便于sto

2012-09-12 13:38:02 7483

原创 storm 实战及实例讲解(一)

storm 实战及实例讲解一

2012-08-27 16:02:41 16913 1

原创 storm实时流式计算框架集群搭建过程

Storm集群安装配置过程

2012-08-22 16:03:07 25642 18

转载 IDEA 快捷键

Alt+回车 导入包,自动修正Ctrl+N   查找类Ctrl+Shift+N 查找文件Ctrl+Alt+L  格式化代码Ctrl+Alt+O 优化导入的类和包Alt+Insert 生成代码(如get,set方法,构造函数等)Ctrl+E或者Alt+Shift+C  最近更改的代码Ctrl+R 替换文本Ctrl+F 查找文本Ctrl+Shift+Space 自动

2012-07-17 13:55:18 1053 1

原创 lucene 索引实战

Lucene索引实战                                                                                                                                                                                   ——comaple

2012-02-16 17:23:56 1795 1

转载 一次java性能调优经验

项目情况:是一个大型公司的内部办公系统,该系统有两个和一般企业应用不太一样的特点:一是用户量非常多,人员数达到2W左右,另一个是采用分级管理的形式,各个分公司数据分开管理。我们的定位:我们是作为业务平台的提供商参与这个项目的,我们提供底层的开发平台,系统集成商在此基础上进行二次开发。 在项目从开发到部署的过程中遇到了很多的问题,也反映出很多问题。 一、怎么回事,跑得比猫

2012-02-01 10:29:48 1253

原创 Mongodb安装配置笔记

Mongodb学习笔记Mongodb分为服务器端和客户端,服务器端程序mongod(mongod.exe windows下)客户端mongo可以远程连接并对数据库进行各种操作。安装:首先下载mongodb一定主意你要下载的版本和型号。有linux版本和windws版本,在各个版本下又有32位和64位之分。安装其实就是环境变量的设置,先说一下linux版本下安装:Linux环境:这是我的

2011-11-28 09:41:21 1527

转载 GMF入门资料超全

最近发现一个比较全的GMF资料分享一下!原文地址:http://yiliner.iteye.com/category/34448?show_full=true修改GMF属性视图博客分类:GMF           上图中紫色的椭圆结

2011-09-30 09:49:08 12332 1

原创 Web为应用而生,将继续为应用而存

评——Web领域急需一位引领者            最近看到一篇web领域需要一个引领者的文章,想评论一下。。。业界曾有人提出,以后将是Web的天下。但Palo Alto公司的软件开发工程师Joe Hewitt却在博文《Web Technologies Ne

2011-09-28 13:16:16 1391

转载 java读写文件大全

给大家转载一篇文章,出处:http://blog.csdn.net/smartcat86/article/details/4085739/使用Java操作文本文件的方法详解 摘要: 最初java是不支持对文本文件的处理的,为了弥补这个缺憾而引入了Reader和Writer

2011-09-23 19:34:20 690

原创 RCP GMF 扩展Action

在采用GMF开发图形编辑程序时,我经常要自己扩展GMF生成的应用程序。本文围绕如何添加自定义的Action做个详细的介绍。希望对大家有所帮助:GMF生成的代码其实就是一个RCP应用程序,扩展Action有两种途径:第一种就是通过扩展点  org.eclipse.ui.ac

2011-09-22 17:53:43 1775 6

原创 ArcGis featureLayer中添加字段

featureLayer中添加字段这是我2010年11月份写的东东,现在拿出来给大家分享一下,这几个方法都是抽象出来的,可以拿过来直接使用。说明一下:这些都是.net平台,VS2008+ArcGis9.3调试通过的//检查fields是否有效public

2011-09-22 13:43:22 3944

转载 RCP开发,view事件通知机制

最近遇到了RCP的view之间的信息传递的问题,看了一下,觉得这篇介绍的还不错,转一下引用:http://blog.csdn.net/xueyepiaoling/article/details/6737048在上一文中,我们介绍了怎样创建一个Eclipse RCP,并创建

2011-09-22 10:43:40 2765

转载 GEF property view的使用

GEF作为一个图形框架,对于其中图形元素的属性的设定是非常重要的,这是因为每一个图形元素的背后都是一个模型,而这些模型可以包含很多业务数据,如果我们最终选定GEF作为我们应用的解决方案的话,我们可以利用property view来实现对这些业务数据属性的设定; 这就是我们这里即将

2011-09-21 14:49:37 1656 2

转载 EMF Item Provider机制

Porvider的概念对于JFace部分的内容已经比较清楚,这里重点看一下Eclipse中PropertySheet是如何实现的。这涉及到了三个接口,IPropertySourceProvider,IPropertySource,IPropertyDescriptor。而模型

2011-09-21 13:06:44 1011

转载 学习eclipse插件开发资源全收集(plugin)

在学习plugin的过程中发现的一些好的文章,内容,整理起来。1,一个可以提出问题http://www.ceclipse.org/bbs2,一个相对系统的rcp开发教程,pdf格式。入门的好资料。http://www.ceclipse.org/bbs/read-c

2011-09-21 13:02:45 749

原创 GMF 双击图形打开新窗口编辑

在GMF里面实现图形化的编辑时经常会遇到这样的需求就是,双击一个图形后打开一个新窗口编辑图形。在GMF里叫Diagram Partitioning图形分区嵌套实现。这里有一篇英文文章可以参考,其中讲述了两种场景,但一般最简单的就可以了,所以我这里只讲解简单的实现。wiki上得文章

2011-09-13 16:30:46 2414 4

转载 Java私塾中级视频——Eclipse快捷键总结

看了java私塾的中级视频,感觉很全面,总结整理出了一些Eclipse快捷键,希望对有用的朋友有所帮助:Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行  Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复

2011-09-13 15:15:19 690

原创 GMF 网上学习资料整理

GMF的学习资料一般中文的都不够系统,后者解释的不清楚。看了还是迷惑不如不看,但还是有一部分值得初学者去学习的。比如八进制的博客就很不错,但他的那个例子显然也已经过时了,GMF新版本和老版本有很大的不同。特别是在图形定义和mapping时,还有学习GMF一定要事先具备最基本的RC

2011-09-13 15:08:30 1724

原创 GMF自定义figure

在GMF里面自定义figure据说很轻松但实现起来也并不那么容易。现在就跟着我一步一步实现一个简单的figure吧。在gmfgraph文件里定义定义图形,新建一个figure descriptor 为他起一个名字,然后再添加一个polygon 子节点,flow layout节

2011-09-13 14:38:53 1483

原创 servlet中文乱码问题

这个话题其实已经不新了,现在的系统开发基本遇不到中文乱码,因为有了struts2(struts2.1.6中还是存在需要通过filter解决) ,但由于种种原因在你开发过程中还是会遇到类似的问题。最近的项目由于无法采用现成的框架只能用最原始的方法了,jsp+servlet用ecli

2011-08-31 11:31:18 1129

原创 数据库分页查询

服务器端几种分页方式的性能分析   ——by comaple 2011-6-17前言:本试验在于探讨分页的性能问题,当然客户端分页也是一种分页的策略。不过这种分页方式已经过时了,建议不要采用。这里我们只讨论服务器端分页。实验环境:Pentium(R) dual-Core CPU E5300 @ 2.6GHz 2.59GHz, 2.00GB内存SqlServer2008 

2011-06-17 18:19:00 8959 2

原创 java 与C# 中的String比较

C# 与 java中的String比较--by comaple 2011-6-15第一次比较:Java实现String str1="123";String str2="123";System.out.println(str1==str2);System.out.println(str1.equals(str2));输出为:truetrue.Net实现

2011-06-15 19:32:00 4261 6

原创 基于角色实现的权限管理数据库设计

权限管理模块权限管理是每个系统都要有的,经过最近几个项目的设计开发。现在总结一下关于权限管理的数据库设计方案(简化版)。工具PowerDesigner 15.1。下面对各个表作用进行讲解:Ø 用户信息表用户信息表主要记录着用户相关的基本信息,如用户名,姓名,性别,密码,政治面貌等等。Ø 角色表角色表主要用于定义该系统的所有角色,每一个角色代表一种权限。以此来实现权限的控制。

2011-06-10 18:00:00 1390

原创 权限管理的数据库设计

权限管理模块权限管理是每个系统都要有的,经过最近几个项目的设计开发。现在总结一下关于权限管理的数据库设计方案(简化版)。工具PowerDesigner 15.1。下面对各个表作用进行讲解:Ø 用户信息表用户信息表主要记录着用户相关的基本信息,如用户名,姓名,性别,密码,政治面貌等等。Ø 角色表角色表主要用于定义该系统的所有角色,每一个角色代表一种权限。以此来实现权限的控制。

2011-06-10 17:59:00 1217 1

Home Credit Default Risk DataSet

Home Credit Default Risk datasets 原始数据下载 比赛数据集,验证可用,只用于研究交流。

2022-05-26

stormWorker.jar

http://blog.csdn.net/comaple/article/details/7896167 storm实时流式计算框架集群搭建过程中,用到的jar文件。

2012-09-17

mahout in action

mahout in action

2012-03-06

dubbo最新版本2.0.9 下载

Dubbo 是阿里巴巴公司开源的一个高性能优秀的服务框架,使得应用可通过高性能的 RPC 实现服务的输出和输入功能,可以和 Spring框架无缝集成。 主要核心部件: •Remoting: 网络通信框架,实现了 sync-over-async 和 request-response 消息机制. •RPC: 一个远程过程调用的抽象,支持负载均衡、容灾和集群功能 •Registry: 服务目录框架用于服务的注册和服务事件发布和订阅 在该版本中淘宝对zookeeper的支持经实际测试是稳定的,但目前发布的该版本还属于快照版本,属于不稳定版本,但尽管如此。我们还是在用了!呵呵。

2011-12-09

dubbo2.0.8 下载

Dubbo 是阿里巴巴公司开源的一个高性能优秀的服务框架,使得应用可通过高性能的 RPC 实现服务的输出和输入功能,可以和 Spring框架无缝集成。 主要核心部件: •Remoting: 网络通信框架,实现了 sync-over-async 和 request-response 消息机制. •RPC: 一个远程过程调用的抽象,支持负载均衡、容灾和集群功能 •Registry: 服务目录框架用于服务的注册和服务事件发布和订阅 在2.0.8中增加了对zookeeper的支持,但经过我们的实际测试发现,2.0.8存在严重的bug根本不能支持zookeeper的使用,于是才有2011-12-2日有紧急发布的2.0.9版本。接下来我会把最新的上传以供大家参考。

2011-12-09

dubbo 2.0.7 下载(带源码)

Dubbo 是阿里巴巴公司开源的一个高性能优秀的服务框架,使得应用可通过高性能的 RPC 实现服务的输出和输入功能,可以和 Spring框架无缝集成。 主要核心部件: •Remoting: 网络通信框架,实现了 sync-over-async 和 request-response 消息机制. •RPC: 一个远程过程调用的抽象,支持负载均衡、容灾和集群功能 •Registry: 服务目录框架用于服务的注册和服务事件发布和订阅

2011-12-09

zookeeper-3.4.0下载

zookeeper最新版本下载,欢迎下载。请多提意见

2011-12-01

Hadoop最新版本下载(0.23.0)

这个是Hadoop官方网站上的最新版本,放在这里共享给大家。同时欢迎交流。

2011-11-27

Hadoop安装配置手册

Hadoop安装与配置手册(ver 0.1)....................................................................................................1 1前言.......................................................................................................................................2 2获取Hadoop..........................................................................................................................2 3安装Hadoop..........................................................................................................................2 3.1先决条件.....................................................................................................................2 3.2安装.............................................................................................................................4 4配置Hadoop..........................................................................................................................4 5运行简单的例子....................................................................................................................9 6补充说明...............................................................................................................................9 7推荐资源..............................................................................................................................13 8参考文献..............................................................................................................................13

2011-11-27

Hadoop安装配置笔记

此文仅作为笔记的形式,希望对初学者有所帮助。

2011-11-27

spring in action(enlish edition)

spring in action 经典的spring学习资料值得研读。

2011-09-24

LINQ to Sql 中文教程

目录 LINQ初体验之LINQ to Object 1 一步一步学Linq to sql(一):预备知识 4 一步一步学Linq to sql(二):DataContext与实体9 一步一步学Linq to sql(三):增删改 15 一步一步学Linq to sql(四):查询句法 21 一步一步学Linq to sql(五):存储过程 35 一步一步学Linq to sql(六):探究特性 46 一步一步学Linq to sql(七):并发与事务 53 一步一步学Linq to sql(八):继承与关系 60 一步一步学Linq to sql(九):其它补充 69 一步一步学Linq to sql(十):分层构架的例子 73 Linq To Xml学习 80 Linq To Xml学习 - 1. 概述 80 Linq To Xml学习 - 2 编程概述 82 C# 2008 学习笔记 - LINQ to XML 87 一、命名空间 87 二、编程方式创建XML文档 88 三、使用 LINQ 查询创建XML文档 89 四、加载和解析XML内容 90 六、遍历内存中的XML文档 90 七、修改 XML文档 92 使用linq to xml 快速创建自己的Rss 93

2011-06-08

ArcCatalog中文使用手册

第一章 ArcCatalog简介 1 ArcCatalog的用途 2 学习ArcCatalog的技巧 6 第二章 快速入门教程 练习1:建立地理数据目录 8 练习2:浏览数据并将其添加到地图上 12 练习3:管理Shape文件 29 第三章 Catalog基础 37 启动ArcCatalog 38 ArcCatalog窗口 39 通过Catalog浏览 40 重新配置Catalog树 43 获得帮助 45 退出ArcCatalog 49 第四章 Catalog内容 51 文件夹和文件类型 52 地图、图层和图表 53 Shape文件、dBase表和文本文件 54 Coverages和INFO表 55 地理数据库 56 栅格数据 58 TIN数据集 60 CAD制图 61 VPF数据 62 SDC数据 63 XML文档 64 地址定位器 65 ArcIMS服务器 66 ArcGIS服务器 67 搜索结果 68 坐标系统 69 工具箱 70 第五章 创建Catalog 71 添加文件夹连接 72 添加空间数据库连接 73 添加OLE DB连接 75 使用数据库连接 76 连接到GIS服务器 78 隐藏文件夹和数据项 81 改变数据格式的属性 82 添加文件类型 84 第六章 管理Catalog的内容 87 查看数据项的内容 88 在Details视图中操作 90 改变列 92 浏览数据项的属性 95 组织数据 96 将数据转换为不同格式 98 第七章 浏览数据项的地理特征 99 预览数据项的地理数据 100 创建缩略图 106 第八章 浏览数据表中的值 107 预览数据表中的值 108 改变数据表的外观 109 计算统计值 113 对数据表中记录排序 114 查找数据表中的值 116 添加和删除列 118 由数据表中的值创建新的数据源 120 第九章 操作元数据 123 浏览数据项的元数据 124 改变缺省的样式单 127 创建与更新元数据 128 导入与导出元数据 130 书写文档 132 编辑元数据 134 使用FGDC元数据编辑器 135 使用ISO元数据编辑器 137 添加附件 138 发布到ArcIMS元数据服务的要求 140 发布元数据的准备工作 144 发布到一个ArcIMS元数据服务 149 管理发布的文档 150 改变发布文档的属性 151 第十章 搜索数据项 153 搜索数据项 154 按地理条件搜索 156 按时间条件搜索 158 按关键字搜索 161 浏览搜索结果 162 修改搜索结果 163 第十一章 操作地图和图层 165 打开地图 166 向地图添加数据 167 创建图层 168 设置图层属性 173 第十二章 操作Shape文件 177 创建新的Shape文件和Dbase表 178 添加和删除属性 180 创建和更新索引 182 定义Shape文件的坐标系统 184 第十三章 操作Coverages 191 创建新的Coverage 192 创建新的INFO表 193 生成拓扑 194 定义Coverage的坐标系统 196 改变Coverage的控制点和范围 200 设置Coverage的容限 203 维护属性 204 什么是关系类? 210 创建Coverage的关系类 212 第十四章 操作栅格数据 215 栅格数据集的属性 216 浏览地理数据库的栅格数据目录 217 修改栅格数据集的预览属性 220 选择显示在ArcCatalog中的栅格数据集格式 221 定义栅格数据集的坐标系统 223 创建栅格数据集金字塔(索引) 227 创建栅格数据集的统计信息 229 栅格数据集的其它文件信息 230 第十五章 定制ArcCatalog 233 基本的用户界面元素 234 定制工具条 235 改变工具条的内容 238 改变命令的外观 243 创建快捷键 246 创建并运行宏 248 用VBA创建自定义命令 251 使用UIControls 253 添加自定义命令 254 更新ArcID模块 255 改变VBA的安全性 256 使用ArcObjects Developer Help系统 257 术语表 259 Index(索引) 283

2011-04-05

.NET MySql数据库驱动

.NET连接MySQL数据库驱动,内含连接字符串例子,修改可直接使用。

2011-04-02

C#版数据结构 经典

数据结构C#版写的相当不错,个人觉得比c语言版的好理解。更加适合.net开发人员阅读。拿出来和大家分享,谢谢。

2011-03-29

C# 二进制流入库源码下载

C#二进制流操作,C#异步调用,C#二进制流入库源码奉上!

2010-12-23

Unhider(隐藏其他应用程序窗口的专业软件)

Unhider,开源软件,可以控制你的桌面所有一打开的窗口!

2010-12-05

华为员工培训内部资料

华为员工培训资料! 很实用,收获不小! 网络基础知识,常见网络接口与电缆,第三章以太网交换机基础,LAN Switch 配置,路由器基础及原理,路由器配置简介,网络层基础及子网规划,常见广域网协议及配置,路由协议,防火墙配置,DDR、ISDN 配置,备份中心配置,HSRP协议及配置,常见网络问题分析及处理

2010-12-04

Ext js 中文API手册

最新版中文手册,一起奉上. 内核解析经典!

2010-12-04

最新Ext js 开发工具(IDE)

版本1.6.18.zip 1.6.18.jar

2010-12-04

(数据库设计教程)Powerdesigner经典教程

Powerdesigner数据库分析设计与应用,深入讲解他的高级特性。和具体的使用方法,愿君多揣摩。

2010-11-24

Linux内核研究的经典入门书籍

内核研究的经典入门之作,书中的探讨由浅入深,循序渐进,实为不可多得的Linux内核入门书籍!

2010-11-24

ArcSDE安装过程图解

内配有文字说明,图解详细!容易理解,很有帮助!

2010-11-24

C#多线程编程源码奉上

内有说明VS2008环境调试通过,无需再调试加载即可运行,里面关于异步调用的代码拷贝即可立即复用。希望对你有所帮助!这个是我苦战了三天才搞定的东西,也是我的总结资料在这里给大家一起分享!

2010-11-21

C# .NET 物流管理系统项目源码

这个是我为XX物流货运站开发的单机版管理系统(在用)。开发环境VS2008,数据库SqlServer2008。里面有水晶报表的使用。现在拿出来给大家分享,希望对大家有用,对入门极有指导意义。源码只要加载就可以运行。

2010-10-24

C#开发的桌面活动小金鱼项目源码

里面有使用说明,下载后直接在vs里加载即可打开!好好研究对代码有很大的提高!

2010-10-09

ArcGis中SDE连接数据库

AO编程和ArcSDE连接SQLserver数据库的最好入门教程!对与搞Gis的绝对有帮助!

2010-09-28

Linux命令最好的书籍

linux命令最好的学习用书,很实用的!希望对你有帮助!

2010-09-16

让VS支持JQuery提示

vs中支持jQuery提示的插件!很好用的,找了半天终于找到了,和大家一起分享!

2010-09-01

伪随机数算法源代码实现

伪随机数算法实现代码!调试通过的代码!附有详细的说明文字!

2010-05-13

C++链接与查询数据库源码

MFC中利用智能指针链接数据库的源代码!!

2010-05-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除