Shark第一印象

转载 2004年09月21日 21:27:00

出自http://gigix.blogdriver.com/gigix/106028.html

Shark第一印象- -

                                      

试了一下Enhydra Shark工作流引擎,暂时还不知道如何编程使用,只有一些肤浅的印象。
 
庞大——比OSWorkflow和Werkflow都大了许多,概念非常完整,一时间还很难完全理解这些概念。对于OSWorkflow和Werkflow这种轻量级工作流来说,要管理的唯一目标就是流程实例(process instance),操纵流程实例的状态变迁,至于如何使用流程实例、状态如何发展,都在工作流引擎之外。Shark管理的目标要宽泛得多,比如有User和UserGroup的概念,用户必须有此角色(即group)才能涉足此流程。不知道这会不会和统一用户管理平台冲突。
 
标准——完全符合WfMC参考模型,并且没有任何额外扩展,采用XPDL作为工作流定义语言。标准是好事,但是对于一些比较特殊的流程,我担心它的扩展能力。比如电子政务中经常会出现一种“无序流程”(只要领导插手,就可以随便到任何位置),WfMC是否能支持呢?另外,Enhydra提供JaWE编辑器,可能是最好的XPDL可视化编辑器。
 
支持多语言插件——对于需要自动执行的流程,Shark允许插入多种语言的运行单元,包括Java、JavaScript、BeanShell、Python等等,相信提供对Groovy的支持也会很简单。我们自己的工作流不支持自动执行,OSWorkflow只支持简单的BeanShell(语句直接写在配置文件中)。
 
持久化——默认的持久化方式是DODS,这是Enhydra自己做的一个O/R mapping。原来用的数据库是HSQL,我今天尝试迁移到MySQL还没有成功,因此也不知道这个持久化机制究竟如何。另外还提供LDAP的持久化,持久化方式的移植也不知道是否困难。我相信O/R mapping基础上移植不会太难。
 
服务接口——可以作为应用程序的一部分在代码级集成,也可以作为外部服务通过RPC集成。Shark很重视CORBA接口,对于异构环境的集成应该是很有帮助的。这里也有一点性能上的顾虑:应用内集成时,工作流引擎和工作流实例会不会带来太大的性能开销?毕竟它给我一种重量级的感觉。
 
明天如果有空就继续尝试,先把应用内集成搞明白,那么RPC集成也就简单了。

Shark简介、部署及编译小结

Shark即Hive on Spark,本质上是通过Hive的HQL解析,把HQL翻译成Spark上的RDD操作,然后通过Hive的metadata获取数据库里的表信息,实际HDFS上的数据和文件,会...
  • zbf8441372
  • zbf8441372
  • 2013年09月24日 11:21
  • 5359

Shark源码分析(六):k-means算法

Shark源码分析(六):k-means算法k-means算法是原型聚类算法中一个非常典型的算法。关于聚类算法,我之后应该会在博客中进行详细说明。对于整个聚类算法来说,可以分为两类:硬聚类与软聚类。对...
  • tuqinag
  • tuqinag
  • 2017年01月26日 11:48
  • 385

Shark机器学习库安装过程记录

今天装了一下Shark这个基于C++的机器学习库,现在把安装过程记录如下: 参考博客:http://blog.csdn.net/hitwengqi/article/details/8990384 ...
  • messiran10
  • messiran10
  • 2015年10月21日 20:35
  • 1644

Shark 在windows 下的编译

123
  • j2ee_ren
  • j2ee_ren
  • 2013年12月11日 09:24
  • 2620

机器学习之shark环境的编译(vs2010+boost1.5.5)

折腾了快一个星期了,终于把环境安装好(发个牢骚)。 1.编译boost1.5.5 1.1打开vs2010命令行 在vs2010中打开命令行,出师不利,报错Setting environment ...
  • u012442736
  • u012442736
  • 2017年03月12日 21:13
  • 413

Shark源码分析(十一):随机森林算法

Shark源码分析(十一):随机森林算法关于这个算法的介绍,可以参看我之前关于集成算法的博客。因为Shark中关于决策树算法只实现了CART算法,所以随机森林算法中也只包含了CART算法。如果你已经看...
  • tuqinag
  • tuqinag
  • 2017年01月26日 11:54
  • 886

WIN7下,VS2013配置shark库

1.       VS2013配置Shark机器学习库,首先要配置boost库,boost库的配置方法,可参考上篇文章WIN7下,VS2013配置boost库 2.       Shark3....
  • xiao_lxl
  • xiao_lxl
  • 2017年06月07日 15:49
  • 283

开源机器学习C++库Shark的编译与开发环境搭建

Shark是一个快速、模块化、功能丰富的开源C++机器学习库,提供了各种机器学习相关技术,比如线性/非线性优化、基于内核学习算法、神经网络等。   机器学习(MachineLearning)是...
  • deirjie
  • deirjie
  • 2014年08月20日 18:50
  • 3944

Shark源码分析(十):KNN算法

Shark源码分析(十):KNN算法关于这个算法,我之前已经有博客详细介绍过。虽然说这个算法看上去非常的简单,但是在搜索k个最近邻居数据点时,还是非常具有技巧性的。这里还是有必要再次强调一下。如果输入...
  • tuqinag
  • tuqinag
  • 2017年01月26日 11:53
  • 465

Shark源码分析(十二):线性SVM

Shark源码分析(十二):线性SVM关于svm算法,这个在我关于机器学习的博客中已经描述的比较详实了,这里就不再赘述。svm主要有三种类型,这里我所介绍的是线性svm算法的代码。相较于使用核函数的s...
  • tuqinag
  • tuqinag
  • 2017年01月26日 11:55
  • 597
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Shark第一印象
举报原因:
原因补充:

(最多只允许输入30个字)