- 博客(5)
- 资源 (1)
- 收藏
- 关注
转载 HDFS snapshot操作实战
原网址:http://debugo.com/hdfs-snapshot/Hadoop从2.1.0版开始提供了HDFS SnapShot的功能。一个snapshot(快照)是一个全部文件系统、或者某个目录在某一时刻的镜像。快照在下面场景下是非常有用:防止用户的错误操作:管理员可以通过以滚动的方式周期性设置一个只读的快照,这样就可以在文件系统上有若干份只读快照。如果用户意外地删除了一个文件
2016-11-28 17:48:59 318
转载 分类算法之朴素贝叶斯分类(Naive Bayesian classification)
原地址:http://www.cnblogs.com/leoo2sk/archive/2010/09/17/naive-bayesian-classifier.html算法杂货铺——分类算法之朴素贝叶斯分类(Naive Bayesian classification)2010-09-17 13:09 by T2噬菌体, 175518 阅读,49 评论, 收藏, 编辑
2016-11-24 10:16:26 2242
转载 Spark MLlib实现的中文文本分类–Native Bayes
原网址:http://www.open-open.com/lib/view/open1453539595620.htmlSpark MLlib实现的中文文本分类–Native Bayes 2016-01-23 17:00:41 发布您的评价: 0.0 0收藏来自: ht
2016-11-14 14:36:32 947
转载 Spark 中文文档分类(一) IKAnalyzer对文档进行分类
原网址:http://lxw1234.com/archives/2015/07/422.htm中文分词工具-IKAnalyzer下载及使用编程语言lxw1234@qq.com 1年前 (2015-07-22) 5885℃0评论关键字:中文分词、IKAnalyzer最近有个需求,需要对爬到的网页内容进行分词,以前没做过这个,随便找了找中文分词工具,貌似IKAnalyz
2016-11-14 14:34:24 1496
原创 java 线程
/* 进程 : 正在执行的程序称作为一个进程。 进程负责了内存空间的划分。 问题: windows号称是多任务的操作系统,那么windows是同时运行多个应用程序吗? 从宏观的角度: windows确实是在同时运行多个应用程序。 从微观角度: cpu是做了一个快速切换执行的动作,由于速度态度,所以我感觉不到在切换 而已。线程: 线
2016-11-05 17:42:58 275
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人