自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 朴素贝叶斯实现垃圾信息分类

朴素贝叶斯实现垃圾信息分类代码github1.贝叶斯定义(贝叶斯算法介绍)P(A|B) = P(B|A) * P(B) / P(A)2.训练过程1) 中文分词(以下简称特征),过滤掉中英文符号,数字,字母,单个词2)将所有特征组成一个去重的词向量列表3)计算各个特征在所有分类下的概率3.分类预测1)将待分类数据,分词,向量化2)根据贝叶斯公式计算各个分类下的概率,取最大概率即分类结果4.优化1

2017-10-18 10:27:18 2090

原创 spring namespacehandler问题

错误:Unable to locate Spring NamespaceHandler for XML schema namespace     The matching wildcard is strict, but no declaration can be found for element 'motan:registry'解决方法:maven配置:

2015-12-01 21:05:08 577

原创 Hive之UDTF

2015-11-14 15:30:03 460

原创 Storm示例

2015-09-22 19:34:40 390

翻译 Storm UI参数详解

* Storm UI 详解* 基本术语  * Tasks     * task是spout或blot的执行线程。一个topology里有很多个worker进程,一个worker进程包含一个或多个spout/bolt进程。比如在配置文件中给50个worker配置300个线程,相当于每个worker执行6个线程,在优化集群的时候可以配置并行执行的进程、以及指定那些wor

2015-09-12 14:49:47 2233

原创 HBase之简介

(一)HBase之简介 * 概念     * HBase是一个高可靠性、高性能、面向列、可伸缩、支持版本控制、稀疏的、多维度的和排序的分布式数据库。       * 高可靠性:         * (1): 在数据的写入过程中,数据首先会写到预写日志WAL(write ahead log)中,再写到memstore(内存)中,一旦

2015-03-10 01:35:21 472

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除