- 博客(6)
- 收藏
- 关注
原创 朴素贝叶斯实现垃圾信息分类
朴素贝叶斯实现垃圾信息分类代码github1.贝叶斯定义(贝叶斯算法介绍)P(A|B) = P(B|A) * P(B) / P(A)2.训练过程1) 中文分词(以下简称特征),过滤掉中英文符号,数字,字母,单个词2)将所有特征组成一个去重的词向量列表3)计算各个特征在所有分类下的概率3.分类预测1)将待分类数据,分词,向量化2)根据贝叶斯公式计算各个分类下的概率,取最大概率即分类结果4.优化1
2017-10-18 10:27:18 2090
原创 spring namespacehandler问题
错误:Unable to locate Spring NamespaceHandler for XML schema namespace The matching wildcard is strict, but no declaration can be found for element 'motan:registry'解决方法:maven配置:
2015-12-01 21:05:08 577
翻译 Storm UI参数详解
* Storm UI 详解* 基本术语 * Tasks * task是spout或blot的执行线程。一个topology里有很多个worker进程,一个worker进程包含一个或多个spout/bolt进程。比如在配置文件中给50个worker配置300个线程,相当于每个worker执行6个线程,在优化集群的时候可以配置并行执行的进程、以及指定那些wor
2015-09-12 14:49:47 2233
原创 HBase之简介
(一)HBase之简介 * 概念 * HBase是一个高可靠性、高性能、面向列、可伸缩、支持版本控制、稀疏的、多维度的和排序的分布式数据库。 * 高可靠性: * (1): 在数据的写入过程中,数据首先会写到预写日志WAL(write ahead log)中,再写到memstore(内存)中,一旦
2015-03-10 01:35:21 472
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人