![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
C与C++
文章平均质量分 78
jaspersong
用心生活
展开
-
邮件透明过滤-贝叶斯垃圾邮件过滤
贝叶斯过滤器的理论介绍代码示例:#include "ProbC.h"#include "common.h"#define SPAMSIZE 50 #define PAMSIZE 50 #define MAXWORDS 15 FindWordNum(char原创 2013-06-16 18:44:52 · 832 阅读 · 0 评论 -
邮件透明过滤-构造哈希字典
贝叶斯邮件过滤的第一步是进行中文分词的提取,这里涉及到的第一个技术点就是建立字典的map结构,为后面的垃圾库和和法库做好准备。这里主要介绍字典库的建立:#include #include #include #include #include using namespace std;/**Reference:http://blog.csdn.net/qll125596718/原创 2013-06-16 15:54:24 · 545 阅读 · 0 评论 -
邮件透明过滤-map的相关操作
C++标准模板库中的MAP容器是关联的key/value对容器,key自动排序,它的功能非常强大。MAP对象是模板类,需要关键字和存储对象两个模板参数:std:mappersonnel这就定义了一个用int作为索引,并拥有相关联的指向string的指针。提供一对一的数据处理能力,由于这个特性,它完成有可能在我们处理一对一数据的时候,在编程上提供快速通道。std map内部数据的组织,s原创 2013-06-16 16:55:54 · 610 阅读 · 0 评论 -
邮件透明过滤-中文关键词的提取
基于字符串的逆向匹配的中文分词器一、逆向最大匹配算法:基本思想:选取固定长个汉字的符号串作为最大符号串,把最大符号串与词典中的单词条目相匹配,如果不能匹配,就去掉最左边的一个汉字继续匹配,直到在词典中找到相应的单词为止。匹配方向是从右向左,减字方向是从左向右。算法流程: 第一步:初始化字符串并设置最大符号串的长度MaxWordLen=30;S1为待分析字符串原创 2013-06-16 17:21:26 · 1435 阅读 · 0 评论