1.01^365=31.78 (Lucene、ES、ELK开发交流群: 370734940)

Engineers are versatile minds who create links between science, technology, and society

机器学习之朴素贝叶斯分类

贝叶斯概率在机器学习、自然语言处理中被广泛地应用,对于海量数据的文本分类问题(比如垃圾邮件的甄选和过滤),基于贝叶思的算法取得非常好的效果。一、概率基础概率:概率是某一事件或者预测行为的可信程度。取值在0-1之间。 比如,抛一枚硬币,正面朝上的可能性和反面朝上的肯能性是相等的,都是0.5.条件概率...

2016-05-26 18:28:59

阅读数:1700

评论数:0

scrapy+Lucene搭建小型搜索引擎(现代信息检索大作业)

一、选题工程类搜索型: 定向采集 3-4 个新闻网站, 实现这些网站信息的抽取、索引和检索。网页数 目不少于 10 万条。能按相关度、时间、热度 (需要自己定义) 等属性进行排序, 能实现相似 新闻的自动聚类。 要求: 有相关搜索推荐、snippet 生成、结果预览 (鼠标移到...

2016-05-22 22:51:12

阅读数:13271

评论数:14

MapReduce编程实例

需求输入文件:文本文件 每行格式: <source> <destination> <time> 3个部分由空格隔开 其中source和destination为两个字符串,内部没有空格 time为一个浮点数,代表时间(秒为单位) 涵义:可以表示一次电话通话,...

2016-05-04 16:42:00

阅读数:2307

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭