自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 深入理解Kafka

一、Kafka概述    Kafka是是分布式发布-订阅消息系统,是一个分布式的、可分区的、可复制的消息系统。    它最初由 LinkedIn 公司开发,使用 Scala语言编写,之后成为 Apache 项目的一部分。            它提供了类似于JMS的特性,但是在设计实现上完全不同,此外它并不是JMS规范的实现[因为是Scala实现的不是java实现的]。kafka对消息保存...

2018-09-23 17:44:59 628

原创 深入理解Zookeeper

1.Zookeeper是分布式应用程序的协调服务框架,是Hadoop的重要组件。ZK要解决的问题:a.分布式环境下的数据一致性。b.分布式环境下的统一命名服务c.分布式环境下的配置管理d.分布式环境下的分布式锁  单台机器使用的锁:同步代码块、重入锁。但是在分布式环境这个锁就发挥不出来作用。共享锁(常用于数据库中的读操作)和排他锁(写操作)e.集群管理问题分布式的思想:就是人多干活...

2018-09-26 14:44:13 382

原创 机器学习算法之--逻辑回归(LR)

今天进入我们正题,逻辑回归,在讲逻辑回归之前,先来看看线性回归是怎么一回事?回归抽象成数学中的x和y问题:x:表示自变量y:表示因变量因变量y和自变量x的关系:-y与x相关:y=f(x,w) w为参数-y还收到噪音的影响:y=f(x,w) + ε噪音(ε):就是错误的样本影响后来正确性的判断。一元线性回归:输入:一元自变量,一元因变量--n个样本(x1,y1...

2018-08-05 11:25:01 696

原创 机器学习算法之--朴素贝叶斯(NB)

机器学习算法很多,常见的有朴素贝叶斯,逻辑回归,决策树,等等今天让我们开启对朴素贝叶斯的认识。。。分类技术认识:定义:给定一个对象X,将其划分为到预定义好的某一个类别Yi中。-输入 : X-输出: Y (取值于有限集合{y1,y2,y3....yn})应用:邮件是否垃圾,病人分类,点击是否有效等等。通俗理解:这里输入对象是一篇文章X,那么到底是军事还是财经就是Y。常...

2018-08-02 17:47:58 1142

原创 推荐系统之--CF算法

上一节我们已经讲了CB算法这一次我们就来介绍推荐系统下一个算法:CF(Collaborative Filterin)基于协同过滤的推荐算法CF算法包含如下两类:User-Base CF 和 Item-Base CF CF算法和CB算法不同的是数据源是基于用户历史行为和物品的矩阵数据即UI(User—Iterm)矩阵数据,用户的行为通过一个表格来归纳起来。协同过滤输入数据只需要三...

2018-07-25 16:34:09 5797

原创 推荐系统之--CB算法

今天开始介绍推荐算法:推荐算法分为两类CB(Content--Base)基于内容的推荐算法CF(Collaborative Filterin)基于协同过滤的推荐算法今天我们就来讲讲关于CB算法,而其中CB算法包含如下两类: 1.引入Item属性的Content Base推荐: 工作原理:我们在上一节推荐系统之--入门篇中的推荐系统流程梳理中得到:1.上图中的...

2018-07-24 19:35:44 4173

原创 推荐系统之--入门篇

首先进入我们来步入今天的正题,推荐系统存在的意义:    随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代。在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:作为信息消费者,如何从大量信息中找到自己感兴趣的信息是一件非常困难的事情;作为信息生产者,如何让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。于是推荐系统应运而生。推荐系统...

2018-07-23 18:11:28 932

原创 隐马尔科夫模型--HMM和Viterbi算法

马儿可夫模型:一阶马尔科夫模型 = 二原语言模型n阶马尔科夫模型 = n+1原语言模型马尔科夫模型:每个状态只依赖之前有限个状态,马尔科夫模型是一条拉链,类似于一句话 ,可以切出多句词。如 由  NBA 可以联想到篮球马尔科夫模型有三类重要参数:     1.状态:存在多少个可选余地。比如一句话包含5个词语,则选择余地只有5个     2.初始概率:任何一个词都有可能出...

2018-07-20 16:04:02 360

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除