自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

寒小阳

专注机器学习/数据挖掘

原创 机器学习系列(7)_机器学习路线图(附资料)

计算机从数据中学习出规律和模式,以应用在新数据上做预测的任务。近年来互联网数据大爆炸,数据的丰富度和覆盖面远远超出人工可以观察和总结的范畴,而机器学习的算法能指引计算机在海量数据中,挖掘出有用的价值,也使得无数学习者为之着迷。 我们不是专家,但说起算有一些从业经验,做过一些项目在实际数据上应用机器...

2016-02-28 11:54:10

阅读数 62334

评论数 22

原创 ML学习分享系列(2)_计算广告小窥[中]

广告作为一项商业活动,是需要资本来滋养的。作为整个产业链的金主,只有广告主花钱做广告,使资金流动起来,整个广告行业才能正常运转。所谓关键技术,就是那些能让广告主觉得“这钱花的值”,让媒体网站觉得“这钱挣的快”的技术。具体都有哪些呢?下面我们一一来表。

2016-02-19 12:11:37

阅读数 24349

评论数 7

原创 NLP系列(5)_从朴素贝叶斯到N-gram语言模型

我们在之前文章《NLP系列(2)_用朴素贝叶斯进行文本分类(上)》探讨过,朴素贝叶斯的局限性来源于其条件独立假设,它将文本看成是词袋子模型,不考虑词语之间的顺序信息,就会把“武松打死了老虎”与“老虎打死了武松”认作是一个意思。那么有没有一种方法提高其对词语顺序的识别能力呢?有,就是本节要接到的N-...

2016-02-09 13:10:58

阅读数 19785

评论数 3

原创 NLP系列(4)_朴素贝叶斯实战与进阶

本文为朴素贝叶斯的实践和进阶篇,先丢了点干货,总结了贝叶斯方法的优缺点,应用场景,注意点和一般建模方法。紧接着对它最常见的应用场景,抓了几个例子,又来了一遍手把手系列,不管是对于文本主题分类、多分类问题(犯罪类型分类) 还是 情感分析/分类,朴素贝叶斯都是一个简单直接高效的方法。尤其是在和逻辑回归...

2016-02-03 15:07:54

阅读数 49628

评论数 16

原创 NLP系列(3)_用朴素贝叶斯进行文本分类(下)

上一篇文章我们主要从理论上梳理了朴素贝叶斯方法进行文本分类的基本思路。这篇文章我们主要从实践上探讨一些应用过程中的tricks,并进一步分析贝叶斯方法,最后以情绪褒贬分析和拼写纠错为例展示这种简单强大的方法在自然语言处理问题上的具体应用。

2016-02-03 15:02:55

阅读数 30996

评论数 8

原创 NLP系列(2)_用朴素贝叶斯进行文本分类(上)

1. 引言 贝叶斯方法是一个历史悠久,有着坚实的理论基础的方法,同时处理很多问题时直接而又高效,很多高级自然语言处理模型也可以从它演化而来。因此,学习贝叶斯方法,是研究自然语言处理问题的一个非常好的切入口。 2. 贝叶斯公式

2016-02-01 09:51:55

阅读数 35340

评论数 11

提示
确定要删除当前文章?
取消 删除