自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(3)
  • 收藏
  • 关注

转载 数据挖掘核心算法之一--回归

回归,是一个广义的概念,包含的基本概念是用一群变量预测另一个变量的方法,白话就是根据几件事情的相关程度,用其中几件来预测另一件事情发生的概率,最简单的即线性二变量问题(即简单线性),例如下午我老婆要买个包,我没买,那结果就是我肯定没有晚饭吃;复杂一点就是多变量(即多元线性,这里有...

2017-05-20 22:41:00 161

转载 大数据初步分析之描述性统计量-R语言

描述性统计量,在不浏览全部数据的情况下,获得数据集中的全距、极值以及分位数信息,同时得到数据大致分布以及数据离散和偏离程度等,这些信息对我们处理海量数据集的抽样问题,以及建模的指标选取问题都有巨大的作用,就算是我们机器学习的模型运行后的结果数据,都可以用这些描述信息来获得我们想要的...

2017-05-13 22:15:00 686

转载 R最简文本挖掘之---凡人修仙传

最近一直迷恋文本挖掘,其实大数据在非结构化的处理上主要要解决的一个问题就是文本挖掘(就像你看Hadoop第一个例子就是countWord),主要还是以前看小说看的多,有时候就想总结一下,看看每个作者都喜欢用哪些词汇。 文本挖掘要解决几个问: ...

2017-05-10 22:15:00 135

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除