自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 《一文掌握工作中常用的hive查询》

https://zhuanlan.zhihu.com/p/127148740

2020-04-10 15:20:19 153

原创 《大数据分析教程-Hive》

Hive是大数据(hadoop)生态系统非常重要的一个工具,它提供了一种类SQL的语言,可以查询存储在Hadoop分布式文件系统(HDFS)中的数据,也可以查询Hadoop数据库(Hbase)中的数据,可以说通过Hive这个数据仓库工具大大降低了开发难度,对于数据分析师来说真的非常友好,只要使用SQL语言的分析师就可以轻松的使用Hive玩转大数据,当然Hive和其他的基于SQL的环境还是有一些差异...

2020-03-05 15:22:32 364

原创 《大数据分析-Hive》

Hive是大数据(hadoop)生态系统非常重要的一个工具,它提供了一种类SQL的语言,可以查询存储在Hadoop分布式文件系统(HDFS)中的数据,也可以查询Hadoop数据库(Hbase)中的数据,可以说通过Hive这个数据仓库工具大大降低了开发难度,对于数据分析师来说真的非常友好,只要使用SQL语言的分析师就可以轻松的使用Hive玩转大数据,当然Hive和其他的...

2020-03-05 15:18:43 334

原创 《将博客搬至CSDN》

《将博客搬至CSDN》

2019-08-06 19:34:00 117

原创 数据分析实战之战略分析(一)

情景:假设你在去哪儿网任数据分析一职,现在boss不满足现状,计划开展海外业务,为此你需要进行相应的战略分析!! 战略分析作为企业的分析师的你如何分析?正如前文《数据分析实战之开篇闲谈》所提到三步走:1.为什么要进行数据分析?(why)2....

2019-08-06 19:30:00 758 1

原创 如何将自己打造企业想要的人才

现代市场营销之父菲利普●科特勒说过:“市场营销是企业的一种活动,旨在识别目前尚未满足的需求和欲望,估量和确定需求量的大小,选择和决定本企业能最好地为其服务的目标市场,并决定适当的产品、服务和计划,以便为目标市场服务。”那么您如何满足企业的欲望和需求呢?答案很直接:看JD!!! 注:JD指职位描述(JobDescription)可以在招聘网站或者软件上搜数据分析。每家的公司的职...

2019-08-06 11:24:00 173

原创 数据分析实战之开篇闲谈

数据分析伴随着人工智能,大数据的技术在近些年真的火起来了,python,机器学习,神经网络等专业术语也跟着火了,那么学好数据分析,我是学R语言还是学python呢,我要不要学hadoop等大数据框架呢?我要学机器学习等算法呢?等等一系列的问题在网络上流传,也许你的网盘里有一堆这样的资料(收藏不看系列),也许你真的会熟练这些处理数据工具?那么真的能解决企业业务难题?真的能解决业务需求?...

2019-08-05 21:21:00 252

原创 机器学习教程 五.SVM(支持向量机)算法理解和应用

这篇博客我本来想花大力气来写的,写到一半时发现有人已经做了充足的工作,而且写的很完美,此处膜一下July的这篇《支持向量机通俗导论(理解SVM的三层境界)》本着不重复造轮子的思想(其实我写了不一定有他好),我简单介绍SVM和如何在sklearn中运用。我们现在要学习另一种形式的监督机器学习和分类算法:支持向量机。支持向量机的目标是找到数据间的最佳分割边界。在二维空间中,你可以把它想象成分割数据集的...

2018-01-04 10:25:59 774

原创 机器学习教程 四.KNN(k最近邻)算法理解和应用

导语:商业哲学家 Jim Rohn 说过一句话,“你,就是你最常接触的五个人的平均。”那么,在分析一个人时,我们不妨观察和他最亲密的几个人。同理的,在判定一个未知事物时,可以观察离它最近的几个样本,这就是 kNN(k最近邻)的方法。我们现在开始一个新的部分:分类算法。在分类算法中,我们将介绍两个主要的算法:K近邻(KNN)和支持向量机(SVM)。虽然这两种算法都是分类算法,但他们有很大

2017-12-29 13:46:29 3577

原创 机器学习教程 三.回归理论及代码实现

“有些事情我们知道我们知道这些事,我们还知道有些事情我们知道我们不知道。这就是说,有些事情我们不知道,但是还有些我们不知道我们不知道,也就是说有些事情我们不知道我们不知道这些事。”——《已知与未知》(Known and Unknown)。对于“有些事情我们不知道我们不知道这些事”正需要我们通过探索学习才能发现“新大陆”,那么今天我们把这任务交给机器学习吧!嘿嘿。。接下来开始我们的学习这篇博

2017-12-28 13:14:34 849

原创 机器学习教程 二.在股票上的回归预测

这一篇算是实战篇,如果有对里面的步骤或者代码不是很明白,不用担心我们现在要做是知道机器学习的整个流程,心有余力可以查查资料,我会在后面一篇详细解释回归算法,下面我们将对股票价格利用线性回归和支持向量机两种算法构建我们的模型来预测。我们这篇博客将要学到内容包括:1,数据的预处理2,交叉验证3,构建我们的模型4,训练我们的模型5,完成我们的预测6,n_jobs的作用和如何选择我

2017-12-27 18:05:07 7974 2

原创 机器学习教程 一.初识机器学习与数据认识

这系列博客让你对机器学习有一个整体的理解,包括理论,应用,以及监督、无监督和深度学习算法的内部工作。 我将介绍线性回归、K近邻、支持向量机(SVM)、层次聚类和神经网络等。

2017-12-27 12:05:34 890

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除