自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 收藏
  • 关注

转载 教你4步打通数据化运营的任督二脉

还没关注?快动动手指!大数据时代到来,数据智能成为当下相当多零售企业转型升级寄予厚望的利器,数据化运营模式成为流行模式被追捧。一方面,我们确实看到不少先锋企业在数据化运营...

2019-01-31 09:18:31 170

转载 成为Python大牛必须要掌握的高端语法——yield

还没关注?快动动手指!作者:grisse 链接:https://segmentfault.com/a/1190000017405045这是stackoverflow...

2019-01-30 10:56:38 111

转载 数据运营分析无从下手?给你分享10招!

还没关注?快动动手指!眼花缭乱的东西很多,真正派上用场的,却不见得是那些看起来炫酷的。很多方法朴实无华,却解决大量的问题。下面十个方法都是我这么多年做分析时一定会用到的最...

2019-01-29 09:02:43 146

转载 通勤途中就可以涨知识的妙招哦

不管你在哪个城市奋斗,也许都会有半个至一个小时的通勤时间,这段时间你也许在吃早饭,在刷朋友圈,在看抖音,在翻头条,在玩游戏......是否曾想过让这些碎片化时间更具价值呢...

2019-01-28 09:00:00 119

转载 数据分析师必备的基本统计学知识

还没关注?快动动手指!数据分析师,无疑是数据时代最耀眼的职业之一,统计学,又是数据分析师必备的基础知识。知识点汇总:1.集中趋势(Central Tendency)2.变...

2019-01-27 10:30:00 334

转载 描述数据分布特征的五种可视化图形

还没关注?快动动手指!01 数据分布图简介中医上讲看病四诊法为:望闻问切。而数据分析师分析数据的过程也有点相似,我们需要望:看看数据长什么样;闻:仔细分析数据是否合理;问...

2019-01-26 10:30:00 12594

转载 如何用Python分析泰坦尼克号生还率?

还没关注?快动动手指!1912年当时世界上最大的豪华客轮泰坦尼克号在处女航中撞上冰山沉没,船上船员及乘客共有2224人,只有710人生还。当灾难突然降临时,所有人的生死瞬...

2019-01-25 09:00:00 541

原创 大数据之脚踏实地学11--Spark神器的安装

还没关注?快动动手指!前言在《大数据之脚踏实地学10--Hive独立式安装》一文中我们已经介绍了Hive工具的安装流程,基于Hive可以轻松的在Hadoop集群内实现SQ...

2019-01-24 09:00:00 118

转载 从“Δ值”谈数据分析的流程

还没关注?快动动手指!作者:Ahong介绍:一个跨界的心理学专家公众号:CrossHands数据分析的起点通常来自于“Δ值”。不妨如此定义Δ值:在某时间点(段)某群体的某...

2019-01-22 09:00:00 216

转载 基于5个案例描述大数据如何应用在零售业

还没关注?快动动手指!随着零售业持续加速扩张,商户们也急于寻找大数据在零售业中的最佳用例。根据财经网站Kiplinger报道,2017年,光是零售业销售额就有望增长3.5...

2019-01-21 09:00:00 690

转载 决策树学习笔记(三):CART算法,决策树总结

作者:xiaoyu介绍:一个半路转行的数据挖掘工程师推荐导读:本篇为树模型系列第三篇,旨在从最简单的决策树开始学习,循序渐进,最后理解并掌握复杂模型GBDT,Xgboo...

2019-01-20 10:30:00 875

转载 【聚类分析】典型行业数据实践应用!

01 聚类分析的典型应用场景聚类分析的一个重要用途就是针对目标群体进行多指标的群体划分,类似这种目标群体的分类就是精细化经营,个性化运营的基础和核心,只有进行了正确的分类...

2019-01-19 20:06:39 1490

转载 用数据说谎How to Lie with Data

作者:Ahong介绍:一个跨界的心理学专家公众号:CrossHands不管是前几年流行的手机安兔兔跑分,还是每年双11各家电商晒成绩——人们大概就像希望自己银行卡上的余额...

2019-01-18 09:38:54 139

转载 决策树学习笔记(二):剪枝,ID3,C4.5

还没关注?快动动手指!作者:xiaoyu介绍:一个半路转行的数据挖掘工程师推荐导读:本篇为树模型系列第二篇,旨在从最简单的决策树开始学习,循序渐进,最后理解并掌握复杂模...

2019-01-17 09:00:00 358

原创 大数据之脚踏实地学10--Hive独立式安装

li还没关注?快动动手指!前言在《大数据之脚踏实地学09--Hive嵌入式安装》一文中我们详细介绍了Hive嵌入式的安装流程,即默认使用Hive的内置Derby数据库作为...

2019-01-16 09:00:00 129

原创 大数据之脚踏实地学04--在Linux系统中安装Java

实操 本期将基于《大数据之脚踏实地学03--Linux的常用文件级命令》的知识,分享如何在Linux系统中安装Java。可能你会问,为什么选择Java安装的分享,而不是Python,或其他工具呢?这是由于Hadoop的运行是依赖于Java的,后期我们还会介绍Hadoop这款工具的安装和使用。安装Java实际上就三个流程,分别是下载、安装和配置环境变量,接下来详细介绍Java的安装过程。...

2019-01-15 15:41:18 199

原创 大数据之脚踏实地学03--Linux的常用文件级命令

前言 众所周知,大数据应用工具(如Hadoop、Storm、Hive、Spark等)都是运行于Linux系统中。所以,第一步要做的就是认识并操作Linux系统(正如你对Windows系统中的了解),而这一步又显得尤为基础和重要。对于Linux系统的操作,与图形化的Windows系统完全不同,它都是基于命令完成的。故从本期开始,将陆续介绍Linux的常用命令,包括文件处理命令、权限命令、搜索...

2019-01-14 15:44:35 230

原创 大数据之脚踏实地学02--远程连接与目录结构

前言 在上一期的脚踏实地学中,我们介绍了如何在自己的Windows系统中安装虚拟机和CentOS系统,这个操作相当于模拟了一台远程服务器(注意,这是模拟哦。土豪的你可以考虑购买另一台物理机作为服务器,或者购买云服务,如阿里云,腾讯云等)。亲爱的读者,你就把她想象成隔壁机房中的一台物理机,需要时就连接她,那么问题来了,既然是隔壁机房,总不能每次跑过去开机、访问、干活吧,如果不是一个用户在...

2019-01-14 15:06:51 238

原创 大数据之脚踏实地学01--虚拟机和Linux系统的安装

前言 曾记得我在读研的时候,参加了中国统计年会(2013年),在会上很多领域内的专家都谈及了大数据一词,然而那个时候的我并没有那么敏感。短短5年过去了,大数据行业发展之迅速,技术迭代之成熟,迫使自己不断地学习新的技能。对于大数据领域,有哪些必备技能需要掌握呢?首先是基础语言的使用,例如Java就是大数据中最基础的编程语言,很多大数据架构工具都是基于Java开发的,如果不掌握她,该如何驾...

2019-01-14 14:56:43 283 1

转载 决策树学习笔记(一):特征选择

作者:xiaoyu介绍:一个半路转行的数据挖掘工程师相信很多朋友已经对决策树很熟悉了,决策树是机器学习中的一种基本的可用于分类与回归的方法,它是一些集成学习如GBDT,X...

2019-01-13 10:30:00 1704

转载 教程 | 十分钟学会函数式 Python

还没关注?快动动手指!导读:函数式编程到底是什么?本文将详解其概念,同时分享怎样在 Python 中使用函数式编程。主要内容包括列表解析式和其他形式的解析式。作者:Br...

2019-01-12 11:00:00 100

原创 大数据之脚踏实地学09--Hive嵌入式安装

还没关注?快动动手指!前言经过前面几期内容的介绍,相信大家已经把Hadoop的环境搭建好了吧。正如前几期所说,Hadoop的搭建实际上最核心的就是HDFS(文件存储系统)...

2019-01-10 08:30:00 163

转载 2019年首次赠书,9本免费送!

引言2019新年起始,给大家整一波福利,本次免费送出9本书!这一次,「涛哥聊Python」与「数据分析1480」,「简说Python」三个公众号联合送书,一共送出9本书,...

2019-01-09 09:00:00 158

转载 干货 | Python 开发者节省时间的 10 个方法

还没关注?快动动手指!Python 是一个美丽的语言,可以激发用户对它的爱。所以如果你试图加入程序员行列,或者你有点厌倦C++,Perl,Java 和其他语言,我推荐你尝...

2019-01-07 08:49:52 107

转载 12个ggplot2扩展包帮你实现更强大的可视化

ggplot2 Extension转自:生信宝典(Bio_Data),不一样的生信学习平台。“ggplot2自从2007年推出以来,成为世界范围内下载最频繁、使用最广泛的...

2019-01-06 11:00:00 495

转载 数据分析师必须掌握5种常用聚类算法

还没关注?快动动手指!聚类是一种将数据点按一定规则分群的机器学习技术。给定一组数据点,我们可以使用聚类算法将每个数据点分类到一个特定的簇中。理论上,属于同一类的数据点应具...

2019-01-05 11:00:00 1537

原创 大数据之脚踏实地学08--搭建Hadoop集群【2】

还没关注?快动动手指!前言在《大数据之脚踏实地学07--搭建Hadoop集群【1】》中,讲解的是虚拟机的配置(包括网络设置、主机名修改和克隆等),文中我们在VMware中...

2019-01-04 09:00:00 158

转载 一文读懂R中的探索性数据分析

还没关注?快动动手指!探索性数据分析(EDA)是数据项目的第一步。我们将创建一个代码模板来实现这一功能。 简介 EDA由单变量(1个变量)和双变量(2个变量)分析组成。简...

2019-01-03 09:00:00 207

原创 大数据之脚踏实地学07--搭建Hadoop集群【1】

还没关注?快动动手指!前言前几期基本上讲的都是Linux的命令,个人觉得掌握这么多的命令后,基本上就够用啦(相当已经掌握了Windows系统的操作)。学习Linux命令只...

2019-01-02 09:00:00 134

转载 入门 | 如何从零基础入职数据分析?

还没关注?快动动手指!转行,这个话题我觉得许多朋友都非常感兴趣。毕竟工作伴随着我们的一生,也是我们的主要收入来源,任谁都希望能拥有一份高薪又有前景的工作!时下的大数据时代...

2019-01-01 11:02:37 278

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除