大数据
文章平均质量分 72
机器变得更残忍
做一个快乐的程序员
展开
-
目标!半天学完《Spark快速大数据分析》核心概念
在写下这个标题的时候已经下午了,看来只有半天时间了(汗初衷以及Spark简介最近找工作,发现很多公司都要求Hadoop、Spark,我平时也没有啥这方面的需求所以没学,而且这个东西真正用起来需要分布式集群。 于是买了本书《Spark快速大数据分析》,挺薄的,而且是三种语言写的(java,scala,python),如果只看Python,目测一天就能学完核心概念。 配置环境学习一门新技术,环境配置原创 2017-08-13 23:48:46 · 708 阅读 · 0 评论 -
Tableau 可视化初体验
Tableau是一款商业型的可视化软件,无需编程基础,只需要拖拽就能很方便地制作出一个精美的而且支持交互的可视化数据。安装这是public版,输入邮箱就能下载安装了 https://public.tableau.com/s/ 还有收费版,通过时间驻留器就能无限试用,这里不推荐,还是要支持正版的使用方法导入数据刚开始进入程序需要导入数据 支持的格式挺多的,这里拿Titanic数据集来举例原创 2017-08-13 23:56:07 · 2855 阅读 · 1 评论