大数据
文章平均质量分 94
DataScientistGuo
想成为数据科学家的数据小白
展开
-
大数据入门-基础篇01-hadoop框架简介
声明:本文主要根据八斗学院孙国宇老师的Hadoop大数据实战手册进行的整理,仅限入门学习! 第一章 hadoop简介 Hadoop 是一个由 Apache 基金会所开发的开源分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储。解决了大数据(大到一台计算机无法进行存储,一台计算机无法在要求的时间内进行处理)的可靠存储和处理。适合处理非翻译 2017-12-15 10:28:42 · 2525 阅读 · 0 评论 -
Centos下Spark单机版(python)安装配置
Apache Spark是快速、易于使用的框架,允许你解决各种复杂的数据问题,无论是半结构化、结构化、流式、或者机器学习、数据科学。它已成为大数据方面最大的开源社区之一,拥有来自250多个组织的超过1000个贡献者。原创 2017-12-22 10:07:37 · 2160 阅读 · 1 评论