BigData
记录大数据转型之路
工一木子
Talk is cheap,show me the code!
展开
-
20200903-03-Hadoop运行模式之本地运行模式&伪分布式运行模式
准备工作:1.一台Linux机器【windows也支持,参考:https://cwiki.apache.org/confluence/display/HADOOP2/Hadoop2OnWindows】2.安装JDK3.安装Hadoop4.ssh免密码登陆配置本地运行模式操作过程:【参考:https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html#Standalo...原创 2020-09-03 08:26:55 · 357 阅读 · 0 评论 -
20200902-02-从Hadoop进入大数据生态圈
2.从Hadoop进入大数据生态圈2.1.Hadoop是什么1)apache的一个开源项目,用于大数据存储和计算2)官网(http://hadoop.apache.org)介绍The Apache Hadoop software library is a framework that allows for the distributed processing of large data sets across clusters of computers using simple .原创 2020-09-02 07:15:21 · 161 阅读 · 0 评论 -
20200902-01-大数据概论
1. 大数据概论1.1 大数据概念大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。1.2 大数据特点(4V)Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)-新增。 1.3 大数据应用场景1.4大数据发展前景1.5大数据部门业务流..原创 2020-09-02 06:34:50 · 201 阅读 · 0 评论 -
20200901-大数据开发学习准备
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言 一、pandas是什么? 二、使用步骤 1.引入库 2.读入数据 总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一、pandas是什么?示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数..原创 2020-09-01 07:10:16 · 145 阅读 · 0 评论