- 博客(4)
- 问答 (1)
- 收藏
- 关注
原创 VMware虚拟机主机模式上网问题
VMware虚拟机主机模式下,真实环境和虚拟环境是隔离开的;在这种模式下,所有的虚拟系统是可以相互通信的,但虚拟系统和真实的网络是被隔离开。其实在虚拟机中稍微设置一下,就可以实现在主机模式下上网。 1.虚拟机选择主机模式 2.选择“编辑”里的“虚拟网络编辑器”,勾选“将主机虚拟适配器连接到此网络”,不要勾选“使用本地DHCP服务将IP地址分配给虚拟机”,子网IP我设的是192.168.
2015-12-07 19:27:42 7229 1
原创 Spark1.5.2伪分布安装
Spark1.5.2伪分布式安装 一、安装包准备 1. spark-1.5.2-bin-hadoop2.6 2. scala-2.11.7 要安装spark,首先在虚拟机中安装hadoop,我的虚拟机中已经安装了hadoop,所以此步骤略过。 二、安装Scala 1.解压scala压缩包并将文件夹改为scala 2.执行命令vi /etc/profil
2015-12-04 10:03:13 333
原创 Hive学习篇2
WordCount单词统计 在开始学习编程时都要写一个Hello World程序,学习hive也一样,也要做一个wordcount单词统计。 为了做这个wordcount单词统计,我找了一篇英语短文来做测试。 首先现在hive中建一个words表,用来存储英语短文,字段自己设置,数据类型为string。 然后将英语短文内容存入words表中。
2015-11-21 21:07:45 320
原创 hive学习篇1
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能,它的本质就是将SQL转换成MapReduce程序。 Hive本身建立在Hadoop的体系结构上,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行。并按照该计划生成MapReduce任务后交给Hadoop集群处理。
2015-11-19 12:11:06 370
空空如也
使用python如何自动关注微信公众号
2016-12-10
TA创建的收藏夹 TA关注的收藏夹
TA关注的人