大数据学习
文章平均质量分 64
UserOrz
这个作者很懒,什么都没留下…
展开
-
MapReduce读取Hbase中的数据
Hbase提供了TableMapReduceUtil工具类,可以直接使用需要提供的包括,表名、Scan对象、mapper的class对象、输入,输出类型的class对象和job对象TableMapReduceUtil.initTableMapperJob( Names.TABLE.getValue(),//表明 scan,//Scan类 AnalysisBeanMapper.class,//关联mapper方法 AnalysisKey.class,//原创 2022-03-15 22:34:54 · 2226 阅读 · 0 评论 -
机器学习期末复习
一些知识点1、机器学习方法包括***模型、学习准则、优化算法***三大基本要素2、损失函数用于量化模型预测和真实标签之间的差异,常用的损失函数包括交叉熵损失函数、平方损失函数、绝对值损失函数3、常用的神经网络结构有前馈神经网络、卷积神经网络、循环神经网络4、在神经网络的训练中常采用反向传播来高效计算梯度5、卷积神经网络是一种具有局部连接、权值共享特性的深层前馈神经网络6、一般卷积网络一般由卷积层、池化层/汇聚层、全连接层交叉堆叠而成的前馈神经网络7、卷积神经网络三大结构特性局部连接、权值共享、原创 2022-01-12 19:35:53 · 1829 阅读 · 1 评论 -
phoenix-5.1.2-hbase-2.4安装及使用详细步骤
1 、简介Phoenix最早是saleforce的一个开源项目,后来成为Apache基金的顶级项目。Phoenix是构建在HBase上的一个SQL层,能让我们用标准的JDBC APIs而不是HBase客户端APIs来创建表,插入数据和对HBase数据进行查询。put the SQL back in NoSQLPhoenix完全使用Java编写,作为HBase内嵌的JDBC驱动。Phoenix查询引擎会将SQL查询转换为一个或多个HBase扫描,并编排执行以生成标准的JDBC结果集。直接使用HBa原创 2021-11-02 11:20:28 · 3311 阅读 · 0 评论 -
实验四:MapReduce中级编程实践
一、实验目的L通过实验掌握基本的MapReduce编程方法;掌握用MapReduce解决一些常见的数据处理问题,包括数据去重计数、数据排序。二、实验平台操作系统:LinuxHadoop版本:3.3.1三、实验步骤实验所使用的文件链接:链接:https://pan.baidu.com/s/16zyA_DZwu9anxjwdHnbMOw提取码:57ky(一)对访问同一个网站的用户去重计数。 注:文件userurl_20150911中,数据以”\t”隔开,用户手机号为第三列,网站主域原创 2021-10-26 11:56:04 · 862 阅读 · 1 评论 -
HBase-2.4.6安装教程 附常见错误解决
我这里采用了jdk1.8.0_301+hadoop-3.3.1+zookeeper-3.6.3+hbase-2.4.6的版本不同版本可能不能兼容,兼容性问题可以去官网查看http://hbase.apache.org/book.html#_preface我这里有三台虚拟机,hadoop102,hadoop103,hadoop1041、zookeeper正常部署首先保证三台机器的zookeeper正常启动[user@hadoop102 zookeeper-3.6.3]$ bin/zkServer.s原创 2021-10-09 12:04:31 · 853 阅读 · 0 评论 -
Zookeeper-3.6.3安装教程
1、介绍ZooKeeper是用Java编写的,运行在Java环境上,因此,在部署zookeeper的机器上需要安装Java运行环境。为了正常运行zk,我们需要JRE1.6或者以上的版本。对于集群模式下的ZooKeeper部署,3个ZooKeeper服务进程是建议的最小进程数量,而且不同的服务进程建议部署在不同的物理机器上面,以减少机器宕机带来的风险,以实现ZooKeeper集群的高可用。2、下载解压1、在官网下载需要的zookeeper版本,我这里下载的是zookeeper-3.6.32、将下载后原创 2021-10-08 22:30:07 · 2258 阅读 · 0 评论 -
hadoop常用端口号与配置文件
常用端口号hadoop3.xHDFS NameNode 内部通常端口:8020/9000/9820HDFS NameNode 对用户的查询端口:9870Yarn 查看任务运行情况:8088历史服务器:19888hadoop2.xHDFS NameNode 内部通常端口:8020/9000HDFS NameNode 对用户的查询端口:50070Yarn 查看任务运行情况:8088历史服务器:19888常用配置文件hadoop3.xcore−site.xmlhdfs−site.xm原创 2021-09-27 09:53:10 · 594 阅读 · 0 评论 -
CentOS 6虚拟机Hadoop安装教程
本人初学hadoop,在安装配置环境时发现网上大部分博客的教程都不太完善,所以我结合了这些博客内容和老师的讲解写了下面这一份教程,这些操作都是本人经过尝试确认过没有问题的操作(~~如果有问题的话希望大家能够指出~~ )在安装中有什么注意点我都会提,希望能够对各位有帮助原创 2021-09-08 18:06:53 · 1256 阅读 · 0 评论