- 博客(19)
- 资源 (25)
- 收藏
- 关注
原创 01-安装Spark-2.0.2--配置支持pytho3、ipython3
前言本篇博文为博主开始学习Spark技术的第一篇博客。1. 下载安装Spark-2.0.2因为参考书籍:Spark快速大数据分析使用的是Spark-1.0不支持python3,且官网下载时没有以前版本的链接,并且博主所安装的Hadoop集群为2.7.3,因此下载Spark-2.0版本。下载Spark官网链接:http://spark.apache.org/downloads.html...
2018-12-26 22:12:44 720
原创 Sqoop从MySQL导入数据到HBase使用root用户失败
报错ERROR manager.SqlManager: Error executing statement: java.sql.SQLException: Access denied for user 'root'@'master' (using password: YES)java.sql.SQLException: Access denied for user 'root'@'maste...
2018-12-25 18:36:54 523
原创 爬取赶集网招聘信息:Python3+requsts+正则+MySQL
1. 前言本次爬虫使用:Python3requsts 请求正则解析MySQL 存储2. 爬取结果示例时间:2018年12月25日,每个类别分别爬取 1 个分页,共获取:2673条数据。(运气好,一次运行完成,IP没有被限制)3. 运行须知运行前确保MySQL中已创建相应数据库、表运行过程中很可能报错退出,最可能的原因就是访问网站过多,IP被限制,需要验证,手动使用浏览器...
2018-12-25 15:36:32 638
原创 运行MapReduce程序报错--java.lang.Exception: java.lang.RuntimeException: java.lang.NoSuchMethodException
java.lang.Exception: java.lang.RuntimeException: java.lang.NoSuchMethodException: com.gyt.collaborativeFiltering.CollaborativeFilteringByUser$ColFilterMapper.<init>() at org.apache.hadoop.mapre...
2018-12-22 09:49:13 2219
原创 协同过滤算法基于用户--使用MapReduce框架实现为用户推荐电影
package com.gyt.collaborativeFiltering;import java.io.BufferedReader;import java.io.File;import java.io.FileOutputStream;import java.io.FileReader;import java.io.IOException;import java....
2018-12-20 20:25:01 2692 3
原创 四种方法解决 -- HBase启动shell报错--ERROR: Can't get master address from ZooKeeper; znode data == null
1.报错如下:hbase(main):001:0> listERROR: Can't get master address from ZooKeeper; znode data == nullHere is some help for this command:List all tables in hbase. Optional regular expression parame...
2018-12-18 10:55:16 6227 6
原创 Sqoop相关功能操作示例
安装Sqoop:https://blog.csdn.net/qq_38038143/article/details/847280241.查看sqoop命令帮助hadoop@master:~$ sqoop help18/12/05 17:40:01 INFO sqoop.Sqoop: Running Sqoop version: 1.4.7usage: sqoop COMMAND [ARGS...
2018-12-14 16:48:54 784
原创 JavaWeb-实现文件上传、下载-三个版本
1. 使用Comm组件https://blog.csdn.net/qq_38038143/article/details/849609932. 使用Smart组件可按文件名搜索文件https://blog.csdn.net/qq_38038143/article/details/849602932. 使用Smart组件可按文件名、文件内容搜索文件(Hadop的倒排索引技术)My...
2018-12-14 11:41:04 297
原创 JavaWeb-文件上传下载-可基于文件内容查询文件(MySQL+Servlet+Hadoop)
hdfs dfs -mkdir -p /data/fileSmartUploadhdfs dfs -mkdir -p /output/
2018-12-13 21:44:02 1340 2
原创 Linux查看Tomcat端口
分别执行命令:ps -ef| grep tomcatsudo netstat -apn | grep 7507 # 进程ID根据上条命令查看如图:
2018-12-13 21:03:46 47292
原创 JavaWeb-文件上传下载-Comm组件
最终效果:直接上代码:CSDN:https://download.csdn.net/download/qq_38038143/10843987GitHub:https://github.com/GYT0313/FileUploadDownload更加完善版:文件搜索、图片拖拽上传https://blog.csdn.net/qq_38038143/article/details/849...
2018-12-11 20:09:02 769
原创 JavaWeb-Smart组件实现文件上传下载
1.最终效果:![在这里插入图片描述2. 代码结构分析:JAVA代码共4个文件:主要功能分别如下:编码过滤器展示文件下载文件上传文件JSP页面共两个文件:主要功能分别如下:主页页面展示(上传、下载、查询等)拖拽上传图片的处理JSP页面静态文件和JAR包:3. 代码分析:SmartUploadServlet.java:使用SmartU...
2018-12-11 19:48:58 656
原创 MapReduce练习 - 倒排索引
问题描述读取多个文件的内容,计算内容在那个文件有出现,并且计算其出现的次数(权重),如下:已有三个文件,其内容如下:经过处理,其处理结果如下:以第一行为例: 表示在file1.txt,file2.txt各包含1个 Hadoop。准备输入文件:上传到 hdfs://master:9000/data/indvertedIndex2:代码思路:在Mapper端:根据输入内...
2018-12-06 19:12:09 350
原创 Sqoop导入数据到Hive报错,java.lang.ClassNotFoundException: org.apache.hadoop.hive.conf.HiveConf
执行命令,如:sqoop import --connect jdbc:mysql://master:3306/sqoopDB --table employees --username bear --password 123456 --hive-import -m 1报如下错误:18/12/05 20:13:31 INFO hive.HiveImport: Loading uploaded...
2018-12-05 20:27:42 4118 2
原创 MarReduce小练习 - 单表关联(使用标识符)
题意:根据儿子、父母关系,输出孙子、爷奶关系:输入:                &
2018-12-04 12:39:02 246
原创 Sqoop1安装-mysql测试
1. 下载安装包地址:http://www.apache.org/dyn/closer.lua/sqoop/解压:tar -zxvf soft/sqoop/sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz -C ~/mv sqoop-1.4.7.bin__hadoop-2.6.0/ sqoop-1.4.72. 配置vim ~/.bashrc,添加...
2018-12-02 21:16:37 851
原创 Sqoop连接mysql报错-已解决
报错使用连接测试命令:sqoop list-databases --connect jdbc:mysql://master:3306/ --username bee -P报如下错误:18/12/02 20:11:44 ERROR manager.CatalogQueryManager: Failed to list databasescom.mysql.cj.jdbc.exceptio...
2018-12-02 20:19:34 13632 9
原创 Hadoop集群安装Pig
下载压缩包:http://pig.apache.org/releases.html解压:tar -zxvf pig-0.17.0.tar.gz -C ~/配置:在 ~/.bashrc 文件末尾添加,其中HADOOP_HOME为Hadoop安装路径,如HADOOP_HOME = /usr/local/hadoop:export PIG_HOME=/home/hadoop/pig-0.1...
2018-12-01 10:45:50 453
原创 Pig-使用java实现用户自定义函数编译pig.jar包错误
从SVN库中导出代码创建本地的pig.jar文件时报错:创建命令:svn co http://svn.apache.org/repos/asf/pig/trunkcd trunkant执行 ant 时报如下错误:BUILD FAILED/home/hadoop/pig-0.17.0/logs/file/trunk/build.xml:812: The following error...
2018-12-01 10:36:33 469
Google_Chrome_(64bit)_v65.0.3325.181.exe
2020-01-07
ccsetup561.exe
2019-09-24
数据结构dsmo.rar
2019-05-15
mysql-8.0-deb包
2019-01-03
eclipse-committers-2018-09-linux-gtk-x86_64.tar
2018-11-17
hadoop2x-eclipse-plugin-original
2018-10-30
hadoop-eclipse-plugin-2.7.3.jar
2018-10-26
flux安装工具
2018-09-03
Xshell后台查杀工具
2018-09-03
《飞机大战》exe程序
2018-04-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人