自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

M10F的博客

大数据进阶记

  • 博客(49)
  • 资源 (4)
  • 收藏
  • 关注

转载 GitHub 五万星登顶,程序员命令行最全技巧宝典!

一个项目 Get 所有命令行技巧!作者 | 唐小引封图 | CSDN出品 | CSDN(ID:CSDNnews)最近两天,「The Art of Command Line(命令行的艺术)」这个开源项目雄踞了 GitHub TOP 榜,直接以 51,727 Star 登上榜首。对于所有的程序员来说,使用命令行已经成为了一项日常技能,但常常却是面向搜索...

2019-06-06 10:53:15 110

原创 phoenix创建表在hbase中无法正常显示列名,会对hbase列进行编码存储

phoenix创建表0: jdbc:phoenix:hadoop01:2181:/hbase> create table "phoenix_02"(id varchar primary key,"cf"."name" varchar,"cf"."age" varchar);No rows affected (2.881 seconds)0: jdbc:phoenix:hadoop01:...

2019-07-13 09:58:20 1770 3

原创 org.apache.phoenix.exception.PhoenixIOException: org.apache.hadoop.hbase.DoNotRetryIOException: Unab

org.apache.phoenix.exception.PhoenixIOException: org.apache.hadoop.hbase.DoNotRetryIOException: Unable to load configured region split policy 'org.apache.phoenix.schema.MetaDataSplitPolicy' for table ...

2019-07-12 22:07:41 2362 1

原创 - MySQL server has gone away [ERR] /*[ERR] /* SQLyog Ultimate v12.08 (64 bit) MySQL - 5.5.27 : Datab

导入sql文件时出错,原因是导入文件过大,而mysql默认设置大小较小进入MySQL安装目录下,找到my.ini默认C:\ProgramData\MySQL\MySQL Server 5.7下调大max_allowed_packet值之后重启mysql服务即可...

2019-07-12 15:25:49 645

转载 kafka的索引机制

概述数据文件的分段和索引kafka解决查询效率的手段之一是将数据文件分段存储,可以配置每一个文件的大小。每一个端单独放在一个.log的文件中,数据文件命名是20个字符的长度,以每一个分段文件开始的最下offset来命名,其他位置用0填充。最初始的文件是00000000000000000000.log命名的,比如下一个log中的第一条消息的offset是18987,则该log文件的命名是0000...

2019-07-02 20:31:48 301

原创 No kafka server to stop无法使用命令关闭问题

关闭失败修改kafka-server-stop.sh将 PIDS=$(ps ax | grep -i ‘kafka.Kafka’ | grep java | grep -v grep | awk '{print KaTeX parse error: Expected 'EOF', got '}' at position 2: 1}̲')修改为 PIDS=(jps -lm | gre...

2019-07-02 17:46:48 4352

原创 Python爬虫学习-----豆瓣top250(Xpath解析)

解析数据利用的是xpath处理数据利用jsonfrom urllib.request import urlopen as urfrom lxml import etree as etimport timeimport jsonlast_no=[]last_img=[]last_title_cn=[]last_title_en=[]last_other=[]last_body...

2019-06-24 23:00:33 435

原创 python爬虫学习-实现翻译软件

from urllib.request import urlopen as urfrom bs4 import BeautifulSoup as bfsimport requestsdef getResult(keyword):#发起请求 url = "https://cn.bing.com/dict/search?q=" + keyword#获取源码 conte...

2019-06-21 22:22:01 176

原创 国内pip源

阿里云http://mirrors.aliyun.com/pypi/simple/中国科技大学https://pypi.mirrors.ustc.edu.cn/simple/豆瓣(douban)http://pypi.douban.com/simple/清华大学https://pypi.tuna.tsinghua.edu.cn/simple/中国科学技术大学http://py...

2019-06-20 21:31:13 125

原创 Python安装插件时报错:Traceback (most recent call last):AttributeError: module 'pip' has no attribute 'main'

安装插件beautifulsoup4时遇到如下问题:Traceback (most recent call last):File “D:\soft\PyCharm 2017.3.3\helpers\packaging_tool.py”, line 192, in mainretcode = do_install(pkgs)File “D:\soft\PyCharm 2017.3.3\hel...

2019-06-20 21:29:37 5727 1

原创 wordcount多种写法(单机版、MapReduce、Hive、Spark、Scala)

单机版public class WordCount { public static void main(String[] args) throws IOException { Map<String, Integer>[] maps=new HashMap[5]; int a=0; for (...

2019-06-11 20:25:58 1323 3

原创 第一次启动nginx报错nginx: [emerg] bind() to 0.0.0.0:80 failed (98: Address already in use) nginx: [emerg] b

Starting nginx: nginx: [emerg] bind() to 0.0.0.0:80 failed (98: Address already in use)nginx: [emerg] bind() to 0.0.0.0:80 failed (98: Address already in use)nginx: [emerg] bind() to 0.0.0.0:80 fail...

2019-06-06 10:36:25 1227

原创 sqoop操作时显示java.sql.SQLException: Access denied for user 'root'@'hadoop01' (using password: YES)

error:java.sql.SQLException: Access denied for user ‘root’@‘hadoop01’ (using password: YES)at com.mysql.jdbc.SQLError.createSQLException(SQLError.java:964)at com.mysql.jdbc.MysqlIO.checkErrorPacket...

2019-05-24 12:56:14 3368

原创 hdfs四大机制

1、心跳机制  1、datanode定期向namenode发送存活状态以及可用空间,默认时间3s<property> <name>dfs.heartbeat.interval</name> <value>3</value> <description>Determines datanode heartbeat i...

2019-05-23 21:59:21 401

原创 hive本地模式设置

set hive.exec.mode.local.auto=true;

2019-05-23 08:40:26 906

原创 hive显示列名

set hive.cli.print.header=true;

2019-05-22 12:03:20 431

原创 hive中rank() dense_rank()和row_number()区别

rank()每个窗口,相同数据排名一样,下一个排名会累加前一个排名的人数dense_rank()每个窗口,相同数据排名一样,下一个排名不会累加前一个排名的人数,整个排名是顺序的row_number()每个窗口,排名依次递增...

2019-05-22 12:02:46 1549

原创 hive中get_json_object()和json_tuple()

将每一行数据存储为string,属性名lineget_json_object()select get_json_object(line,'$.movie') as movie, get_json_object(line,'$.rate') as rate, get_json_object(line,'$.timeStamp') as time, get_json_object(li...

2019-05-21 21:19:13 9528

原创 hive静态分区和动态分区区别

静态分区 SP(static partition)  1、静态分区是在编译期间指定的指定分区名  2、支持load和insert两种插入方式    2.1load方式      1)会将分区字段的值全部修改为指定的内容      2)一般是确定该分区内容是一致的时候才会使用    2.2insert方式      1)必须先将数据放在一个没有设置分区的普通表中      2)该方式...

2019-05-20 22:51:26 8046

原创 hive动态插入数据SemanticException [Error 10096]: Dynamic partition strict mode requires at least one stati

FAILED: SemanticException [Error 10096]: Dynamic partition strict mode requires at least one static partition column. To turn this off set hive.exec.dynamic.partition.mode=nonstrict解决:set hive.exec....

2019-05-20 10:47:35 3135

原创 hive启动中常见问题

1、Caused by: java.net.ConnectException: Connection refused解决:启动hadoop2、 FAILED: SemanticException org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.RuntimeException: Unable to instantiate ...

2019-05-18 09:01:47 546

原创 yarn作业执行流程

yarn作业执行流程1、客户端向ResourceManager 发送运行job的请求,申请资源2、ResourceManager 向客户端返回一个job_id以及共享资源的路径  /tmp/hadoop-yarn/staging/hadoop/.staging/job_id  共享资源包含三点信息    1)jar 包 job.jar-    2)切片信息    3)job.xm...

2019-05-15 21:09:00 320

原创 mapreduce执行流程 shuffle

mapreduce流程1、数据底层存储  将所要存储的文件进行分块存储,每块默认128M,不够128M的部分单独成一块,存储在节点上将所要存储的文件进行分块存储,每块默认128M,不够128M的部分单独成一块,存储在节点上2、计算切片大小,进行逻辑划分,根据切片的个数来决定maptask个数,切片最大不会超过128*1.1M3、maptask执行  利用FileInputFormat加载...

2019-05-15 21:04:32 252

原创 Exception in thread "main" org.apache.hadoop.security.AccessControlException: Permission denied: use

Exception in thread "main" org.apache.hadoop.security.AccessControlException: Permission denied: user=Admin, access=WRITE, inode="/":fanger:supergroup:drwxr-xr-x at org.apache.hadoop.hdfs.server.n...

2019-05-05 16:48:13 3497

原创 系统找不到指定的路径。Error: JAVA_HOME is incorrectly set.Please update D:\s

在控制台中输入hadoop version后提示Error: JAVA_HOME is incorrectly set. Please update 错误如果java -version可以正常查看,hadoop version时出现错误,此时需要配置hadoop的解压文件下,hadoop-2.7.6\etc\hadoop\hadoop-env.cmd我的jdk的路径:C:\Progr...

2019-05-05 15:43:25 4675 1

原创 linux下时间同步服务器

Unix/linux类:ntp.aliyun.comntp1.aliyun.comntp2.aliyun.comntp3.aliyun.comntp4.aliyun.comntp5.aliyun.comntp6.aliyun.comntp7.aliyun.com

2019-04-29 21:09:05 121

转载 CentOS开机提示kernel panic - not syncing: Attempted to kill init! 解决方法

1.重新启动linux 系统,看见如图见面迅速按E键2.看见如图界面在按E键编辑3.如图界面使用上下键选择第二个在按E键4.在最后一行后面添加  enforcing=0 按回车保存退出5.在此页面按B键重新启动即可 文章转载自:https://blog.csdn.net/ym01213/article/details/80032...

2019-04-29 20:25:02 3071

转载 关于PrintWriter中的print与println方法的区别

今天在写一个关于socket的程序,无意间把PrintWriter中的print与println混淆了,于是写了个小demo测试了一下,代码如下: 服务端代码:package com.city.server;import java.io.BufferedReader;import java.io.InputStreamReader;import java.io.PrintWriter;...

2019-04-27 20:55:58 2021

原创 linux下设置mysql为utf-8编码

CREATE DATABASE `表名` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci

2019-04-22 09:14:43 369

原创 linux下启动mysql出现Warning: Using a password on the command line interface can be insecure. ERROR 2002 (

错误:Warning: Using a password on the command line interface can be insecure.ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (2)解决:ps -aux |greap ...

2019-04-22 09:02:42 2076

转载 十大经典排序算法总结(Java语言实现)

最近在看排序算法,对此做个总结。参考文章:https://www.cnblogs.com/onepixel/articles/7674659.htmlhttps://www.cnblogs.com/guoyaohua/p/8600214.html目录一、算法的分类1、概念...

2019-04-19 14:29:19 140

原创 linux系统设置时区

先查看一下时间,发现是utc 时区不正确,所以需要修改时区tzselect-----》选择亚洲(Asia)---》选择中国(China)--》选择北京时间(BeijingTime)---》yes---》1,此时时区还没有设置,执行TZ='Asia/Shanghai';export TZ 之后查看date,即可发现时区已经改为cst或者可以修改配置文件来修改时区...

2019-04-16 20:21:51 389

原创 linux脚本中包含函数时一直报错syntax error near unexpected token `{

在notepad++中编写shell文件,执行时总是提示错误:syntax error near unexpected token `{这是由于windows和linux编码不一致导致的,可先查看编写的shell脚本的编码显示出CR LF ,则需要将windows格式转换为linux格式更改后字符格式变为LF继续执行即可...

2019-04-14 17:24:03 1319 1

原创 集群自动部署ssh: Could not resolve hostname 节点1,节点2: Temporary failure in name resolution lost connection

在集群自动部署jdk时,已经设置好了ssh免密登录以及相关的send.sh sh send.sh时 出现如下错误错误:ssh: Could not resolve hostname 节点1,节点2: Temporary failure in name resolutionlost connection前提是此时/etc/hosts 和DNS已经配置好,但仍出现问题在send....

2019-04-14 16:52:24 2201

原创 mybatis整合spring时出现:Access denied for user 'admin'@'localhost' (using password: YES), mergedContextC

错误:Could not get JDBC Connection; nested exception is java.sql.SQLException: Access denied for user 'admin'@'localhost' (using password: YES), mergedContextConfiguration = [MergedContextConfiguration@...

2019-04-12 22:37:36 5971 4

原创 mybatis整合spring时出现:Error creating bean with name 'org.mybatis.spring.mapper.MapperScannerConfigurer

mybatis整合spring时出现如下错误错误:Error creating bean with name 'org.mybatis.spring.mapper.MapperScannerConfigurer#0' defined in class path resource [applicationContext.xml]: Cannot resolve reference to be...

2019-04-12 22:37:10 20404 6

原创 java 中静态代理与动态代理(jdk动态代理、cglib动态代理)的实现

代理:一种常用的设计模式,通俗讲就是为其他对象提供一个代理,使其能够通过代理访问某个对象(被代理)。首先创建一个用户接口类,接口实现类//用户接口类public interface UserDao { void addUser(); void deleteUser();}//用户实现类public class UserDaoImpl implements UserDao{...

2019-04-11 19:38:56 121

原创 使用Ajax后显示XML解析错误,语法错误

出现以上错误的原因是因为编码出现了问题,response编码和jsp的不一致了,添加以下代码即可解决response.setCharacterEncoding("utf-8");response.setContentType("text/html;charset=utf-8");...

2019-04-09 19:05:05 3212

原创 MySQL 50道练习题及答案

练习题参考知乎https://zhuanlan.zhihu.com/p/50662216以下是根据自己思路编写的代码,部分参考了知乎,途中遇到了不少问题整个实践过程中总是忘记指定字段所在的表名,出现如下错误ERROR 1052 (23000): Column ‘’ in field list is ambiguous,指定列重复,即两张表存在相同字段,没有在表字段前指明表名,导致指代不清...

2019-03-30 21:16:37 7078 4

原创 第三部分-Hadoop使用和Hbase使用

第三部分:Hadoop使用和Hbase使用一、实验目的和要求理解Hadoop和Hbase的工作原理,安装部署HBase,掌握HDFS文件系统和Hbase的操作命令。二、实验内容和原理Hadoop文件系统:HDFS,是Hadoop Distributed File System的简称,是Hadoop抽象文件系统的一种实现。Hadoop抽象文件系统可以与本地系统、Amazon S3等集成,甚...

2019-03-30 15:32:04 838

ssm整合的相关jar包

提供web中mybatis+spring+springMVC相关jar包,日志属性文件

2019-04-11

jdbc完整流程使用

利用jdbc实现对数据库的连接,对数据表的增删改查。--

2019-04-11

mybatis动态代理

mybatis框架实现对数据库的普通方法的增删改查,动态代理的操作,以及动态代理实现多表关联查询

2019-04-10

mybatis简单使用

利用mybatis框架简单实现了数据库的增删改查功能,结果利用日志结构显示

2019-04-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除