自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 深入理解JVM虚拟机(阅读笔记)---内存管理(理解)

JVM运行时数据区

2019-08-29 10:40:44 149 1

原创 (Hive)org.apache.hadoop.hbase.client.Put.setDurability(Lorg/apache/hadoophbase/client/Durability;)V

报错信息:Error:java.lang.RuntimeException:java.lang.NoSuchMethodError:org.apache.hadoop.hbase.client.Put.setDurability(Lorg/apache/hadoophbase/client/Durability;)V这个错很坑!!1、原因是Hive 和hbase的版本...

2019-08-02 16:20:22 1282

原创 HBase javaAPI 操作 ---- 工具类(2.2.0)

pom.xml<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xs...

2019-07-27 18:39:58 874

原创 Hadoop分布式集群出错(启动后数据节点缺失)

在hadoop启动后,使用jps发现各个节点启动正常,如图: 三个节点都正常启动了,可是用浏览器访问50070端口出现:明明有两个数据节点,显示的只有一个。如果你不断点刷新页面,数据节点的IP地址是会变的,这是什么情况?这是因为你克隆虚拟机时,复制了两个一模一样的hadoop,这就导致了datanode的VERSION里面有2个id是一模一样不能共存,所以只能显示一个数据...

2019-07-26 15:47:31 2516 4

原创 HBase完全分布式搭建

1 预先配置hadoop2.7.5完全分布式搭建完成 zookeeper3.5.5 完全分布式搭建完成 JDK 1.8 需要安装的HBase版本为hbase 2.0.5 附官网链接:http://mirror.bit.edu.cn/apache/hbase/2.0.5/hbase-2.0.5-bin.tar.gz注意 HBase有严格的版本控制HBase与Hadoop版本...

2019-07-25 19:04:38 136

转载 (Hadoop)Permission denied: user=XXXX, access=WRITE, inode="/XXX":root:supergroup:drwxr-xr-x

org.apache.hadoop.security.AccessControlException: Permission denied: user=XXXX, access=WRITE, inode="/XXX":root:supergroup:drwxr-xr-x at org.apache.hadoop.hdfs.server.namenode.FSPermissionChecker.c...

2019-06-22 10:42:03 1088

原创 (Hadoop错误)org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Z

Hadoop在使用MapReduce时遇到报错:Exception in thread "main" java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Z at org.apache.hadoop.io.nativeio.Nat...

2019-06-22 10:21:56 782

原创 机器学习---决策树--理论(个人理解)

决策树是一种基于树结构来进行决策的,这跟人类在面临一些决策问题时的自然反应机制很类似。决策树包含一个根节点、若干个内部节点、若干个叶子节点。 一般的,根节点和内部节点只用于划分数据集,而叶子节点对应决策的结果ID3算法---基于信息增益1、信息增益信息增益是ID3算法划分数据集的一种方法。而在划分数据集前后信息发生的变化就是信息增益。那么我们如何计算信息增益呢?要计算信息增益首先要...

2019-05-05 20:25:51 253

转载 理解误差和残差

误差: 所有不同样本集的均值的均值,与真实总体均值的偏离.由于真实总体均值通常无法获取或观测到,因此通常是假设总体为某一分布类型,则有N个估算的均值; 表征的是观测/测量的精确度;误差大,由异常值引起.表明数据可能有严重的测量错误;或者所选模型不合适,;残差: 某样本的均值与所有样本集均值的均值, 的偏离; 表征取样的合理性,即该样本是否具代表意义;残差大,表明样本不具代表性,也有可能...

2019-04-24 20:51:26 3008

原创 Numpy中的var() 和Excel中的var() 用来计算方差两个值不一样的问题

主要是因为方差的计算公式不同在numpy.var()中官方计算公式为var = mean(abs(x-x.mean())** 2) 有图有真相这是numpy原码注释而在excel中var的计算公式为:sum(( x_i - ave)^2) / ( n-1 )观察这两个公式可知 numpy中是除以 n ,而excel中是除以(n-1)。其实这两个计算公式都是正确的。...

2019-04-20 10:11:25 1883

原创 mongoDB去重

db.wuming.aggregate([ { $group: { _id: {nickName: '$nickName',content: '$content'},count: {$sum: 1},dups: {$addToSet: '$_id'}} }, { $match: {count: {$gt: 1}} }]).forE...

2018-12-23 14:26:42 319

转载 user-agent收集

PC端浏览器#Opera Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36 OPR/26.0.1656.60 Opera/8.0 (Windows NT 5.1; U; en) Mozilla/5.0 (Windows...

2018-12-21 20:52:00 405

原创 理解python装饰器

了解装饰器的作用装饰器是用来给某一程序加上一些功能,可做到不修改被装饰函数源代码,也不改变其调用方式。python装饰器就是用于拓展原来函数功能的一种函数,这个函数的特殊之处在于它的返回值也是一个函数上代码我们首先假设要执行一段代码输出   “并不是为了改变世界”#主功能函数def say(): print("并不是为了改变世界")现在客户需要改需求了,需要在每一次...

2018-10-21 20:16:15 161

转载 jupyter notebook实现远程访问

1、生成配置文件(windows在cmd下|linux在终端),输入jupyter notebook --generate-config回车,会生成一个jupyter_notebook_config.py的配置文件,这个文件在用户目录下~/.jupyter/jupyter_notebook_config.py2、生成密码打开ipython(win系统下如果配置过环境变量的,可直接在cm...

2018-10-20 17:00:27 158

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除