自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Joy

  • 博客(21)
  • 资源 (45)
  • 收藏
  • 关注

原创 Hadoop高可用high availability 集群配置

1、为什么配置高可用HA单点故障:在Hadoop2.0.0之前,每个Hadoop集群只有一个namenode节点,一旦该节点发生了故障,那么整个集群将瘫痪掉,只有重新启动该节点,或者重新移动到另外的节点,才能够重新运行该节点,这也就是所谓的单点故障2、HA的原理在同一个集群上配置两个名称节点,一个为激活态,一个为待命态。当激活态的名称节点出现了故障,那么可以快速的将待命态的名称节点快速容错,转为激...

2018-02-09 17:11:13 396

原创 Could not determine own NN ID in namespace 'mycluster'.

执行hdfs namenode -bootstrapStandby的时候报错如下java.io.IOException: java.lang.IllegalStateException: Could not determine own NN ID in namespace 'mycluster'. Please ensure that this node is one of the machine...

2018-02-09 16:07:53 2338

原创 添加了其他主机的公钥之后还是不能无密登陆到其他主机

修改authorized_keys的权限为644

2018-02-08 17:51:05 625

原创 克隆虚拟机之后修改mac地址

修改配置文件中的mac地址为刚才生成的mac地址

2018-02-08 16:30:27 1868

原创 hadoop-daemon.sh 和Hadoop-daemons.sh 的区别

Hadoop-daemon.sh:用于启动当前节点的进程例如Hadoop-daemon.sh start namenode 用于启动当前的名称节点Hadoop-daemons.sh:用于启动所有节点的进程例如:Hadoop-daemons.sh start datanode 用于启动所有节点的数据节点

2018-02-08 11:18:19 4318

原创 将SVD应用于推荐系统

1、什么是SVDsingular value decomposition 奇异值分解,通过SVD实现从噪声数据中抽取相关特征2、SVD的应用2.1信息检索隐形语义索引LSI:latent semantic indexing隐形语义分析LSA:latent semantic analysis再LSA中,一个矩阵是由文档和词语构成,我们利用SVD对矩阵进行分解,就会得到多个奇异

2018-02-07 16:39:15 438

原创 matrix.A

if __name__ == '__main__': from numpy import * a = mat([[0, 0, 0, 2, 2], [0, 0, 0, 3, 3], [0, 0, 0, 1, 1], [1, 1, 1, 0, 0], [2, 2, 2, 0, 0],

2018-02-07 14:41:03 490

原创 机架感知配置

0、hdfs存放副本的策略:先存放一个副本在本地机架的一个节点上,然后将第二个副本存放在本地机架的另外一个节点上,最后将第三个副本存放在不同机架的不同节点上1、配置机架感知Java类package com.cr.rackAware;import org.apache.hadoop.net.DNSToSwitchMapping;import org.mockito.internal

2018-02-06 17:52:17 316

原创 PCA主成分分析进行数据降维

1、PCA的原理PCA:principal component analysis 主成分分析,PCA通过更换数据的坐标系来达到降维的目的。第一个坐标轴是原始数据的方差最大的方向,第二个坐标轴是与第一个坐标轴正交并且方差次大的方向2、PCA的优缺点优点:降低数据的复杂性,识别最重要的多个特征缺点:不一定需要,且有可能损失重要信息3、PCA伪代码'''去除平均值

2018-02-06 16:19:05 1239

原创 flatten的用法

from numpy import *if __name__ == '__main__': ''' flatten 用于数组 ''' a = array([[1,2,3,4,5],[3,4,5,6,7],[1,4,5,6,74],[23,4,5,6,7]]) print(type(a)) print(a.flatten()) '''

2018-02-06 16:05:35 620

原创 数组与列表访问某一列的方法不同

from numpy import *if __name__ == '__main__': a = [[1,2,3,4,5],[3,4,5,6,7],[1,4,5,6,74],[23,4,5,6,7]] for x in a: print(x[0]) b = array(a) print(b[:,0])13123[ 1 3 1 23]

2018-02-06 15:04:15 258

原创 python 切片

from numpy import *if __name__ == '__main__': a = [[1,2,3,4,5],[3,4,5,6,7],[1,4,5,6,74],[23,4,5,6,7]] print(a[::1]) #正向开始,不取最后一个元素 print(a[:-1]) #从末尾开始到倒数第三个,步长为-1,最后一个数的正负表示方向,大小

2018-02-06 14:52:50 234

原创 mapreduce统计数据库中的单词个数

1、建立数据库表2、导入jar包mysql-connector-java-5.1.38.jar3、创建实体类package com.cr.jdbc;import org.apache.hadoop.io.Writable;import org.apache.hadoop.mapred.lib.db.DBWritable;import java.io.D

2018-02-05 19:06:51 485

原创 Call From s150/192.168.109.150 to 0.0.0.0:10020 failed on connection exception:

参考博客:点击打开链接Hadoop连接本地数据库的时候报错Exception in thread "main" java.io.IOException: java.net.ConnectException: Call From s150/192.168.109.150 to 0.0.0.0:10020 failed on connection exception: java.net.C

2018-02-05 19:04:51 642 1

转载 message from server: "Host 'XXXX' is not allowed to connect to this MySQL server"

环境:mysql5.7.11 + windows10 64位问题现象:使用mysql远程登录命令mysql –uroot –h192.168.1.102 –p时,报错MySQL ERROR 1130 (HY000): Host ‘XXXX’ is not allowed to connect to this MySQL server问题原因:mysql服务器出于安全考虑,默认只允许本地登录数据库

2018-02-05 18:47:25 11164 2

原创 Hadoop格式化namenode

格式化的时候需要先删除所有节点的Hadoop的临时缓存目录也就是我们在core-site.xml里面配置的hadoop.tmp.dir

2018-02-05 17:53:15 642

原创 构建FP-growth算法高效发现频繁项集

1、构建FP树1.1创建FP树的结构#创建FP树的数据结构#FP树的类定义class treeNode: def __init__(self, nameValue, numOccur, parentNode): self.name = nameValue self.count = numOccur self.nodeLink =

2018-02-05 17:28:59 366

原创 TypeError: '<' not supported between instances of 'treeNode' and 'treeNode'

bigL = [v[0] for v in sorted(headerTable.items(), key=lambda p: p[1])]#(sort header table)TypeError: '这个的意思就是比较的对象不支持小于符号也就是我们的对象有问题,这里我的p[1]是节点类型 headerTable: {'p': [2, None], 'h': [1, None],

2018-02-05 16:34:15 2809

原创 矩阵与列表取出行(左开右闭)

对于矩阵:import numpysimpDat = [['r', 'z', 'h', 'j', 'p'], ['z', 'y', 'x', 'w', 'v', 'u', 't', 's'], ['z'], ['r', 'x', 'n', 'o', 's'], ['y', 'r', 'x', 'z', '

2018-02-05 11:17:29 514

转载 解决CentOS7关闭/开启防火墙出现Unit iptables.service failed to load: No such file or directory.

CentOS7中执行[plain] view plain copy print?service iptables start/stop  service iptables start/stop会报错Failed to start iptables.service: Unit iptables.service failed to load: No such file or directory.在C

2018-02-02 15:24:05 393

转载 【Mybatis架构】Mapper映射文件中的#{}与${}

前言       还记得当初从北京回来的时候,跟着倪文杰师姐做Java ITOO的一卡通模块,我亲姐贾梦洁带着我一块做,期间,我遇到了一个特别奇葩的问题,就死我要实现Mybatis的模糊查询,根据当时亲姐教给我方法 select * from table where contions like #{something},就是解决不了问题,一点东西都查不出来,还报错。后来,我终于明白,世界上还有${

2018-02-01 11:48:27 383

《机器学习实战源码》

《机器学习实战源码》~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

2018-01-05

python核心编程第二版

python核心编程第二版~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

2018-01-05

hadoop实现计数器

hadoop实现计数器,利用mapreduce进行排序,同时可以实时跟踪整个过程以及每个节点的参与情况

2018-01-05

JDBC实现Oracle数据库的增删改查

JDBC实现Oracle数据库的增删改查

2017-08-10

相似图像匹配与搜索

相关系数 汉明距离 归一化互相关法 互相关值

2017-07-30

太阳能小屋

非线性规划 贪心算法 太阳能小屋 最佳倾角模型 sketchup软件

2017-07-30

基于仿真实现的小区开放对道路通行的影响的定量分析

基于仿真实现的小区开放对道路通行的影响的定量分析

2017-07-30

房价问题的综合研究

房价问题的综合研究

2017-07-30

多基雷达探测飞行目标及攻击问题

多基雷达探测飞行目标及攻击问题

2017-07-30

“截排”、“清源”综合治水模型

层次分析 模糊综合“截排”、“清源”综合治水模型

2017-07-30

jQuery实现日期选择

jQuery实现日期选择

2017-07-30

菜单的隐藏和显示

jQuery下拉菜单 的显示和隐藏

2017-07-30

jQuery栏目切换

jQuery栏目切换

2017-07-26

主题色选择-jQuery

主题色选择-jQuery

2017-07-25

计算器网页版

计算器网页版

2017-07-15

type game 打字游戏

打字游戏

2017-07-15

加密解密 数组排序

4. 有一行电文译文下面规律译成密码: A-&gt;Z a-&gt;z B-&gt;Y b-&gt;y C-&gt;X c-&gt;x,即第一个字母变成第26个字母,第i个字母变成第(26-i+1)个字母。非字母字符不变,要求编程序将一串字符加密,并输出密码和原文。

2017-07-10

javascript循环

1. 输入n个数字,输入0结束,输出这n个数字的平均值,最大值和最小值 2. 计算1+3+5+…+99的结果 3. 计算1+10+100+1000+10000的结果 4. 计算1+11+111+1111+11111的结果 5. 计算1+12+123+1234+12345的结果 6. 输入正整数n,计算n!(n!=1*2*3*4*…*n) 7. 输入正整数n,判断n是否为质数(质数是只能被1和本身整除的数字) 8. 输入正整数n,输出数列中的第n个数字(数列:1,1,2,3,5,8,13…) 9. 在一个笼子里面有鸡和兔两种动物,已知有30个头和90只脚,计算鸡和兔分别有多少只 10. 输出100以内所有质数(质数是只能被1和本身整除的数字) 11. 输入一个十进制数字,输出对应的二进制数字

2017-07-10

100以内的奇数之和JavaScript

100以内的奇数之和JavaScript

2017-07-09

循环输出图形10_javascript

(循环输出图形_javascript)

2017-07-09

msyql驱动包

msyql驱动包5.1.46---------

2018-07-04

数据结构与算法分析Java语言描述 原书第3版

数据结构与算法分析Java语言描述 原书第3版 ==================

2018-06-26

JDK_API_1_6_zh_CN

JDK_API_1_6_zh_CN==================================

2018-06-26

jQuery1.8.3_20121215

jQuery1.8.3_20121215====================================

2018-06-26

HTML完全手册

HTML完全手册======================================

2018-06-26

CSS3.0(飘零雾雨版)

CSS3.0(飘零雾雨版)=================================

2018-06-26

java消息服务(第二版)

java消息服务(第二版)=============================

2018-06-26

JAVA并发编程实践

JAVA并发编程实践JavaConcurrencyinPractice-中文-高清-带书签-完整版(Doug+Lea)@www.java1234.com

2018-06-26

Java多线程编程实战指南+设计模式篇

Java多线程编程实战指南+设计模式篇---------------------------------------

2018-06-26

redis设计与实现(第二版)

redis设计与实现(第二版)----------------------------------------

2018-06-26

高性能mysql第三版

高性能mysql第三版---------------------------------------------------

2018-06-26

java并发编程实战

java并发编程实战

2018-06-26

Java多线程编程核心技术

Java多线程编程核心技术

2018-06-26

MySQL必知必会

MySQL必知必会

2018-06-26

编译原理(原书第2版)

编译原理(原书第2版)-----------------------------------------------------

2018-06-26

算法导论中文版第二版_Cormen_带目录_扫描版

算法导论中文版第二版_Cormen_带目录_扫描版------------------------------

2018-06-26

数据结构与算法

数据结构与算法(Java 描述) 邓俊辉 著

2018-06-26

深入理解Java虚拟机 JVM高级特性与最佳实践

深入理解Java虚拟机 JVM高级特性与最佳实践-----------------------------------

2018-06-26

mapreduce二次排序

mapreduce二次排序,年份升序,按照年份聚合,气温降序

2018-01-09

数据算法 Hadoop Spark大数据处理技巧

数据算法 Hadoop Spark大数据处理技巧··································································

2018-01-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除