自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

TURING.DT

科技改变世界,技术改变人生。

  • 博客(11)
  • 资源 (3)
  • 收藏
  • 关注

原创 MySQL内容乱码及编码问题处理

查看mysql实例编码show variables like 'character%';设置mysql实例编码set character_set_database=utf8;[root@server1 ~]# cat /etc/my.cnf [client]socket=/var/lib/mysql/mysql.sockdefault-character-set

2016-09-30 15:27:47 372

原创 使用hadoop streaming进行用户流量分析

本文是用python语言并使用hadoop中的streaming来对用户数据进行分析,统计用户的手机号码、上行流量、下行流量、总流量的信息。本案例适合hadoop初级人员学习。一、待分析的数据源文本文件内容,里面有非常多的用户浏览信息,包括用户手机号码,上网时间,机器序列号,访问的IP,访问的网站,上行流量,下行流量,总流量等信息。(倒数第三列是上传流量,倒数第二列是下载流量,

2016-09-26 18:00:16 1126

原创 让Hive简单的查询不启用Mapreduce而启用Fetch task本地运行

查询某个表的某一列,Hive默认是会启用MapReduce来完成这个任务,如下:hive> SELECT uid, number FROM test limit 9;Total MapReduce CPU Time Spent: 2 seconds 320 msecOK1       122       153       214       225       2

2016-09-23 14:00:16 1123

原创 CDH5.5.1增加新主机

1.说明CDH机器添加分三种方式1) 页面向导添加(最好离线,不然会从官网下载安装包时间较长)2) 软件包手动安装3) 原始码手动安装(原始码安装需要自己指定管理目录)这里分享第二种方式,软件包安装方法2.安装部署1) 主机名、ip等修改好,关闭防火墙,ssh免密码登录,CM服务器配置下hosts文件解析新主机2) 首先到http://archi

2016-09-21 16:14:00 4354

原创 Hadoop Balancer运行速度优化

1.修改dfs.datanode.max.transfer.threads = 4096 (如果运行hbase的话建议为16384),指定用于在DataNode间传输block数据的最大线程数,老版本的对应参数为dfs.datanode.max.xcievers2.修改dfs.datanode.balance.bandwidthPerSec  = 31457280 ,指定DataNode用

2016-09-14 15:50:21 8536

原创 Linux下更改mysql5.1 数据目录datadir的方法

linux下,MySQL默认的数据文档存储目录为/var/lib/mysql 假如要把MySQL目录移到/home/data下需要进行下面几步:1、home目录下建立data目录mkdir /home/data2、把MySQL服务进程停掉:service mysqld stop3、把/var/lib/mysql整个目录移到/home/datacp -afir /

2016-09-14 10:36:55 5154

原创 hadoop2.0的datanode多存储硬盘设置数据副本存放策略

集群使用4块硬盘,目前集群中部分节点盘disk1使用率已经超90%,后期可能会出现问题。在hadoop2.0中,datanode数据副本存放磁盘选择策略有两种方式:第一种是沿用hadoop1.0的磁盘目录轮询方式,实现类:RoundRobinVolumeChoosingPolicy.java第二种是选择可用空间足够多的磁盘方式存储,实现类:AvailableSpaceVolumeCho

2016-09-13 14:48:18 3735

原创 升级ambari、HDP版本(ambari 2.1升级到2.4、HDP2.3升级到2.5)

官方升级版本说明http://docs.hortonworks.com/HDPDocuments/Ambari-2.4.0.1/bk_ambari-installation/content/determine_stack_compatibility.html官方升级步骤http://docs.hortonworks.com/HDPDocuments/Ambari-2.4.0.1/b

2016-09-07 17:14:37 9992 5

原创 linux下mysql的root密码忘记解决方法

1.首先确认服务器出于安全的状态,也就是没有人能够任意地连接MySQL数据库。因为在重新设置MySQL的root密码的期间,MySQL数据库完全出于没有密码保护的状态下,其他的用户也可以任意地登录和修改MySQL的信息。2.修改MySQL的登录设置:# vi /etc/my.cnf在[mysqld]的段中加上一句:skip-grant-tables例如:[mysqld]

2016-09-07 10:35:19 483

原创 kafka数据同步/镜像工具 kafka mirror maker

默认安装kafka后有个Kafka MirrorMaker服务,无法启动。2016-08-05 15:20:50,333 INFO kafka.tools.MirrorMaker$: Starting mirror maker2016-08-05 15:20:50,356 ERROR kafka.tools.MirrorMaker$: Exception when starting

2016-09-05 15:52:46 2912

原创 CDH集成kafka方法实践

(本文以KAFKA-2.0.2-1.2.0.2.p0.5-el6.parcel和CDH5.5.1版本截图,最后出现兼容问题,将KAFKA-2.0.2-1.2.0.2.p0.5-el6.parcel换为KAFKA-0.8.2.0-1.kafka1.4.0.p0.56-el6.parcel就正常,请大家先查看版本兼容问题)参考CDH官网文档:http://www.cloudera.com/cont

2016-09-05 14:32:28 8134 1

Python深度学习(Deep Learning With Python中文版)

本书由Keras之父、现任Google人工智能研究员的弗朗索瓦•肖莱(François Chollet)执笔,详尽介绍了用Python和Keras进行深度学习的探索实践,包括计算机视觉、自然语言处理、产生式模型等应用。书中包含30多个代码示例,步骤讲解详细透彻。由于本书立足于人工智能的可达性和大众化,读者无须具备机器学习相关背景知识即可展开阅读。在学习完本书后,读者将具备搭建自己的深度学习环境、建立图像识别模型、生成图像和文字等能力。

2018-09-29

Spark大数据分析核心概念技术及实践OCR 中文

Spark大数据分析核心概念技术及实践,深度讲解使用spark技术对大数据进行分析,并给出实践案例

2018-09-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除