自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (31)
  • 收藏
  • 关注

原创 solrcloud 高可用集群搭建加solr整合hbase以及向ganglia报告度量

一、环境准备    CentOS-6.4-x86_64-minimal.iso    jdk-6u45-linux-i586-rpm.bin    zookeeper-3.4.5.tar    solr-4.6.0.zip    服务器6台: 192.168.56.11- SolrCloud.Shard1.Leader             192.168.56.12-S...

2018-11-27 16:47:15 942 2

原创 Oozie的workflow和coordinate的使用(HA)

<workflow-app name="[WF-DEF-NAME]" xmlns="uri:oozie:workflow:0.1"> ... <decision name="[NODE-NAME]"> <switch> <case to="[NODE_NAME]"&g

2018-11-16 17:02:10 1185

原创 zabbix实战

先升级Yum然后浏览器访问ip地址测试php是否安装成功。安装界面问题解决:分布式: -----------------------------------------------------------------------------------------------------...

2018-11-13 22:02:54 1986

转载 CentOS 7 下使用yum安装MySQL5.7.20

CentOS7默认数据库是mariadb, 但是 好多用的都是mysql ,但是CentOS7的yum源中默认好像是没有mysql的。上一篇安装的是5.6的但是我想安装5.7的  yum安装是最简单的 尝试过编译安装各种问题,最后就决定用yum。(经过一段时间的学习又写了一篇用源码安装mysql5.7.22的 点击打开链接)1.卸载  先停掉mysql进程   没有安装过的可以直接跳过...

2018-11-13 20:52:10 161

原创 mysql主从复制

复制原理:Mysql中有一种日志叫做bin日志(二进制日志)。这个日志会记录下所有修改了数据库的SQL语句(insert,update,delete,ALTER TABLE,grant等等)。主从复制的原理其实就是把主服务器上的BIN日志复制到从服务器上执行一遍,这样从服务器上的数据就和主服务器上的数据相同了。复制流程图:复制过程:主节点必须启用二进制日志,记录任何修改数据库数据的...

2018-11-06 16:11:42 156

原创 Spark Streaming实战对论坛网站动态行为pv,uv,注册人数,跳出率的多维度分析,实时统计每天pv,uv的sparkStreaming结合redis结果存入mysql供前端展示

论坛数据运行代码自动生成,该生成的数据会作为Producer的方式发送给Kafka,然后SparkStreaming程序会从Kafka中在线Pull到论坛或者网站的用户在线行为信息,进而进行多维度的在线分析数据格式如下:date:日期,格式为yyyy-MM-ddtimestamp:时间戳userID:用户IDpageID:页面IDchanelID:板块的IDaction:点击和注册...

2018-11-04 19:59:44 1097

原创 使用hive和sqoop来实现统计24小时每个时段的PV和UV,storm计算网站UV(去重计算模式)

【案例】使用hive和sqoop来实现网站基本指标,PV和UV1、PV统计网页浏览总量2、UV去重-》【需求】统计24小时每个时段的PV和UV-》建分区表,按天一级,按小时一级,多级分区-》第一步分析需求-》第二步获取时间字段,天,小时-》对于时间格式进行数据清洗,比如:2015-08-28 18:10:00,从中获取日期和小时-》获取需要有用的字段:id、url、guid、tra...

2018-11-04 19:58:34 1374

原创 nginx日志增加cookie信息

一、获取全部cookie信息  这个比较方便,直接在nginx.conf文件中添加$http_cookie? 1 2 3 4 5 6 log_format main     '[$time_local] - $remote_addr:$remote_port - $remote_user - $upstream...

2018-11-04 19:56:13 3481

基于用户SparkALS推荐系统

基于用户SparkALS推荐系统

2023-09-11

GPU驱动升级操作步骤(1)

GPU驱动升级操作步骤(1)

2023-08-07

TOS+etcd+ca+及相关证书续签

TOS+etcd+ca+及相关证书续签

2023-08-07

Security问题总结

Security问题总结

2023-08-07

日志分析离线及实时方案

日志分析离线及实时方案

2023-04-15

java实现简单的记事本程序

java实现简单的记事本程序

2018-12-29

大数据课程redies知识点总结课程视频链接

北风网大数据课程redies知识点总结课程视频链接

2018-11-28

大数据平台监控Ganglia加Nagios

大数据平台监控Ganglia加Nagios

2018-11-28

Hive数据仓库全流程开发

Hive数据仓库全流程开发

2018-11-28

数据挖掘SAS详细资料编程算法信用风险评估

北风网数据挖掘SAS详细资料编程算法信用风险评估

2018-11-28

数据挖掘教学资料PPT视频各种文档

北风网数据挖掘教学资料PPT视频各种文档

2018-11-28

Ganglia+和+Nagios

Ganglia+和+NagiosGanglia+和+Nagios

2018-11-28

Ganglia分布式集群监控系统安装手册 - 千秋大业奋当先 - 博客频道

Ganglia分布式集群监控系统安装手册 - 千秋大业奋当先 - 博客频道

2018-11-28

Hadoop气象数据

Hadoop气象数据Hadoop气象数据Hadoop气象数据Hadoop气象数据Hadoop气象数据

2017-11-08

hadoop-eclipse-plugin

hadoop-eclipse-pluginhadoop-eclipse-pluginhadoop-eclipse-pluginhadoop-eclipse-plugin

2017-10-23

hadoop官网帮助手册

hadoop官网帮助手册 hadoop官网帮助手册 hadoop官网帮助手册 hadoop官网帮助手册

2017-10-20

hadoop_dll_winutil_2.7.1.zip

hadoop_dll_winutil_2.7.1.ziphadoop_dll_winutil_2.7.1.ziphadoop_dll_winutil_2.7.1.ziphadoop_dll_winutil_2.7.1.zip

2017-10-20

tcnative-32

tcnativetcnativetcnativetcnativetcnativetcnativetcnative

2017-10-16

mysql-connector

mysql-connectormysql-connectormysql-connector

2017-10-16

Junit 4.11各种包

Junit 4.11 Junit 4.11 Junit 4.11 Junit 4.11 Junit 4.11 Junit 4.11

2017-10-15

mysql.5.5版本

mysql.5.5mysql.5.5mysql.5.5mysql.5.5mysql.5.5mysql.5.5mysql.5.5

2017-10-15

Shell脚本学习指南

Shell脚本Shell脚本Shell脚本Shell脚本Shell脚本Shell脚本Shell脚本

2017-10-11

机器学习实战

机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或模式,成为各行业求生存、谋发展的决定性手段,这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目。, 本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法、朴素贝叶斯算法、Logistic回归算法、支持向量机、AdaBoost集成方法、基于树的回归算法和分类回归树(CART)算法等。第三部分则重点介绍无监督学习及其一些主要算法:k均值聚类算法、Apriori算法、FP-Growth算法。第四部分介绍了机器学习算法的一些附属工具。, 全书通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效的可复用Python代码来阐释如何处理统计数据,进行数据分析及可视化。通过各种实例,读者可从中学会机器学习的核心算法,并能将其运用于一些策略性任务中,如分类、预测、推荐。另外,还可用它们来实现一些更高级的功能,如汇总和简化等。

2017-10-11

机器学习基础

机器学习基础

2017-10-11

python基础教程

本书是经典教程的全新改版,作者根据Python 3.0版本的种种变化,全面改写了书中内容,做到既能“瞻前”也能“顾后”。本书层次鲜明、结构严谨、内容翔实,特别是在最后几章,作者将前面讲述的内容应用到了10个引人入胜的项目中,并以模板的形式介绍了项目的开发过程。本书既适合初学者夯实基础,又能帮助Python程序员提升技能,即使是 Python方面的技术专家,也能从书里找到令你耳目一新的东西。

2017-10-11

大数据100道面试题

大数据100道面试题

2017-10-11

查看类源码

查看类加载器加载的类的源码 查看类加载器加载的类的源码 查看类加载器加载的类的源码 查看类加载器加载的类的源码

2017-10-09

( Java版)(第3版)[叶核亚] 全套资料.zip

( Java版)(第3版)[叶核亚] 全套资料.zip

2017-09-29

java常用的26个工具类

java常用的26个工具类java常用的26个工具类java常用的26个工具类java常用的26个工具类

2017-09-29

Hadoop权威指南

Hadoop权威指南 Hadoop权威指南 Hadoop权威指南 Hadoop权威指南 Hadoop权威指南

2017-09-29

JavaScript课件

JavaScript课件,JavaScript入门,JavaScript基础,一学就会

2017-09-29

Java数据结构和算法.rar

Java数据结构和算法.rar

2017-07-27

数据结构与算法分析

数据结构与算法分析

2017-07-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除