2018年07月_首席撩妹指导官

12月 11月 10月 08月 07月 02月 01月

原创 Flink集群部署详细步骤

1.下载Flink压缩包下载地址：http://flink.apache.org/downloads.html。我集群环境是hadoop2.6，Scala2.11版本的，所以下载的是：flink-1.3.1-bin-hadoop26-scala_2.11.tgz。2.解压上传至五个节点的相同目录，执行如下命令解压： tar xzf flink-1.3.1-bin-ha...

2018-07-26 11:25:59 19369 4

转载 Intellij IDEA 14.1.4 Scala开发环境搭建

主要内容Intellij IDEA开发环境简介 Intellij IDEA Scala开发环境搭建 Intellij IDEA常见问题及解决方案 Intellij IDEA常用快捷键1. Intellij IDEA开发环境简介具体介绍请参见：http://baike.baidu.com/link?url=SBY93H3SPkmcmIOmZ8H60O1k4iVLgOmdqoKdGp9...

2018-07-24 10:20:38 219

转载 mapreduce，自定义排序，分区，分组实现按照年份升序排序，温度降序排序

自定义类： package myhadoop; import java.io.DataInput; import java.io.DataOutput; import java.io.IOException; import org.apache.hadoop.io.WritableComparable; pu...

2018-07-17 11:57:11 821

转载 hbase基于solr配置二级索引

一.概述 Hbase适用于大表的存储，通过单一的RowKey查询虽然能快速查询，但是对于复杂查询，尤其分页、查询总数等，实现方案浪费计算资源，所以可以针对hbase数据创建二级索引(Hbase Secondary Indexing)，供复杂查询使用。 Solr是一个高性能，采用Java5开发，基于Lucene的全文搜索服务器。同时对其进行了扩展，提供了比Lucene更为丰富的查询语...

2018-07-17 09:37:37 416

前言通过案例来学习数据分析的思路和练习相应分析工具，往往最有效的。本文用julia来进行全流程的探索和分析，以期达到既掌握分析思路，又练习了这一新兴的数据科学利器。同时，个性化推荐是个太大的topic，涉及的理论方法和实践非常多，本文有些地方会详细展开，有些则一笔带过。如无特殊说明，本文中所使用的code均为julia代码，IDE环境为JuliaPro.问题阐述个性化推荐是当今网络世界上普遍存在的...

2018-07-13 10:12:28 4528

转载 shell和javaAPI两种方式创建hbase表并预分区

在hbase里面，如果我们建表不预分区，那么一个表的数据都会被一个region处理，如果数据过多就会执行region的split，如果数据量很大这样会很费性能，所以最好我们先根据业务的数据量在建表的时候就能指定region个数并且进行预先分区，下面说说两种创建表并且建立预分区的方法。1.shell createTable并预分区：hbase(main):002:0> create 'spli...

2018-07-12 17:37:53 1007

转载 Waterdrop帮你快速玩转Spark数据处理

Databricks 开源的 Apache Spark 对于分布式数据处理来说是一个伟大的进步。我们在使用 Spark 时发现了很多可圈可点之处，我们在此与大家分享一下我们在简化Spark使用和编程以及加快Spark在生产环境落地上做的一些努力。一个Spark Streaming读取Kafka的案例以一个线上案例为例，介绍如何使用Spark Streaming统计Nginx后端日志中每个域名下每个...

2018-07-12 09:53:22 1272

基于用户SparkALS推荐系统

2023-09-11

GPU驱动升级操作步骤(1)

2023-08-07

TOS+etcd+ca+及相关证书续签

2023-08-07

Security问题总结

2023-08-07

日志分析离线及实时方案

2023-04-15

java实现简单的记事本程序

2018-12-29

大数据课程redies知识点总结课程视频链接

北风网大数据课程redies知识点总结课程视频链接

2018-11-28

大数据平台监控Ganglia加Nagios

2018-11-28

Hive数据仓库全流程开发

2018-11-28

数据挖掘SAS详细资料编程算法信用风险评估

北风网数据挖掘SAS详细资料编程算法信用风险评估

2018-11-28

数据挖掘教学资料PPT视频各种文档

北风网数据挖掘教学资料PPT视频各种文档

2018-11-28

Ganglia+和+Nagios

Ganglia+和+NagiosGanglia+和+Nagios

2018-11-28

Ganglia分布式集群监控系统安装手册 - 千秋大业奋当先 - 博客频道

2018-11-28

Hadoop气象数据

Hadoop气象数据Hadoop气象数据Hadoop气象数据Hadoop气象数据Hadoop气象数据

2017-11-08

hadoop-eclipse-plugin

hadoop-eclipse-pluginhadoop-eclipse-pluginhadoop-eclipse-pluginhadoop-eclipse-plugin

2017-10-23

hadoop官网帮助手册

hadoop官网帮助手册 hadoop官网帮助手册 hadoop官网帮助手册 hadoop官网帮助手册

2017-10-20

hadoop_dll_winutil_2.7.1.zip

hadoop_dll_winutil_2.7.1.ziphadoop_dll_winutil_2.7.1.ziphadoop_dll_winutil_2.7.1.ziphadoop_dll_winutil_2.7.1.zip

2017-10-20

tcnative-32

tcnativetcnativetcnativetcnativetcnativetcnativetcnative

2017-10-16

mysql-connector

mysql-connectormysql-connectormysql-connector

2017-10-16

Junit 4.11各种包

Junit 4.11 Junit 4.11 Junit 4.11 Junit 4.11 Junit 4.11 Junit 4.11

2017-10-15

mysql.5.5版本

mysql.5.5mysql.5.5mysql.5.5mysql.5.5mysql.5.5mysql.5.5mysql.5.5

2017-10-15

Shell脚本学习指南

Shell脚本Shell脚本Shell脚本Shell脚本Shell脚本Shell脚本Shell脚本

2017-10-11

机器学习实战

机器学习是人工智能研究领域中一个极其重要的研究方向，在现今的大数据时代背景下，捕获数据并从中萃取有价值的信息或模式，成为各行业求生存、谋发展的决定性手段，这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目。, 本书第一部分主要介绍机器学习基础，以及如何利用算法进行分类，并逐步介绍了多种经典的监督学习算法，如k近邻算法、朴素贝叶斯算法、Logistic回归算法、支持向量机、AdaBoost集成方法、基于树的回归算法和分类回归树（CART）算法等。第三部分则重点介绍无监督学习及其一些主要算法：k均值聚类算法、Apriori算法、FP-Growth算法。第四部分介绍了机器学习算法的一些附属工具。, 全书通过精心编排的实例，切入日常工作任务，摒弃学术化语言，利用高效的可复用Python代码来阐释如何处理统计数据，进行数据分析及可视化。通过各种实例，读者可从中学会机器学习的核心算法，并能将其运用于一些策略性任务中，如分类、预测、推荐。另外，还可用它们来实现一些更高级的功能，如汇总和简化等。

2017-10-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

基于用户SparkALS推荐系统

GPU驱动升级操作步骤(1)

TOS+etcd+ca+及相关证书续签

Security问题总结

日志分析离线及实时方案

java实现简单的记事本程序

大数据课程redies知识点总结课程视频链接

大数据平台监控Ganglia加Nagios

Hive数据仓库全流程开发

数据挖掘SAS详细资料编程算法信用风险评估

数据挖掘教学资料PPT视频各种文档

Ganglia+和+Nagios

Ganglia分布式集群监控系统安装手册 - 千秋大业奋当先 - 博客频道

Hadoop气象数据

hadoop-eclipse-plugin

hadoop官网帮助手册

hadoop_dll_winutil_2.7.1.zip

tcnative-32

mysql-connector

Junit 4.11各种包

mysql.5.5版本

Shell脚本学习指南

机器学习实战

机器学习基础

python基础教程

大数据100道面试题

查看类源码

( Java版）（第3版）[叶核亚] 全套资料.zip

java常用的26个工具类

Hadoop权威指南

JavaScript课件

Java数据结构和算法.rar

数据结构与算法分析

空空如也