云计算/大数据
wang2008start

Hadoop/Spark推荐系统(四)——推荐链接

思路如果两个人有一组共同好友,但这两个人本身不是好友,那个就会推荐他们联系,最后都可以归结为查找。用户1的所有好友里两两互为推荐好友,用户1和好友的关系为直接好友。先循环所有用户的所有好友,找出全部推...
25
roguesir

【R笔记】R机器学习(二)——非线性回归

R机器学习(二)——非线性回归
roguesir

【R笔记】R机器学习(一)——一元回归模型

R机器学习(一)——一元回归模型
wang2008start

Hadoop/Spark推荐系统(三)——经常一起购买的商品

思路将每一个购买清单拆解成物品两两组合,计算每个组合出现的总次数。 与上一环节“购买了该商品的顾客还购买了的商品”区别之处在于: 购买了该商品的顾客还购买了的商品,input是用户为key,val...
21
ggwxk1990

大数据学习15:报错 FAILED: SemanticException Unable to determine if

大数据学习15:FAILED: SemanticException Unable to determine if报错:由于修改了hdfs 的端口,导致报错,这里是因为使用UDF自定义函数,hive要将...
24
eieiei438

大数据预科班作业10

大数据预科班作业10 1. 填空 Collection 接口的特点是元素是_________;List 接口的特点是元素_____(有 |无)顺序,______(可以|不可以)重复; Set ...
21
eieiei438

大数据预科班15

大数据预科班15 复习 集合Collection 顶级接口List--有序;可重复 ArrayList,LinkedList,Vector(线程安全)--stack; Set--无序;不可重复...
32
wsnbbdmm

记录采用cloudera-manager安装CDH集群的过程

本文主要记录了安装CDH5.6的安装过程。 本次安装是在VM虚拟机中安装,下面介绍下本次安装的软件环境 由于Cloudera-manager安装是对内存的要求比较高,没办法达到官网的要求。所以这次安装...
29
chongxin1

Eclipse提交代码到Spark集群上运行

Spark集群master节点:      192.168.168.200 Eclipse运行windows主机: 192.168.168.100 场景:         为了测试在...
29
weixin_39212776

python初学者应该知道的类、对象、集成器、多态

对象 类 继承        面向对象的设计思想是从自然界中来的,因为在自然界中,类(Class)和实例(Instance)的概念是很自然的。Class是一种抽象概念,比如我们定...
21
wuzhengfei1112

Kafka原理

功能与使用场景:特性、适用场景、 基本概念:Broker、Topic、Partition、Partition、Producer、Consumer、Consumer Group kafka模型:prod...
53
amkider

docker的四种网络方式

博客地址:http://blog.csdn.net/halcyonbaby bridge方式(默认) Host IP为186.100.8.117, 容器网络为172.17.0.0/16...
20
wang2008start

Hadoop/Spark推荐系统(二)——购买过该商品的顾客还购买了哪些商品

Stripes设计模式(k,k1) 3 (k,k2) 3 (k,k3) 2 (k,k4) 4 (z,z1) 1 (z,z2) 3 (z,z3) 2 (z,z4) 3 Stripes ...
20
qq_33968227

MATLAB下载安装

MATLAB下载安装下载R2010b 绿色免安装版 链接: https://pan.baidu.com/s/1eSvk4wi 密码: ubcs 2010b版 链接:http://pan.ba...
17
yangchunlu0101

TensorFlow深度学习

TensorFlow深度学习框架 Google不仅是大数据和云计算的领导者,在机器学习和深度学习上也有很好的实践和积累,在2015年年底开源了内部使用的深度学习框架TensorFlow。 ...
13
github_38885296

vSphere共享存储全配置流程

1、Openfiler的安装 Openfiler 由rPath Linux驱动,它是一个基于浏览器的免费网络存储管理实用程序,可以在单一框架中提供基于文件的网络连接存储 (NAS) 和基于块...
117
chongxin1

Spark代码Eclipse远程调试

我们在编写Spark Application或者是阅读源码的时候,我们很想知道代码的运行情况,比如参数设置的是否正确等等。用Logging方式来调试是一个可以选择的方式,但是,logging方式调试代...
63
Chengliangyao

hadoop master到slave1节点ssh配置完成后,scp出现permission denied

ssh配置完成后,scp 文件 到 Slave1:/home/hadoop,结果出现Permission denied,出现这种情况是hadoop用户没有该目录的权限,使用Slave1:/tmp就可以...
48
u011583316

Hadoop-datanode无法正常启动

菜鸟入门差点没吓着重装系统了!   一时手贱 搞了 Hadoop namenode -format  搞得我的datanode启动异常很苦逼,瞎弄了一晚上! 处理方法如下: ...
43
weixin_37511809

Python 排序

 Python list内置sort()方法用来排序,也可以用python内置的全局sorted()方法来对可迭代的序列排序生成新的序列。 1)排序基础 简单的升序排序是非常容易的。只需要调...
62
shilion163

一些有用的链接

(1)Ubuntu16.04+cuda8.0+caffe安装教程 (http://blog.csdn.net/autocyz/article/details/52299889)
40
wenxindiaolong061

Flume(NG)架构设计要点及配置实践

转自:时延军 http://shiyanjun.cn/archives/915.html Flume NG是一个分布式、可靠、可用的系统,它能够将不同数据源的海量日志数据进行高效收集、聚合...
43
Wee_Mita

Java面试笔试指南(七)---海量数据处理

通过对海量数据的挖掘能有效地揭示用户的行为模式,加深对用户需求的理解,提取用户的集体智慧,从而为研发人员决策提供依据,提升产品和用户体验,进而占领市场
63
ld326

大数据学习[07]:elasticsearch5.6.1集群与问题

摘要:elasticsearch5.6.1集群与问题总结前置接着上一篇:大数据学习[06]:elasticsearch5.6.1初探 前面只是感性地看了一眼elasticsearch,还未知道方向,...
479
shujiezhang

2PC,Raft和Paxos笔记

1. 用婚礼过程模拟2PC     牧师(协调者):新郎,你愿意…?     未婚男(参与者A):YES, I DO.     牧师(协调者):新娘,你愿意…?     未婚女(参与...
8
jingyi130705008

numpy中二维数组按照某列、某行排序

如何根据二维数组中的某一行或者某一列排序?可以利用numpy中的argsort函数进行实现,代码实例如下: data = data[data[:,2].argsort()] 由于argsort返回的是...
40
wangfengjunaaa

Kafka分区机制介绍与示例

Kafka中可以将Topic从物理上划分成一个或多个分区(Partition),每个分区在物理上对应一个文件夹,以”topicName_partitionIndex”的命名方式命名,该文件夹下存储这个...
58
Chengliangyao

Hadoop运行时JAVA_HOME is not set问题

出现这个问题是因为hadoop中没有指定jdk,进入hadoop目录下的etc/hadoo/hadoop-env.sh文件中在最后追加上 export JAVA_HOME=你的jdk路径即可
59
padluo

搜狗词库爬虫(1):基础爬虫架构和爬取词库分类

基础爬虫架构基础爬虫框架主要包括五大模块:爬虫调度器、URL管理器、网页下载器、网页解析器、数据存储器。爬虫调度器:启动、执行、停止爬虫,统筹其他模块的协调工作。URL管理器:管理已爬取的URL和未爬...
80
gendlee1991

0070 IntelliJ IDEA+Scala+Hadoop +Spark的开发环境搭建

IntelliJ IDEA+Scala+Hadoop +Spark的开发环境搭建,解决了遇到的各类问题。
44

必备
img python干货还有10秒到达!
讲师:Python资料

专家申请

img
杨尚伟

热爱技术 热爱分享

img
陈明

从事Android、Java Web开发4年,喜欢将新技术应用于实践并提高工作效率,有代码...

img
郑冬冬

厦门四信产品经理,无线传感网事业部技术负责人,负责LoRa、ZigBee等系列产品的开发工...

更多

官方博客

img博客搬家
img撰写博客
img专家申请
img意见反馈
img返回顶部