云计算/大数据
Milkcoffeezhu

Spark内核深度剖析

一、相关的组件以及名词    1、Application    2、spark-submit    3、Driver    4、DAGscheduler    5、taskscheduler    6...
10
Bolong_

java.lang.ClassNotFoundException: Class WordCount$TokenizerMapper not found

第二次实验在hadoop上跑WordCount时,遇到了让人头疼的问题:java.lang.ClassNotFoundException: Class WordCount$TokenizerMappe...
3
shujujiangtang

我们需要怎样的OLAP?

被狭义化的OLAPOLAP是商业智能应用中重要的组成部分,这个词从字面上理解是在线分析的意思,也就是由用户,特别是业务人员,面对数据进行各种分析操作。但是,现在的OLAP概念被严重狭义化了。说到OLA...
2
qq_33448670

kubernetes namespace 相关

一、创建命名空间[root@host197 redis]# kubectl create namespace c15000-webnamespace "c15000-web" cr...
6
qq_34160679

实现Hadoop完全分布式安装

本文实现三台服务器进行完全分布式Hadoop集群安装IP 主机名 功能角色 10.49.25.220  master(主人) namenode(控制节点)、JobTracker(工作分配) 1...
10
m0_37788308

百度AI 开放平台API调用

近来要了解自然语言处理方面的技术,拿百度API做个实验对,进行多次编码尝试最终成功调用。在本人博客百度API使用系列,使用python代码实现。涉及内容如下:1.    (一)百度AI 开放平台API...
7
QcloudCommunity

To B服务想做移动化?腾讯云案例了解一下

本文由 腾讯云助手团队 发布于 腾讯云云+社区| 导语:腾讯云那么多资源和服务,就不能手机管理吗? 能。 当用户在使用To B服务时,往往会遇到各种各样的限制:1、操作难度:涉及各种权限、多重验证确认...
7
lei278975868

经纬度100w数据快速排序elasticSearch、postgis、mongodb对比

环境:elasticSearch2.4.6版本 安装 head插件 ik中文分词器    条件:1000000 条数据 距离排序加上id排序. 耗时 0.096 秒环境:postgresql10 最新...
6
kwame211

零基础学SVM—Support Vector Machine(一)

如果你是一名模式识别专业的研究生,又或者你是机器学习爱好者,SVM是一个你避不开的问题。如果你只是有一堆数据需要SVM帮你处理一下,那么无论是Matlab的SVM工具箱,LIBSVM还是python框...
10
zhixingheyi_tian

hadoop 2.6 源码 解读之 DFSClient 中的 proxyInfo HA case 实现

在DFSClient 中 this.namenode = proxyInfo.getProxy(); proxyInfo 用于和NameNode通信的对象 在HA模式下 首先创建 fail...
4
eagleuniversityeye

Linux系统中安装Nginx

前言Nginx是一款用C语言编写的HTTP服务器,它有很多功能,详见Nginx入门。由于官方给的Nginx安装文件不是安装包,而是Nginx的源码文件,所以Nginx的安装和多数运行在Linux上的软...
8
byg666

vegas pro 14破解补丁

vegas pro 14破解补丁http://www.3322.cc/soft/37946.htmlvegas pro 14破解补丁是专门针对vegas pro 14软件而开发的一款绿色免费的汉化破解...
3
u014297175

Ambari Metrics System之后台报错client.AsyncProcess: #1, waiting for 4763 actions to finish

众所周知,目前AMS系统后台的指标数据存储采用的是HBase,不过只是一个拥有单个regionserver的简易版HBase,由于只有一台实际RegionServer,所以所有的读写请求都会指向这一台...
1
lilongsy

CentOS下pip pkg_resources.DistributionNotFound: The 'pip==1.5.4' distribution was not found ...

报错信息: pkg_resources.DistributionNotFound: The 'pip==1.5.4' distribution was not found and is req...
7
u011462328

Hive使用ORC存储的问题

类型问题: count distinct(case when num > 0 then id else null end) 问题 如果num<=0,就返回null,正...
1
u010010664

MR-java文章

1、使用ToolRunner运行Hadoop程序基本原理分析 2、Java命令行选项解析之Commons-CLI & Args4J & JCommander
6
lubin2016

Spark的运行架构分析(二)之运行模式详解

在上一篇博客  spark的运行架构分析(一)中我们有谈到Spark的运行模式是多种多样的,那么在这篇博客中我们来具体谈谈Spark的运行模式本博客转载自https://blog.csdn.net/g...
5
letterwuyu

ceph存储 pg归置组处于stuck以及degraded状态解决方案

https://blog.csdn.net/skdkjzz/article/details/42486793由于对ceph的兴趣,我们经常自己搭建ceph集群,可能是单节点,也可能是多节点,但是经常遇...
4
LemonGirls

Kibana插件开发(详解)

Kibana插件第一视角 补发2017.. 这篇是真的不水了 Kibana插件大概类型有 visTypes 视图组件,Visualize app 应用组件,如timeline hacks, ...
3
shuihupo

(二)百度AI 开放平台API调用之AccessToken的获取

近来要了解自然语言处理方面的技术,拿百度API做个实验对,进行多次编码尝试最终成功调用。在本人博客百度API使用系列,使用python代码实现。涉及内容如下:AccessToken获取自然语言API调...
3
lubin2016

Spark的运行架构分析(一)之架构概述

1:Spark的运行模式 2:Spark中的一些名词解释 3:Spark的运行基本流程 4:RDD的运行基本流程 一:Spark的运行模式         Spark的运行模式多种多样,灵活多变,部署...
2
LemonGirls

Elasticsearch Painless入门

Painless Painless is a scripting language developed and maintained by Elastic and optimized for ...
2
sp_ur

Linux下安装JDK

1.下载相应的jdk以及eclipse,放入宿主机和虚拟机共享的文件夹内2.在虚拟机下进入共享文件夹查看3.将jdk以及eclipse拷贝到 ~/Downloads4.将文件tar开5.移动到 /so...
7
LemonGirls

Kibana源码解读Timeline

timeline源码解读 补发2017 在路径..kibana-5.4.2/src/core_plugins/timelion下为timeline的源码。 fit-functitons fit...
1
LemonGirls

Kibana插件开发(基本环境搭建)

Kibana插件开发指南 2017补发… 本文档参考自以下资源 trumandu-tutorial timroes.de Kibana开发环境搭建 github上下载kibana的源...
3
houzhizhen

Hadoop 2.7.5 MapReduce JobHistoryParser

JobHistoryParser //historyFile: hdfs://localhost:8020/tmp/hadoop-yarn/staging/houzhizhen/.staging...
3
qq_33734225

Scala环境变量配置

Scala 安装Scala 语言可以运行在Window、Linux、Unix、 Mac OS X等系统上。Scala是基于java之上,大量使用java的类库和变量,必须使用Scala之前必须先安装 ...
6
h952520296

关于hdfs中的core-site.xml,hdfs-site.xml,mapred-site.xml文件配置详解

配置hadoop,主要是配置core-site.xml,hdfs-site.xml,mapred-site.xml三个配置文件,默认下来,这些配置文件都是空的,所以很难知道这些配置文件有哪些配置可以生...
2
kwame211

随机森林小结

1.算法原理:随机森林,是基于bagging的一种并行式集成学习方法,可以用来做分类、回归。随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由基学习器输出的类别的众数而定。通过自助法(boo...
8
makenothing

两种高效的服务器设计模式:Reactor and Proactor

IO 模型 《unix网络编程》(12)五种I/O模型中提到了五种I/O模型 我们都知道,为了OS的安全性等的考虑,进程是无法直接操作I/O设备的,其必须通过系统调用请求内核来协助完成I/O动作,...
6

预告
img 进军Web前端工程师
讲师:曾亮老师

专家申请

img
王天庆

中国电子学会(计算机分会)会员,获发明专利一项,发表论文若干。曾为微软中国打杂,也与朋友一...

img
李强强

李强强(泥瓦匠BYSocket),Spring Boot 系列博客及核心实战开源项目作者,...

img
张旭

河北工业大学,控制工程专业硕士,北京小白世纪科技有限公司深度学习算法实习生,即将入职智芯原...

更多

官方博客

img博客搬家
img撰写博客
img发布 Chat
img专家申请
img意见反馈
img返回顶部