自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(78)
  • 资源 (21)
  • 论坛 (1)
  • 收藏
  • 关注

原创 一文彻底搞懂看似高深莫测的人工智能

欢迎关注鄙人公众号,技术干货随时看!  现在的互联网领域张口机器学习,闭口神经网络,三句不离深度学习(Oh,oh,oh!AI、DeepLearning更容易把人唬住。),外行人或甚至干了十多年的资深开发人员都会觉得触不可及,可能的原因大概是对人工智能认知的问题,大部分人都以为人工智能是指计算机真的像科幻片似的具有了像人类一样的思维意识,其实不然,而且永远也不会实现,读完本文对人工智能误解就会得...

2019-12-12 09:19:43 1545 2

原创 Elasticsearch查询参数batched_reduce_size的解释

欢迎关注鄙人公众号,技术干货随时看!  当我们使用Elasticsearch查询数据时,如果数据量非常大时,会命中大量分片中的大量数据,可能会造成集群内存异常,此时可以通过一个高级参数batched_reduce_size进行控制。使用方法如下:GET user_order/_search?q=user:kimchy&batched_reduce_size=256或者:POS...

2019-11-27 15:26:46 816

原创 理解Elasticsearch返回结果中命中数total值的具体含义

欢迎关注鄙人公众号,技术干货随时看!  自从Elasticsearch5.X进行了大改版以后,返回结果中命中数total值具体含义也变得复杂,可以说默认情况下total值不再确保准确。下面是查询时返回结果的格式: 1 { 2 "took" : 48, 3 "timed_out" : false, 4 "_shards" : { ...

2019-11-27 15:08:37 7768

原创 write.wait_for_active_shards参数和 refresh参数实现elasticsearch同步写入

  elasticsearch一般称为近实时的大数据处理引擎,为什么是近实时呢?原因是当我们提交索引数据时,实际上只是写到了Buffer里面,并不是立即可搜索的,最多需要等1秒才可搜索(index.refresh_interval由这个参数控制,可以通过动态API自定义设置,或在建索引时在settings里面设置),还有一点,当存在副本时,只保证主分片写入成功写入请求就会返回,此时搜索请求如果分配...

2019-08-26 15:46:05 27065 1

原创 图解---图和动态规划算法

  动态规划是一种算法设计思想或者说是一种编程思维,并非想快速排序、二分查找、选择排序这种具体的算法。一般应用于图论中,用来寻找“最短路径”。图模拟的是实体间的关系或连接,如网页链接、人们的社交关系,如下的图表示张三的人际交际图:  图由节点和边组成,一个节点可能与多个节点直接相连,这些节点称为邻居节点,张三李四的前驱节点,李四是张三的后继节点。在上面的人际关系图中李四、王五是张三的邻居(朋友...

2019-08-09 15:05:53 35868 1

原创 彻底理解Runnable和Thread的区别

  在实际工作中,我们很可能习惯性地选择Runnable或Thread之一直接使用,根本没在意二者的区别,但在面试中很多自以为是的菜货面试官会经常而且非常严肃的问出:请你解释下Runnable或Thread的区别?尤其是新手就容易上当,不知如何回答,就胡乱编一通。鄙人今天告诉你们这二者本身就没有本质区别,就是接口和类的区别。问出这个问题的面试官本身就是个二流子!如果非要说区别,请看如下:Run...

2019-07-30 09:45:42 49741 22

原创 很重要的编码技巧之霍夫曼规则

  编码在我们的生活中无处不在,常见的身份证号码、电话号码、物品的分类编码、商品编码等,有的编码只要求排他性即可,但有的编码需要遵循科学的规则。  霍夫曼编码的原理很简单:出现的频次越高,编码越短。这样做的原因是,当初发电文的资源宝贵和昂贵,可以节省资源和成本。现在电话号码的区号,依然遵循了霍夫曼原则,直辖市的通话量大,区号采用了3位数字,其他普通的地区采用了4为,如北京:010,济南:0531...

2019-07-02 14:03:44 15819

原创 深刻理解数据仓库

讨论的问题什么是数据仓库?为什么数据仓库一定要有建模? 数据仓库怎么建模?国内数据仓库常见的失败原因 目前发现的部分问题 数据中心探讨及建议什么是数据仓库?业内普遍接受的定义: 数据仓库之父比尔·恩门(Bill Inmon)在1991年出版的“Building the Data Warehouse”(《建立数据仓库》)一书中所提出的定义被广泛接受——数据仓库(Data War

2017-11-14 09:35:36 16274 2

原创 高性能搜索引擎sphinx源码解析之中文分词和mmseg

注:此文档基于sphinx及mmseg3代码整理,内容可能有疏漏,以后逐步完善术语:待分字符串:中华人民共和国 Chunk:中华,人民,共和国,为一条chunk(词组,item的组合) Item:中华,为一个item Sphinx分词器类包括四种:单字节字符集分词类器CSphTokenizer_SBCS,UTF-8字符集分词器类,N-gram,中文分词类CSphTokenizer_UTF8MM

2019-12-12 09:25:44 15572

原创 shell脚本中常用的几个特殊变量

$0 这个程式的执行名字$n 这个程式的第n个参数值,n=1…9$* 这个程式的所有参数,此选项参数可超过9个。$# 这个程式的参数个数$$ 这个程式的PID(脚本运行的当前进程ID号)$! 执行上一个背景指令的PID(后台运行的最后一个进程的进程ID号)$? 执行上一个指令的返回值 (显示最后命令的退出状态。0表示没有错误,其他任何值表明有错误)$- 显示shell使用的当前选项,...

2019-09-11 13:36:06 10900

原创 elasticsearch应用之大数据领域的三个核心问题

如何存储数据  传统的关系型数据库(Mysql,Oracle,Access等),主导了上个世纪的数据存储模式,但当数据量达到PB级,甚至TB级时,关系型数据库表现出了难以解决的瓶颈问题。为了解决海量数据存储和分布式计算问题,Google Lab提出了Map/Reduce 和 Google File System(GFS)解决方案,Hadoop作为其中一个优秀的实现框架迅速得到了业界的认可和广泛应...

2019-09-10 16:33:24 11776

原创 彻底理解Linux系统下文件的软链接和硬链接的区别

  最近有同事来问鄙人,通过ln命令创建的文件的软链接和硬链接到底有啥区别,使用起来功能上貌似是一样的,感觉都像是文件的一个别名而已,而且软链接用的居多。网络上流传的资料,大多都是胡扯级别的:软链文件与源文件内容不同、硬链接会创建独立的虚拟文件、inode不同或相同之类的。建立文件链接的目的一般是:当有多处使用同一个文件时,如果文件的位置或名称变更了,每一处都要随着更改,如果是使用软链接,则只需变...

2019-09-10 13:11:07 12197

原创 阿童木评三国之街亭之败

  建兴六年(公元二二八年),彼时南方已定,兵甲已足,诸葛亮上表,请命奖率三军,北伐中原,以图先帝刘备未完的统一大业。  诸葛亮亲统大军三十万,声势浩大,势如破竹,兵临渭水,直逼长安,南安、天水和安定三郡反魏附蜀,关中震动。情势危急之下,魏明帝曹叡拜请司马懿出山,此时诸葛大军屯兵祁山,司马懿令张颌统兵进攻祁山,街亭是军事重地,是阻挡魏军的军事要塞,街亭不失诸葛大军方可继续北进,街亭若失,蜀军危矣...

2019-08-23 17:40:38 11881

原创 成功之路散文连载之伪君子岳不群

  在金庸先生塑造的江湖世界里,凡大成者,皆是浪荡不羁,淡泊名利,但都胸怀侠义之心,以苍生为念。而那些所谓的名门正派,皆是带着君子面具的伪君子,金庸先生对这些伪君子都进行了猛烈的抨击,全面褒扬了真正的侠义之士。我们可以看出金庸先生的人生观:侠义之道在内心,不再外。  笑傲江湖世界里,岳不群可谓是金庸笔下塑造的最成功的伪君子,道貌岸然,为武林人士所敬佩,人称君子剑。岳不群为光大华山派,可谓机关算尽...

2019-08-23 13:48:14 11874

原创 成功之路散文连载之名师出高徒

  飞雪连天射白鹿,笑书神侠倚碧鸳。少年时代有金庸先生的江湖世界陪伴我们,我们是幸福的。小说、电视剧、电影等每一部作品中都穿插着作者或导演本人的人生观,或多或少,或隐或显,但不可否认。  在金庸塑造的江湖世界里,每位主角最后扬名天下,都是经过名师指点的,我们可以看出金庸先生的人生观:名师出高徒!  笑傲江湖里,华山派大弟子,令狐冲自幼师从君子剑岳不群,应该算是岳不群武功最高的弟子了,但终究不入...

2019-08-22 16:07:20 11718

原创 成功之路散文连载之笨人论

  水向低处流,人往高处走!我们从出生开始就时刻感受着贫富的差距、社会地位的悬殊,不管你是否意识到,承认与否,这个感觉伴随着我们成长而愈渐强列。  少儿时,我们立下童年志:像孙悟空一样上天入地;少年时,我们立下少年志:像杨过一样意外跌入一个山洞,然后练成盖世武功,天下无敌,不再被人欺负。  弱冠之年,我们逐渐从吴承恩的西游世界和金庸的江湖世界走进现实。鄙人出生于农村,成长于农村,死后定要埋于斯...

2019-08-22 13:54:05 11717

原创 论互联网公司技术团队Leader的重要性

  一个企业的失败,终究是人的失败!说什么市场饱和,国家政策问题,都不过是庸人自欺欺人的借口罢了!  鄙人从一个资深的码农走到今天的团队Leader,自认为有资格讨论Leader对团队的重要性,以及对整个公司发展的影响。...

2019-08-19 18:05:55 19588 1

原创 用户相关的常用搜索转化率指标

  作为代码界的老司机,除了开发新的业务需求,就剩优化代码了。但优化后的效果如何,会不会更差了,如何衡量呢?相信很多人都不知道,甚至根本没考虑过这个问题。作为企业最终追求的唯一目标是:利润!评价优化后的效果主要看:销售额和利润是否有提升! 如何把这个问题量化呢?本文主要讨论和用户相关的几种常用的搜索转化率量化指标,主要指标如下(包括app、pc、h5等所有用户渠道):搜索页面访问总PV次数。...

2019-08-01 16:34:35 20219

原创 elasticsearch常用接口和集群动态设置

查看接口,返回的结果是目录,也就是可用的URL节点,自己把每个节点试一次就基本上明白其用处了http://10.202.250.91:9200/_cat//_cat/shards/_cat/shards/{index}/_cat/master/_cat/nodes/_cat/tasks/_cat/indices/_cat/indices/{index}/_cat/segmen...

2019-07-05 10:22:28 15397

原创 离职原因之3B分类问题

  当我们准备离职时,几乎没人都会被问到离职的原因。我们把整个应聘流程分为三个阶段:第一阶段:电话沟通阶段,我们称为S1第二阶段:现场面试阶段,我们称为S2第三阶段:薪资和入职事宜沟通阶段,我们称为S3  我们可以依据离职原因这个问题,大概推测出您正在应聘的公司的品行(物以类聚,人以群分!我们推断的是问这个问题的人的品行,进而可以推断整个公司的品行!),我们可以进一步把公司归为三类:垃...

2019-05-31 09:32:58 15734 2

原创 elasticsearch重要但容易被忽略的几个参数设置

elasticsearch目前是业内应用最广泛的大数据存储、搜索和分析引擎。因为开源免费,笔者认为没有之一!笔者多年的开发经验,elasticsearch可以完成大数据实时搜索、海量数据存储(PB级)、BI报表产出(kibana)等大数据所需的绝大多数应用。如果你用elasticsearch存储TB级以下的数据,下面讲的几个参数,你可能根本不用关心,但PB级以上时就有必要关注了。比人下文所...

2019-05-06 18:10:04 16788

原创 org.elasticsearch.common.util.concurrent.EsRejectedExecutionException 查询超时异常处理记录---一定要用单例模式

elasticsearch client 即TransportClient(最常用的一个实现),一定要使用单例模式,不懂单例模式的自己去学!不用单例模式的代价是残酷的,鄙人作为开发经理,曾被一个二笔开发坑得一塌糊涂,原因就是这个二笔把client封装成了线程池(越是二笔往往越以为自己是大神,鄙人还没几个能自己写线程池的大神)!鄙人下面讲述下事故的过程。鄙认作为工学硕士,自知不才,但鄙人通读luc...

2019-04-22 18:43:18 18998 3

原创 hanlp源码解析word2vec词向量算法

one-hot表示法  词向量就是把一个词用向量的形式表示,以前的经典表示法是one-hot,这种表示法向量的维度是词汇量的大小。它的处理方式简单粗暴,一般就是统计词库包含的所有V个词,然后将这V个词固定好顺序,然后每个词就可以用一个V维的稀疏向量来表示,向量中只有在该词出现的位置的元素才为1,其它元素全为0。比如下面这几个词,第一个元素为1的表示中国,第六个元素为1的表示美国,第五个元素为1...

2019-01-29 15:21:49 16558 2

原创 elasticsearch 6.x 集群布署与head、Kibana和IK分词插件的配置

  首先准备三台linux服务器,在三台服务器上安装ElasticSearch.6.3,及其head、Kibana插件,插件只需安装在其中一台即可。elasticsearch 6.x以后变化有点的,head和Kibana,不能放在elasticsearch的 plugins、modules 目录下 也不能直接使用使用 elasticsearch-plugin install安装了。   第一步...

2018-07-23 12:49:27 16446 1

原创 centOS下安装rasa_core(亲自测试可行)

  本文讲解在python3.6下安装rasa_core,安装rasa_core不用再单独安装rasa_nlu。   首先要确保安装了gcc,g++,python3,pip本文不再详解,在下面的安装过程中如果提示少了哪些东西,安装上就可以了  第一步,安装conda   wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/A...

2018-07-18 17:57:06 16623

原创 linux系统lib64中的libc.so.6版本升级

  libc.so.6 是c运行时库 glibc的软链接,而系统几乎所有程序都依赖c运行时库。程序启动和运行时,是根据libc.so.6 软链接找到glibc库。删除libc.so.6将导致系统的几乎所有程序不能工作。   每个glibc.so文件有它支持的libc版本,可以通过 strings /lib64/libc.so.6 |grep GLIBC_ 查看,一定要选择这条命令列出的版本。如果...

2018-07-18 14:29:12 31686

原创 centOS系统gcc升级步骤(亲自测试成功)

  第一步,下载你需要的gcc源码,https://mirror.sergal.org/gnu/gcc/ 到这个地址去找就可以了。这里我们假设安装的是gcc-4.9.0.tar.gz      第二步,tar -xzvf gcc-4.9.0.tar.gz 然后 cd gcc-4.9.0      第三步,./contrib/download_prerequisites 这一步是下载所...

2018-07-18 11:37:17 25909 1

原创 论世界杯中的团队意识的重要性

  俄罗斯世界杯已进入1/4决赛阶段,四强尘埃落定,然而本届世界杯却被一些球迷(鄙人认为是伪球迷)称为是史上“最弱四强”,4支球队总共只拿过2次世界杯冠军。当初的夺冠热门德国、阿根廷、巴西、西班牙相继出局,意大利小组都没能出线!那么本届世届杯四强真的是“史上最弱吗,其实恰恰相反,本届四强是理所当然,史上“最强球队”,足球一团体运动,在团队意识面前个人能力何足挂齿!下面鄙人来分析下他们出局的根本原因...

2018-07-09 10:54:35 15822

原创 数据中心建设-赵建亭-专题视频课程

用形像、深刻、通俗的方式展示数据仓库的实质、数据中心建设的技术、建模的重要性及数据仓库建设失败常见原因分析

2018-06-26 16:49:58 230

原创 深度学习核心技术与实战视频教程-赵建亭-专题视频课程

该深度学习算法培训课程会教大家使用5W1H(what、why、when、who、where、how)方式来分析深度学习算法相关基础、卷积神经网络核心技术、应用领域等相关知识。然后通过经典的卷积神经网络模型LeNet-5来进行实战教学,深入浅出。...

2018-06-22 13:10:43 256

原创 实战神经网络-赵建亭-专题视频课程

详细全面讲解神经网络的核心技术及编程实现,包括前向传播,反向传播,参数初始化,梯度下降,隐藏层解密等神经网络核心技术。

2018-06-21 15:18:21 133

原创 神经网络三之权重参数的初始化技巧

  神经网络的结构是开发都自己定义的,主要包括神经网络的层数、每层的结点数、层与层之间的连接方式,神经网络的训练过程就是学习参数的过程,而刚开始训练时参数矩阵都是通过一定的方式生产的。下面分别介始常用的参数矩阵的生产方式基本原则  一般情况下较大的初始权重经过前向传播过程,到输出层的的输出信号也是较大的对一些激活函数如sigmod会过快的导致网络饱和,就会导致学习权重的能力下降,所以一...

2018-06-14 15:32:06 15926

原创 为什么损失函数多用交叉熵entropy来计算

  我们知道对于回归问题一般采用均方差来计算损失,这是因为回归输出的是一个实数,这样来计算一个batch中预测值与实际的均方差是自然而然的选择的,而且导数非常简单(神经网络参数的更新依据就是梯度也就是偏导),这里不再推导均方差的偏导。   但对于分类问题,输出的是一个n维的向量,向量的每个值是对应分类的概率,概率最大的就是预测的分类结果。样本的标签值也是一个概率分布,表情衡量两个概率分布之间的距...

2018-06-13 16:35:25 16777

原创 神经网络二之神经网络反向传播原理与python编程实现

误差  样本数据的真实值与神经网络的输出值之间的差值称为误差,当然一般不会直接使用直接的差值,常用的有回归算法的均方差、分类的交叉熵,这方面不影响我们来讨论神经网络的反向传播原理与过程,所以不做过多讨论。梯度下降  目前的神经网络层数可达百层以上,激活函数又是非线性的,很难用一个数学表达式来表达整个神经网络的输出,即使能够找一个数学表达式也是非常复杂,如果能够找到一个数学表达式我们...

2018-06-07 11:00:35 20867

原创 tensorflow滑动平均模型ExponentialMovingAverage的使用

  滑动平均模型可以在一定程度上提高最终模型在测试集或实际预测数据的准确性。神经网络中每层的参数矩阵W都建一个对应的影子变shade_w量,一般情况下每一批数据更新一次W,shade_w也会随着更新但更新的幅度小有W。影子变量更新值由下面的公式决定:   shadow_w = decay * shadow_w + (1-decay) * w shadow_w的初始值就是w的初始值,decay...

2018-06-06 12:16:41 15679

原创 tensolrflow中get_variable和tf.Variable区别

  先来看下二者的定义:    Variable:必须给定的参数只有一个initial_value,如果名字没指定会自己生成一个Variable:0类似于此 def __init__(self, initial_value=None, trainable=True, collections=None...

2018-06-04 18:00:49 15289

原创 神经网络一之神经网络结构与原理以及python实战

  本系列埔文由浅入深介绍神经网络相关知识,然后深入神经网络核心原理与技术,最后浅出python神经网络编程实战。通过本系列博文,您将彻底理解神经网络的原理以及如何通过python开发可用于生产环境的程序。本博文论讨神经网络的结构与原理   计算机所长:   了解计算机源理的人都知道计算机只适合做与之相匹配的任务(计算机只能执行0和1的二制机加法),如数学计算、绘制图表,目前的计算机每秒...

2018-06-04 13:05:29 18269 1

原创 hanlp关键词提取算法TextRank

  TextRank是在Google的PageRank算法启发下,针对文本里的句子设计的权重算法,目标是自动摘要。它利用投票的原理,让每一个单词给它的邻居(术语称窗口)投赞成票,票的权重取决于自己的票数。这是一个“先有鸡还是先有蛋”的悖论,PageRank采用矩阵迭代收敛的方式解决了这个悖论。引用自http://www.hankcs.com/nlp/textrank-algorithm-to-ex...

2018-05-24 15:44:05 20783

原创 java并发编程之CyclicBarrier原理分析与实例

  CyclicBarrier是栅栏的意思,线程要越过这个栅栏才能继续执行,但是必须是所有的线程到齐后才能一起越过这个栅栏。主要适用了两个或多个线程的线程组在预定的执行点进行等待,直达线程组中所有的线程都到达执行点再继续执行。   例如一个团队游戏,总共10人参加,其中有一个项目是跨越高墙,跨越高墙高墙后的项目是必须10个人一起参加,缺一不可。那么先跨过高墙的人必须等待。这10个人就相当于10个...

2018-05-22 13:22:06 15574

原创 java并发编程之CountDownLatch原理分析与实例

  CountDownLatch的原理与Semaphore是类似的,其内部是用一个计数器控制线程间的同步,也是通过一个AbstractQueuedSynchronizer中state来实现的,state是一个private volatile long类型的对象。CountDownLatch使用state来计数,CountDownLatch的getCount最终调用的是AbstractQueuedS...

2018-05-22 12:47:59 15624

Kibana7权威指南.pdf

Kibana是一个开源的分析和可视化平台,旨在与ElasticSearch完美结合。您可以使用Kibana来搜索、查看以及与存储在ElasticSearch中的数据交互。您可以轻松地执行高级数据分析,并使用各种图表、表格和地图可视化数据。 Kibana使理解大量数据变得容易。它简单、基于浏览器的界面使您能够快速创建和分享动态仪表盘(dashboard),这些仪表盘实时地以图标的形式显示ElasticSearch中数据的分布情况,也可以实时地对大数据集进行分析和产出BI报表。

2019-06-25

UNIX网络编程一全套源码

UNIX网络编程卷一:套接口编程的全套源码!是学习UNIX/LINUX网络编程的经典资料!

2011-07-01

msp430与NRF24L01无线通信程序

基于msp430与NRF24L01无线通信程序,注释的很清晰,是学习射频编程的不错资料!!!!!!!!!!!!!

2010-10-25

大数据知识平台构建 - 智能客服(技术分享).pdf

介绍了知识平台构建的背景、要素、步骤等内容,本文档是作者在一次技术大会上的分享课件,仅供参考

2019-06-19

solr5.3.1集群搭建教程-线上环境搭建

文档详细介绍了,布署solr-5.3.1的完整流程,按照此文档可搭建用于生产环境的高可靠性solr集群

2017-10-10

中文分词算法技术分享PPT

本文档是技术分享的PPT,详解深入讲解了三种中文分词算法,包知ik、mmseg、hanlp。文档中还分析了ik的岐义消除规则相关代码,以及hanlp最短路径算法原理及代码实现。

2017-07-27

STC89C51单片机高级参考程序

包括C语言,单片机嵌入式,汇编多种语方程序,程序均是高能程序员层次,是C51程序设计精通学习的优秀参考资料!1

2010-11-24

深入浅出struts2

深入浅出struts2,经典著作,高清PDF!

2015-06-18

stc89c51实例程序

包括多个实例程序,流水灯,串口实验,红外扩展实验,并附有详细的介绍.是学习单片机不错的入门资料

2010-11-23

基于MSP430的无线数据采集系统

本科毕业设计,资料完整,适合通信工程专业.内容:开题报告,英文翻译等.

2010-10-25

搜索引擎原理之sphinx技术分享-@赵建亭.pdf

本课件讲解了搜索引擎sphinx的原理、应用技术架构、中文分词等内容

2019-06-18

大数据spark企业级实战-813页完整高清版

在“One Stack to rule them all”理念的指引下,Spark基于RDD成功地构建起了大数据处理的一体化解决方案,将MapReduce、Streaming、SQL、Machine Learning、Graph Processing等大数据计算模型统一到一个技术堆栈中,开发者使用一致的API操作Spark中的所有功能;更为重要的是Spark的Spark SQL、MLLib、GraphX、Spark Streaming等四大子框架之间可以在内存中完美的无缝集成并可以互相操作彼此的数据,这不仅打造了Spark在当今大数据计算领域其他任何计算框架都无可匹敌的优势,更使得Spark正在加速成为大数据处理中心首选的和唯一的计算平台。 《大数据Spark企业级实战》详细解析了企业级Spark开发所需的几乎所有技术内容,涵盖Spark的架构设计、Spark的集群搭建、Spark内核的解析、Spark SQL、MLLib、GraphX、Spark Streaming、Tachyon、SparkR、Spark多语言编程、Spark常见问题及调优等,并且结合Spark源码细致的解析了Spark内核和四大子框架,最后在附录中提供了的Spark的开发语言Scala快速入门实战内容,学习完此书即可胜任绝大多数的企业级Spark开发需要。 《大数据Spark企业级实战》从零起步,完全从企业处理大数据业务场景的角度出发,基于实战代码来组织内容,对于一名大数据爱好者来说,《大数据Spark企业级实战》内容可以帮助您一站式地完成从零起步到进行Spark企业级开发所需要的全部核心内容和实战需要。

2017-12-25

hadoop案例精讲

包括官方教程,淘宝网图片存储架构,经验分享!

2015-06-18

基于elkb构建集约化日志管理平台.pdf

本课讲解了基于elkb(elasticsarch,logstash,kibana,filebeat)构建日志管理平台。

2019-06-28

STL C++开发指南

C++语言描述的STL源码剖析,值得一看

2014-11-04

linux c程序员指南

详细介绍了LINUX环境下C语言开发基础与高级编程技术,要点突出,是学习LINUX程序开发与进阶的不错资料!!

2010-12-14

stc89c51入门教程

详细讲解了STC89C51单片机的C语言编程基础及方法,是学习单片机的不错的入门资料.

2010-11-23

数据中心建设-@赵建亭.pdf

讲解了数据仓库的概念和数据仓库的架构,数据登台层、数据仓库层、数据集市层的概念及设计,以及数据中心和商业智能的探讨

2019-06-18

spark技术原理(精华版)~亚当.pdf

介绍了spark的技术原理、特征、rdd计算模型、任务调度原理等核心内容

2019-06-19

windows API大全

windows API,是WINDOWS程序员必不可少的工具!

2011-07-01

MSP430多机通信C代码

MSP430F1611单片机多机通信的串口UART C代码,程序已调试通过,数据传输稳定,无误码现像

2010-10-25

阿童木-atom的留言板

发表于 2020-01-02 最后回复 2020-01-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除