自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

u011263983的博客

07月 06月 05月

原创性能优化

spark core部分一：Spark性能优化核心基石1，Spark是采用Master-slaves的模式进行资源管理和任务执行的管理： a) 资源管理：Master-Workers，在一台机器上可以有多个Workers； b) 任务执行：Driver-Executors，当在一台机器上分配多个Workers的时候，那么默认情况下每个Worker都会为当前运行的

2016-07-25 10:01:40 995

原创 shuffle

一，到底什么事Shuffle？ Shuffle中文翻译为“洗牌”，需要Shuffle的关键性原因是某种具有共同特征的数据需要最终汇聚到一个计算节点上进行计算。二，Shuffle可能面临的问题？运行Task的时候才会产生Shuffle（Shuffle已经融化在Spark的算子中了）。1，数据量非常大；2，数据如何分类，即如何Partition，Hash、Sort、钨丝计划

2016-07-18 10:16:15 921

原创 spark 评估指标

评估指标1 Classification model evaluation1.1 二元分类 1.1.1阈值调整1.2 Multiclassclassification 1.2.1 Label based metrics1.3 Muitilabel classification1.4 Ranking systems2 Regression mo

2016-07-16 16:06:03 6807

原创 sparkStreaming_电商案例

数据生成：package com.java__SparkStreaming;import kafka.javaapi.producer.Producer;import kafka.producer.KeyedMessage;import kafka.producer.ProducerConfig;import java.util.*;/** * Created by Ad

2016-07-12 10:02:45 2280

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

漠小浅 CSDN认证博客专家 CSDN认证企业博客

码龄11年

IP 属地：北京市

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

21: 原创

24万+: 周排名

37万+: 总排名

9万+: 访问

: 等级

998: 积分

31: 粉丝

28: 获赞

8: 评论

78: 收藏

私信

关注

热门文章

分类专栏

最新评论

推荐系统_基于内容的推荐
攻城狮杰森: 顶你
推荐系统_基于内容的推荐
栗子7: 🐮🍺啊，哥哥！
面试
漠小浅回复 haungzhuwei: 还没有毕业啊，还有一年。本科学的是网络工程，研究生学的大数据，主要偏向于大数据开发，机器学习就是学习了一下，但是不深入，找工作主要偏向于大叔级开发。
面试
haungzhuwei: 楼主，你是刚大学毕业出来找工作的吗？而且是本科自学机器方面的知识？
面试
漠小浅: 58面试：自我介绍。hadoop中mapreduce的架构，项目介绍，这个问的比较细，怎么设计的（hbase，hive，mysql都是有什么作用，区别，hbase的rowkey设计）。还有一个问题就是你说说你熟悉的机器学习，跳几个来讲一下，然后又说你说一下深度学习，我把深度学习的起因到dnn到CNN说了一下，顺便提了一下RNN和LSTM和深度学习里面的无监督学习。 2面：问题：scala的不变性是什么？不会。介绍一下hadoop，mapreduce的流程，mapreduce里面到底是怎么进行排序的，例如2次排序，不用总结合着hadoop进行回答，kmeans算法原理及计算距离的方式。58同城里面有两个日志，怎么分组排序，需要reduce吗？二面基本都不会。。被问得受不了了，他要让我表达的理论上的，我都用编写代码的思想回答，很不满意。等问题忘了。面试官总结：加油，我感觉比较踏实，对工具和算法可以再了解的更加深入一些 hr面：自我介绍。研究的方向，求职的意向，最艰难的项目，怎么克服的，用了多久，印象最深的项目，身边有人拿到offer吗？为什么不选择考研考到985/211学校。学习成绩排名，为什么选择这个专业等等。忘了。绿盟1面补充：pagrank了解吗？网易1面补充：图的存储有什么？

最新文章

提示

确定要删除当前文章？

取消删除