自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大黄_sama

安居成都,放眼世界,路漫漫其修远兮,吾将上下而求索

  • 博客(3)
  • 资源 (6)
  • 收藏
  • 关注

原创 某网站日志分析系统的项目架构

1、数据采集利用js代码在页面埋点,抓取信息到web服务器。2、从web服务器上汇集日志到hdfs(分布式文件系统),这里采取flume组件采集日志。flume可配置高可靠的,对数据进行脱敏、过滤,数据采集可以实时的,也可以定时采集到hdfs中。3、使用mapreduce计算框架清洗数据,处理得到点击流模型4、使用hive创建点击流模型表,这样可以使用hql进行更多维度统计

2016-09-15 00:27:43 1849

原创 线性判别分析(LDA)和主成分分析(PCA)

机器学习中的数学(4)-线性判别分析(LDA), 主成分分析(PCA)

2016-09-09 21:04:06 275 1

原创 Spark面对OOM问题的解决方法及优化总结

http://blog.csdn.net/yhb315279058/article/details/51035631Spark面对OOM问题的解决方法及优化总结

2016-09-09 21:02:05 254

presto-web查询工具.zip

presto-web查询工具,版本为yanagishima-18.0,亲测可以使用,既可以读presto也可以读hive数据库

2020-06-01

移动电商app交互式数据项目源码

中华石衫老师讲的spark项目源码完整版,注释清晰,里面有很多spark调优思想值得借鉴

2018-06-01

elasticsearch-sql-2.4.3.0.zip 插件 安装包

es-sql安装插件,先将该插件上传到服务器,然后离线安装,解决的在线安装因网络资源慢导致安装失败问题

2017-08-11

java3d源码

很好的java3D学习源码,大家多戳戳啊

2014-05-06

煤矿瓦斯题库

我们大概制作一个只针对瓦斯有关的危险因素的答题益智游戏。我们四个男生的任务是负责每块游戏的制作,你负责整个过程的策划和资料整理下面是你的任务:

2013-05-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除