自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 对监控系统的一些思考

作者:姚仁捷,游族网络运维开发经理,负责运维数据方面的工作,希望能结合大数据和机器学习,帮助数据化运维体系的建设。之前曾经在唯品会,PPTV和eBay工作,主要负责实时计算和监控系统相关。 责编:郭芮,关注大数据领域,寻求报道或者投稿请发邮件guorui@csdn.net。另有「CSDN Spark用户群」,欢迎加微信guorui_1118申请入群,备注姓名+公司+职位。2011年、...

2016-11-29 13:49:51 1131

原创 国内第一次Flink Meetup线下活动精彩回顾

11月5日,第一次Flink Meetup线下活动在华为杭州研究所成功举办。本次活动是国内第一次Flink Meeup线下活动,主办方是华为中软大数据团队。本文由华为大数据技术专家时金魁撰写并授权转载。Apache Flink是当前比较优秀的流计算框架,当前Flink版本是1.1.3。Flink核心是一个streaming dataflow引擎,针对流式数据提供数据分布式和容错的分布式计算...

2016-11-11 13:53:11 742

原创 Just Waiting for You!个性化推荐带你领略不一样的算法之美

2016年,SDCC·中国软件开发者大会相继走进了上海、深圳、成都、杭州各地。11月18日-20日将在北京完美收官,届时年度最受欢迎的企业、讲师将在这里齐聚一堂,约百位讲师将围绕电商架构、编程语言、前端开发、微信开发、视频直播、推荐算法、Spark实践等方面,总结分享过去一年感触最深、最具参考价值的实践探索,并畅想未来,把脉市场发展先机,是软件开发者、广大互联网人士及行业相关人士最具价值的交流平台...

2016-11-10 11:29:29 654

原创 Spark:双十一风暴席卷而来!且看狂欢背后的大数据系统设计沉淀

2016年,SDCC·中国软件开发者大会相继走进了上海、深圳、成都、杭州各地。11月18日-20日将在北京完美收官,届时年度最受欢迎的企业、讲师将在这里齐聚一堂,约百位讲师将围绕电商架构、编程语言、前端开发、微信开发、视频直播、推荐算法、Spark实践等方面,总结分享过去一年感触最深、最具参考价值的实践探索,并畅想未来,把脉市场发展先机,是软件开发者、广大互联网人士及行业相关人士最具价值的交流平台...

2016-11-08 08:46:31 713

原创 Spark Streaming + ES构建美团App异常监控平台

作者:秦思源,美团·大众点评高级数据工程师。2014年加入公司,负责美团用户增长数据相关工作,有较多Spark、BI实践经验,现专注于用户增长、数据开发效率。王彬,南京大学研究生,2015年加入美团·大众点评 用户增长团队。负责搜索引擎营销、流量数据挖掘、报表数据开发等工作,现专注于Spark、ES。 本文为《程序员》原创文章,未经允许不得转载,更多精彩文章请订阅2016年《程序员》...

2016-11-07 09:50:00 2999

原创 FM, FTRL, Softmax

本文介绍FM(Factorization Machines)二分类器使用FTRL优化的算法原理,以及如何结合softmax改造成一个多分类器。我自己实现了该算法工具,取名为alphaFM,已经开源。最近公司内部举办了一届数据挖掘大赛,题目是根据用户的一些属性和行为数据来预测性别和年龄区间,属于一个二分类问题(性别预测男女)和一个多分类问题(年龄分为7个区间),评判标准为logloss。共有...

2016-11-02 15:42:22 758

原创 FM, FTRL, Softmax

本文介绍FM(Factorization Machines)二分类器使用FTRL优化的算法原理,以及如何结合softmax改造成一个多分类器。我自己实现了该算法工具,取名为alphaFM,已经开源。最近公司内部举办了一届数据挖掘大赛,题目是根据用户的一些属性和行为数据来预测性别和年龄区间,属于一个二分类问题(性别预测男女)和一个多分类问题(年龄分为7个区间),评判标准为logloss。共有...

2016-11-02 15:28:28 3930 3

原创 Alluxio李浩源:如何融合数据与内存速度

10月28日上午,“2016易观A10大数据应用峰会”主论坛《大数据基础框架设计——实时分析技术平台洞察与实践》,Alluxio创始人兼CEO李浩源受邀出席,并发表了“如何融合数据以内存的速度”的主题演讲。对于为什么要选择Alluxio,李浩源表示:第一,使得不同的数据中心的数据拥有内存级别的访问速度;第二,把不同存储数据虚拟化;第三,Scale-out架构;第四,目前主要提供的是文件系统...

2016-11-02 13:30:40 1388

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除