大数据
文章平均质量分 77
新栋BOOK
经历过才知道有多美
展开
-
一次大数据量日志存储升级改造
现在我们处理日志的方案,一般比较成熟了,比如kafka elasticsearch这些技术,随着时间的前进,日志量也是暴涨,那么对我们的存储方案就是一个挑战,今天来说下我们遇到的问题及方案的调整。原创 2016-12-12 19:25:53 · 5361 阅读 · 0 评论 -
新栋BOOK教你学elasticsearch(一)-基本概念
我们要学习elasticsearch,必须要首先掌握一些基本的概念,比如什么叫索引index,文档document,映射mapping,节点node,副本等等。理解了这些基本概念是进一步学习的基础。原创 2016-12-27 22:42:24 · 489 阅读 · 0 评论 -
新栋BOOK教你学elasticsearch(二)-字段属性
学习一种数据库首先要了解这种数据库的基本术语概念,比如上一篇文章说的index、document等,再实际操作前还应该继续了解每个文档的具体字段类型,比如string、ip类型,以及这些属性的应用场景。再比如store的设置对实际查询的影响。原创 2016-12-27 22:44:10 · 1037 阅读 · 0 评论 -
新栋BOOK教你学Elasticsearch(三)基本索引和查询
elasticsearch的索引操作和查询操作,包括BoolQueryBuilder使用,在2.x版本以后已经废弃了FilterBuilders.andFilter()方法的使用。高亮操作,分页操作。原创 2017-01-07 13:31:49 · 1296 阅读 · 0 评论 -
基于大数据学习算法的优惠券预测模型
一、目标:预测买家是否会购买某类商品,然后将优惠券发给最有可能购买的人群,从而提升转化率和客单价。(转化率-从意向购买到实际付款;客单价-用户单次购物花费金额)二、分析:落实到算法模型上,包含两个核心的问题2.1、优惠券发给谁,即客户群选择客户群选择实际上是预测买家的购买倾向,并依据购买倾向的强弱来给出排序的结果,落实到学习模型层面来解决。这个过程我们要以用户的历史行为数据为基础,比如分析出他浏览过原创 2017-11-25 08:41:55 · 7394 阅读 · 2 评论