广告系统设计之分析

最新推荐文章于 2021-12-29 23:41:26 发布

追寻北极

最新推荐文章于 2021-12-29 23:41:26 发布

阅读量1.4k

点赞数

分类专栏： architecture

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/joeyon1985/article/details/38491503

版权

architecture 专栏收录该内容

426 篇文章 10 订阅

订阅专栏

使用Apache等日志做统计的弊端：

1,日志结构不易解析
2,HTTP头部参数可能缺失
3,客户端缓存导致漏记
4,混有无效的错误请求
5,日志的写并发不好，导致错记

统计系统的特点
1,高并发频繁写
2,原子性、非事务

难点：
1,少错漏
2,快入库
3,速统计

数据入库的解决方法：
1，单条日志有原子性，一致性要求不高
2，增加缓冲层，批量延迟入库
3，缓冲分为内存和文件两种，也可以将两种模式结合
4，在各级之间还可以调整流量，对内容进行校验纠错

统计需求的难点：
1,GROUP BY
2,ORDER BY
3,COUNT DISTINCT
4,JOIN

数据按热度分级
1,热数据放内存，做实时决策
2,温数据放在分布式文件系统，做模型迭代

3,冷数据高压缩率后存储，很少使用

参考：http://hugozhu.myalert.info/2013/02/28/the-evolution-of-online-advertsing-system.html

http://wenku.baidu.com/view/50a57cd17f1922791688e8c3.html

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄16年

474
原创

434
点赞

1634
收藏

792
粉丝

关注

私信

热门文章

分类专栏

最新评论

Redis各种数据结构内存占用测试
努力升级的小R: 如何快速插入100w数据的？
java 防止 XSS 攻击的常用方法总结.
保住发际线就算胜利: 为什么处理不掉<%= name%>这种类型？
使用Apache Benchmark做压力测试遇上的5个常见问题
FREE_MONSTER: 分享一下一个人经验：服务器在window上，redis在虚拟机上，通过shell走测试，我报了70007这个问题，按照这里的方式没有解决，最后打开页面自己手动访问，发现服务器500报错（这个错误只在抓包的时候可用看到，服务器没有打印），打开一看发现是java代码忘记输入redis密码。。。。。有一样的情况注意避坑！！！
常见硬盘IOPS参考值
蛋炒饭蛋炒饭qaq: 在线测试的是yellow网址？
常见硬盘IOPS参考值
学yi，知用: 看不到图形，为什么呢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。