哈希表与布隆过滤器

一,背景问题

1.在使用Word文档的时候,word是如何判断某个单词是否拼写正确的?

2.网络爬虫程序,怎么让它不去爬相同的URL页面?

通过哈希表来查询(时间复杂度O(1))

3. 缓存穿透问题如何解决?

*描述缓存场景,为了减轻落盘数据库(mysql)的访问压力,在server端与mysql之间加入一层缓冲数据层(用来存放热点数据);

*缓存穿透发生的场景是server端向数据库请求数据时,缓存数据库(redis)和落盘数据库(mysql)都不包含该数据,数据请求压力全部涌向落盘数据库(mysql)

*数据请求步骤:如上2所示

*发生原因:黑客利用漏洞伪造数据攻击或者内部业务bug重复大量请求不存在的数据;

*解决方法:如上图3所示

 

二,需求

需要从海量数据中查询某字符串是否存在。

1. std::set 与 set::map

标准库中set和map结构都是菜用红黑树来实现,它的增删改查的时间复杂度是o(logN)

对于平衡二叉树,100万条数据组成的红黑树,只需要比较20次就能找到该值,对于10亿条数据需要比较30次;也就是比较次数根树的高度一致;

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值