- 博客(2)
- 资源 (2)
- 收藏
- 关注
原创 MPP架构数据库优化总结——华为LibrA(MPPDB、GuassDB)
大数据在关系型数据处理这块,为了能够快速的查询、写入海量的数据,通常会采用MPP (Massively Parallel Processing)架构的分布式数据库。华为LibrA(MPPDB、GuassDB)与GreenPlum正是这样一款产品。通常实际生产环境中,每张表会存入海量的数据(例如我这里会有4TB、8TB、14TB等大小的表),为了解决这些存有海量数据的表的性能问题,需要给出很多优化方案,在这里我总结出工作中常用的一些优化手段。
2019-09-21 16:43:34 22492 4
原创 布隆过滤器(BloomFilter)——应用(三)
文章目录布隆过滤器(BloomFilter)——应用(三)1. 分布式爬虫2. 大型NoSQL数据库3. 电子邮件过滤布隆过滤器(BloomFilter)——应用(三)1. 分布式爬虫简介大型爬虫项目一般会采用分布式架构,以多个节点协作的方式进行,以达到快速、高效地爬取海量网页数据的目的。要进行协作,那就需要一个分布式中间件,用于相互通知。分布式爬虫项目一般将已经爬取的网址存储与中间件...
2019-09-11 12:36:34 3580
ProtobufForJavaAndWindows.zip
2019-08-22
KryoForJavaAndScala.zip
2019-08-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人