关于大数据处理  多并发  存储  查找

很大的数据处理:
    分治法:进行小规模处理然后整合同步   这个无论是在数据拆分  分布式管理上都有应用  分布式有一个重要的技术就是:mapreduce  (hadoop有用这个技术,mapreduce是谷歌改良后的一个技术)
Map是分离,后进行函数处理    reduce是两两合并进行归一后得到最终结构   这样子的分离让后合并主要是为了并行的方便,方便利用分布式  提高数据处理速度,类型,灵活性扩展性,容错性,安全,同步性。
多并发:
     分布式:把并发分组在不同机器,模块上进行处理(连接,回复),然后协调,同步
             利用缓冲技术:可以是服务器缓冲(数据库缓冲)  本地缓冲
             1)同个链接可能会多次访问的共享数据进行缓存(局部性原理),这个想法参考了操作系统页面置换的思想
              P2P与c/S相结合减少服务器的负担

   多数据查找:
             用到数据结构方法来优化查找:如 哈夫曼树  哈希函数存储 查找树的:B+,B-数(利用查找树和静态序列查找结合利用在虚拟内存技术上有体现这个外存和内存的数据查找和装入上),平衡树
             配合缓冲技术:如最近访问原则等缓冲技术
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值