基于网络的数据压缩

原创 2006年05月21日 17:22:00
从网络共享的方面看数据压缩
                                  陈航
                  北京林业大学信息学院   计算机系 100083
   
摘要:世界是一个统一的整体,同时我们的资源也是有限的,无论是水,还是其他的,都是我们生存下去的基础,所以我们号召大家节约资源,从自己作起。我们现在的数据压缩方面的研究目的是从本地计算机的角度来考虑如何节约我们的硬盘空间,但是这一点远远不能满足我们对压缩效果的要求,随着网络技术的高速发展,使得我们一整个网络的观点来看待我们需要的数据压缩变得越来越有可能,离我们也越来越近了。
关键字:压缩 网络
前言:虽然说现在的世界是一个信息的世界,但是数据冗余的情况是随处可见的,我们平时上网需要的搜索引擎,例如:baidu,Google,Yahoo等,虽然给我们带来了很大的便利,能提供我们所需要的信息,同时能很精确的找到网上的资源,但同时也见证了网络上有很多很大的数据冗余情况,一条相同的信息,一个完全相同的资源下载却有上万条的网站同时存在,而且提供下载,我们想想,如果这些机器的硬盘上面都有这些资源而且是独立的,我们是不是很浪费空间了,同时也浪费了我们的资源,从整个世界的观点来看,这一点是不可取的,虽然我们在研究先进的算法来单单从本地来解决本地硬盘的空间存储问题,但这毕竟是一个方面,如果我们从更高更加广阔的视野来考虑这个问题,也就是不从个人或者某个公司来考虑,而是从整个人类的观点来看待数据压缩,这比现在的效果要好得很多,但是这仅仅现在只是设想,当然我们在完善我们的网络的同时也要将这点考虑进去。
正文部分:
1 理论分析部分:
1.1效率低下的主要原因:(如图)
                           (图1.1)
1.2分析:我们可以免费的从网络上获取大量的绿色软件,也就是免费软件,大多数是某个公司或者编程爱好者为表现其实力来编写的,但是这种软件多数最初只有单独的一个服务器来提供下载功能,但是很多商业网站或者其他软件下载网站为了达到其自身的商业目的,也就是为了使得其点击率比较高也为此软件提供了上载功能,为我们提供方便快捷的同时也在使我们的资源在浪费。我们可以看看主要的浪费途径就是过程1和过程2,每个商业网站的服务器中都有这个软件。即使是软件所占的硬盘空间很少,但是由于商业网站服务器的数量很大,所以浪费也很大。
2.解决途径的分析:
2.1方法一:
把每个计算机看成独立的部分,没有连入任何的网络中,同时也没有得到任何的网络共享,所以单单改进我们压缩算法,编制高效率的压缩工具,这样我们就可以省下空间。
2.2方法二:
用网络方面的知识去思考.事实上也就是我们能不能为某个网络资源(用户需求量很大)在整个网络中只存在一份这种资源,或者有另外备份的一份,这样我们就可以得到很大的压缩比例.
3.具体事例分析:
3.1事例:我们用Visual Studio2005.net的文件来作为具体事例.首先我们用要进行分析.同时我们作几点假设,具体如下:
  1. 全球需要这个软件的用户是1000人.
  2. 同时有10000个网站提供这个软件的下载.
  3. 假设每个用户和网站都需要一份安装文件.
3.2方法一结果:
  用rar压缩后, Visual Studio2005.net(中文版)的大小是2.73G.解压后为大约为3G左右.
计算节约的空间:
   (3-2.73)*(11000) = 2970G   节省空间
但是全世界总共需要的存储空间:
   2.73*11000 = 30030G        实际存储空间
3.3方法二结果:
两份Visual Studio2005.net(中文版)为整个所网络共享.
计算节约的空间:
(3-2.73)*(2) = 0.54G   节省空间
但是全世界总共需要的存储空间:
2.73*2 = 5.46G         实际存储空间
3.4对比:
方法一:
全世界总共需要的存储空间: 30030G
方法二:
全世界总共需要的存储空间: 5.46G
压缩比例:
结果一:结果二 = 5500 : 1
3.5基于方法二的思考:
3.5.1实现条件:
1.需要数据不冗余的网络共享.
2.需要高效的网络环境.
3.解决在下载中的队列问题。
4.参考文献:
1.     笨笨数据压缩教程,
http://www.contextfree.net/wangyg/a/tutorial/benben/default.htm
2. 《计算机网络》吴功宜 编著 清华大学出版社 2003年
 
版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

网络爬虫--网页数据压缩(python deflate gzip)

转自:http://www.jianshu.com/p/2c2781462902 做项目就伴随着一个问题--数据来源。在网络数据获取的过程,考虑到数据的动态下载需要爬虫。这也是必经之路吧。 ...

Filter包装response,重写response的getWriter方法实现网络数据压缩

第一步:开发一个Servlet输出数据 ; import java.io.IOException; import java.io.PrintWriter; import javax.servl...

《从零开始搭建游戏服务器》 网络数据压缩——Zlib算法

前言:关于压缩算法,其实有不少,例如:ZIP、RAR和bzip2等,这里我们举例使用的Zlib相较于前者都要简单一些,与ZIP、RAR等归档算法不同,它与bzip2更为接近。那么,下面我们就来尝试一下...

数据压缩的文档

  • 2013-06-17 10:35
  • 86KB
  • 下载

【数据压缩】wav格式初学习

WAVE文件格式分析 Offset Size Name Description 0 4 ChunkId 四个字节,分别在ASCII表码中对应这”RIFF” 4 4...

多媒体数据压缩

  • 2014-06-07 12:02
  • 1.02MB
  • 下载

数据压缩原理与应用 DPCM编码

一.实验原理1.预测编码 本次实验采用的是DPCM编码,DPCM是差分预测编码调制的缩写,是比较典型的预测编码系统。 预测编码是利用信源相邻符号之间的相关性进行编码的一种编码过程,一般的图像前后像...

数据压缩与编码理论

  • 2015-09-22 16:45
  • 251KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)