前段时间看了个paper是讲述谷歌浏览器使用的压缩方法SDCH,其实原理还是比较简单的。
看了论文后就想总结一下程序中使用的一些共享方法或者技术吧。
1.Google最近发明的HTTP压缩算法SDCH
SDCH的全称是Shared Dictionary Compression over HTTP的简写。
SDCH的基于以下的事实:
(1)在HTTP的传输文件之间有大量重复冗余的数据,从服务器端一次又一次的传输到请求端。
(2)服务器端可以对这些文件之间的大量相同数据建立字典。
(3)客户端第一次访问时,请求字典与差异文件。之后每次访问,都只需要传输差异文件,结合本地的字典就可以还原相应文件。
2.HTTP中的压缩算法Gzip
Gzip中使用的算法是LZ77算法和哈夫曼编码,是单个文件内部文本信息的前后参照,共享信息实现压缩。
LZ77算法:如果文件中有两块内容相同,那么只要知道前一块的位置和大小,我们就可以确定后一块的内容。
(1) http://jiurl.yeah.ne http://jiurl.nease.net
(2) http://jiurl.yeah.net (http://jiurl.)nease(.net)
(3) http://jiurl.yeah.net (22,13)nease(23,4)
哈夫曼编码:是一种可变长度编码,实现最短的文本编码。其中,出现频率高的字符串使用短编码,出现频率低的使用长编码。
3.设计模式之单例模式、享元模式
java单例模式:http://www.cnblogs.com/xudong-bupt/p/3433643.html
单例模式是在系统中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问,从而方便对实例个数的控制并节约系统资源。
享元模式它使用共享物件,用来尽可能减少内存使用量以及分享资讯给尽可能多的相似物件;它适合用于当大量物件只是重复因而导致无法令人接受的使用大量内存。
4.数据库连接池
数据库连接是一种关键的有限的昂贵的资源,这一点在多用户的网页应用程序中体现得尤为突出。对数据库连接的管理能显著影响到整个应用程序的伸缩性和健壮性,影响到程序的性能指标。
数据库连接池正是针对这个问题提出来的。数据库连接池负责分配、管理和释放数据库连接,它允许应用程序重复使用一个现有的数据库连接,而再不是重新建立一个;释放空闲时间超过最大空闲时间的数据库连接来避免因为没有释放数据库连接而引起的数据库连接遗漏。这项技术能明显提高对数据库操作的性能。
5.格式信函发生器
看如下的精悍短小的垃圾短信:
上面这种就是所谓的格式信函发生器,中间的大部分文字是不变的,只有一小部分信息会更新。
编程中要是发送大量类似的邮件或者短信等就是这种情况啦。
6.布隆过滤器
布隆过滤器在一定意义上也可以说成是共享数据吧。布隆过滤去主要用在大量数据的过滤、判定存在等情况。
布隆过滤器中每个要过滤的对象或者字符串都会使用多个哈希函数的值置位同一个bit-vector。
举例说明:
有1百万个已经存在的URL,要求任意给定一个URL判定是否在为这1百万个URL中,错误率低于1%。这种情况就是布隆过滤器的典型应用。
设定n=1000000,bit-vector的位数为ver,哈希函数个数为k个,错误率为err。
所以布隆过滤器错误率为:
7.报表制作(模板)软件
ireport或者jasperreports是一个报表制作工具。
一般的网上看到的数据,有时候网站提供导出功能,如WORD/PDF/EXCEL等。
下图就是使用ireport制作的一个报表模板:
其中$F{BILLNO}是数据源中的一个字段,$P表示在生成报表时程序传入的参数,new java.util会显示打印报表时的系统时间。
下图是根据具体的数据源生成的报表:
8.面向对象程序设计语言中的继承
这个使用面向对象程序设计语言的码农都知道。
面向对象程序设计语言中的继承主要是用来减少子类的定义方法、变量的工作量,实现方法、变量的共享。