- hibernate 自带缓存的情况介绍
hibernate 提供了两种缓存,一个是基于对象主ID 的一级缓存和一个为缓存查询结果而设计的二级缓存(姑且叫作查询缓存),一级缓存是默认开启的, 而且似乎也是很难关闭的;查询缓存默认是关闭的,而在我的印象中则一直觉得这个东西是“ 没有价值的” ,至今没有看到典型的使用案例和使用模式。<o:p></o:p>
hibernate 提供的查询缓存,默认会去cache 所有的查询请求,而这对于常用的系统而言是完全没有必要的。大多数真正需要缓存的应用场景,往往是 数据量庞大,交互操作较多的系统,而一般真正需要缓存的数据只有少量的查询,如果所有的查询都缓存,缓存的效率会大大降低而且会浪费很多内存,可能效率还 不如不用缓存。例如javaeye 论坛的版面帖子列表,我们希望缓存的往往也就是每一个版的第1 ,2 页帖子,如果用户翻老帖子,则不去缓存。这种场景应该 是经常用到的缓存场景,而hibernate 查询缓存恰恰不能自动做到,这个就是我们将要讨论解决的问题。
- 我们会用多少的查询缓存?
一级缓存HibernateTemplate 只有load() 和get() 方法才会使用,如果您用的是list(..;) 或者其他的方法都是不缓存的。如果您的系统有内容审核这么一说(如只有审核通过的才能对外显示,删除的不对外显示等等),即使是提取一个帖子(可以用get() 的情形),你们组程序员提取数据的语句一般也会写成list(from XXXX where id = … and 状态 = 审核通过的) ,以图方便或者为了数据库连接可以为readonly 事务,这样hibernate 仅有的一级缓存也会被跳过,您的查询语句都是没有缓存的!这时候一个有效的查询缓存将会给你的系统带来巨大的性能提升。<o:p></o:p>
- 一般的应用场景与通用的查询缓存应该具备的功能
缓存的使用目的是为了提供性能,缓存的使用后果是数据将会有延迟。如果我们决心使用缓存,一般的应用场景应该具有如下特点:事务要求低,数据实时性要求低,并发量要求高,系统可扩展性要求高,机器硬件成本要求低,总之非常适合大面积的空间换时间设计方法并且对数据的完整/ 准确度要求不高。<o:p></o:p>
缓存还应该是通用的,应用系统只要配置下即可使用;不能每个系统都单独开发,这样也就没有讨论的意义了。<o:p></o:p>
对于要缓存的东西,往往应用本身而且只有应用本身了解什么情况下需要缓存,所以查询缓存应该提供接口,由应用提供解释,来描述哪些查询是需要缓存的,哪些是不需要缓存的。如对于论坛的版面帖子列表,应用可以告诉缓存模块:Java 版缓存第1 ,2 页的帖子,回收站不做缓存,其他版面缓存第1 页帖子列表,如果用户是登录用户则所有版面的帖子列表都不做缓存;只有这样才能真正的提高缓存的效率,降低缓存成本。<o:p></o:p>
- 一种基于域对象的缓存实现方式
针对前面的描述,偶做了一个实现,基于annotation 的定义(当然可以基于xml 配置或者基于数据库,然后可以在线的调试配置参数达到最优)。定义如下:
- @SuppressWarnings ( "serial" )
- @Entity
- @Cachable (interval=5)
- @UniqueCondition (combine = "id=?::limit=2000;word=?::limit=2000" )
- @QueryCondition (combine = "categoryId=?::limit=30::orderBy=id desc, parentCategoryId=?&&status=10" )
- public class SomeObject {
- private int id ;
- /**状态*/
- private int status ;
- private double symbolLength ;
- private String word ;
- private String symbol ;
- private int categoryId ;
- private int clickCount ;
- private int parentCategoryId ;
- @Id
- @GeneratedValue (strategy=GenerationType.AUTO)
- public int getId() {
- return id;
- }
- public void setId( int id) {
- this .id = id;
- }
- public String getSymbol() {
- return symbol;
- }
- public void setSymbol(String ipa) {
- this .symbol = ipa;
- }
- @QueryConditionIgnoreParseField
- public double getSymbolLength() {
- return symbolLength;
- }
- public void setSymbolLength( double length) {
- this .symbolLength = length;
- }
- public String getWord() {
- return word;
- }
- public void setWord(String word) {
- this .word = word;
- }
- public String authSignature() {
- return null ;
- }
- public int getCategoryId() {
- return categoryId;
- }
- public void setCategoryId( int categoryId) {
- this .categoryId = categoryId;
- }
- @CacheIngoreUpdateField
- public int getClickCount() {
- return clickCount;
- }
- public void setClickCount( int clickCount) {
- this .clickCount = clickCount;
- }
- public int getParentCategoryId() {
- return parentCategoryId;
- }
- public void setParentCategoryId( int parentCategoryId) {
- this .parentCategoryId = parentCategoryId;
- }
- public int getStatus() {
- return status;
- }
- public void setStatus( int status) {
- this .status = status;
- }
- }
各项定义解释:
- Cachable ,指定这个实体是要进行缓存的。interval=5 ,表示对象cache 5 秒失效。
- QueryCondition 为一般的查询缓存,指定那些条件下进行结果集cache ,如此处就是说当条件为cateogory= 某一个值,并且按照id desc 进行排序时cache 查询记录的前30 条(如果一页显示15 条,则缓存第1 ,2 页,第3 ,4 ,5 。。。不做缓存)。或者当条件为parentCategoryId=? 并且status=10 进行缓存,缓存不考虑排序字段,并且缓存所有结果。
- UnqiueConditon ,指定对象的唯一性条件,当满足这个条件时可以保证数据库只有一个对象,常见情形如用户表的username, nickName ,id 等。此处按照id 查询时进行缓存,最多缓存2000 条记录;如果按照word 字段进行查询,也进行缓存,最多缓存2000 条记录。如对于查询条件 id = 134343 and status = 10 ;cache 分析出含有记录唯一保证的字段id ,status 就可以暂时忽略,先通过id=134343 从cache 中读取记录,然后在利用好比反射的方 法查看对象的status 是否为10 ,如果是,就直接对象,不是返回null ;保证同一个对象尽量占用同样的cache 位置。
- CacheIngoreUpdateField 这个表示忽略的更新字段。因为clickCount 用户每次打开都会更新+1 ,如果此时刷新cache ,cache 也就可以撤消了。所以我们通过定义 这个标记,如果某一个update 操作只是更新了clickCount 字段,只更新数据库,cache 依然有效不做更新。等到Cachable 标记的 interval 让对象失效以后再更新,保证cache 的低刷新频率。
- QueryConditionIgnoreParseField 表示此字段不参与是否需要cache 的匹配,如此处的symbolLength ,只要标记了@ QueryConditionIgnoreParseField ,无论查询条件中有没有symbolLength 条件,都不影响查询缓存决定当前查询是否需要做缓存。
- Entity 为hibernate 的标记。
----编辑器看到的效果好像和显示的不一样,一直排不对版面:(