自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 python实现布隆过滤器对数据去重

一、直观的数据去重方式 通常我们采用如下算法对一组长度为n的数据d进行去重时。 S1.在数据中取出第x个数据(1≤x S2.在数据中取出第y个数据(x S3.比较d[x]和d[y],若相同丢弃d[y],重复S2,S3直到y=n S4.重复S1,S2,S3直到x=n-1   此算法时间复杂度近似T(n)=O(1/2n²),空间需求为size(d)。 假设现有一组数据d,单条长度500

2015-11-13 14:39:30 5210

翻译 《实体解析与信息质量》 - 4.1.2 描述EBDI的形式化框架

这里给出的EBDI的形式化描述继承了上一章中ER流程的代数模型(Talburt,Wang, Hess, Kuo, 2007),该ER流程是为了实体引用集上的等价关系(Holland,Talburt, 2009; Talburt,Hashemi, 2008)所定义的。EBDI的形式描述始于一个集成环境的概念。该集成环境提供了一个明确的机制来描述一个信息源集合中的实体等价(ER部分)和属性等价

2015-11-11 18:02:03 962

原创 Spring 定时任务quartz配置及代码示例详解

前段时间做公司项目,有个需求定期清理一些超过时限的文件。 谈到处理定时任务,quartz应该是目前比较成熟,使用较为广泛的java任务调度框架了,功能强大配置灵活,在企业应用中占重要地位。现在就跟大家一起学习下如何在项目中使用quartz。 首先了解下Quartz的背景     Quartz是opensymphony组织专攻job scheduling领域又一个开源利器,可以到http://

2015-11-05 16:47:55 1429

原创 开源内存数据库H2 实现单元测试用例的独门独户

背景 部门逐渐规范代码质量,要求单元测试用例代码覆盖率要达到50%,所以最近大家渐渐养成了写单元测试用例的习惯。由于系统功能主要就是增删改查,所以当大家的单元测试用例使用同一个数据库时发生数据冲突,经常造成单元测试不通过的情况,影响了代码进度。所以对于每一个测试用例需要一个独立的数据库,这时候Lu同学经过研究发现了h2内存数据库,解决了之前的问题。   简介 H2是一个开源的内存数据库,支

2015-11-03 11:06:33 5004

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除