自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 RxJava学习笔记(1) - RxJava简介

Rx即Reactive Extension, 是一个集观察者模式、迭代器模式和函数式编程的响应式编程模型,为开发者处理异步数据流提供了一致的编程接口。 Rx库最初由微软开发,目前由ReactiveX社区维护(http://reactivex.io/), 已支持几乎所有的流行编程语言。RxJava则...

2016-02-17 14:03:19

阅读数 1185

评论数 0

原创 移动网络广告优化(速度优化篇)

在之前的文章介绍到RTP实时竞价, 那对于移动/网络广告如何优化,提高用户的体验和满意度呢?一般而言,如果能做到下面三点,那这个广告在一定程度上是可以被接受的: 1.实用性。根据用户平时浏览,搜索的信息进行广告的精准投放。用户经常浏览体育信息说明这个用户很可能是一个年轻人,经常参加体育运动,因此...

2016-02-25 18:04:26

阅读数 1167

评论数 0

原创 入门的JAVA爬虫实现(附代码)

在写文章之前,我想先申明一下。我是一个刚刚开始学习JAVA的新手,所有我写的文章可能会很基础,而且还可能会出现一些低级错误,如果各位前辈发现任何错误,欢迎留言指出,小弟在此感激不尽。       首先,我和大家说一下我的思路。我是用的最简单的方法实现从网页上提取有用的信息的。 ①写一个类读取网页的...

2016-02-04 16:06:53

阅读数 1261

评论数 0

原创 手把手带你入门之Swagger UI

关于Swagger UI,从官网找来一段介绍。 简单的来讲, Swagger UI就是API文档生成和测试利器。 Swagger UI is a dependency-freecollection of HTML, Javascript, and CSS assets that dynamical...

2016-01-04 15:33:40

阅读数 16577

评论数 1

原创 Shiro集成Spring

本篇博客主要讲述的是两者的集成,不涉及到各自的具体细节和功能。 由于官方给出的文档不够详细,对新手而言通过官方文档还不能够很快的搭建出SpringShiro的web工程,本博客将通过实际的案例提供具体的教程。 案例分析:   项目名称:假期系统 组织机构:部门 > 小组 角色:Admin...

2015-12-22 16:22:57

阅读数 830

评论数 0

原创 Kraken项目中如何巧用Q.allSettled装饰nodejs代码的门面

若你是以krakenjs作为编写nodejs项目的框架, 这里简单介绍下models的概念。 Kraken将datamodels从controller逻辑中分离出来,从而能有cleaner更有条理的代码。Datamodels置于models文件夹中。当一个新的controller创建了,该框架也...

2015-12-22 15:33:44

阅读数 1459

评论数 0

翻译 《实体解析与信息质量》 - 4.1.3 优化选择操作符的精准性

EBDI的一个常见问题是优化集成选择操作符的精准性,事实上对一个来自不同数据源的属性而言既是一个问题也是一个机会。问题是选择哪个值,机会是通过获得更多的选择提高整合资源的整体精准性。如果至少有一个数据源提供正确的值,并且该值被选择了,那么组合数据源的精准性会超过任何一个单独资源的精准性。   ...

2015-12-09 09:16:03

阅读数 876

评论数 0

原创 python实现布隆过滤器对数据去重

一、直观的数据去重方式 通常我们采用如下算法对一组长度为n的数据d进行去重时。 S1.在数据中取出第x个数据(1≤x S2.在数据中取出第y个数据(x S3.比较d[x]和d[y],若相同丢弃d[y],重复S2,S3直到y=n S4.重复S1,S2,S3直到x=n-1   此算法时间...

2015-11-13 14:39:30

阅读数 3808

评论数 0

翻译 《实体解析与信息质量》 - 4.1.2 描述EBDI的形式化框架

这里给出的EBDI的形式化描述继承了上一章中ER流程的代数模型(Talburt,Wang, Hess, Kuo, 2007),该ER流程是为了实体引用集上的等价关系(Holland,Talburt, 2009; Talburt,Hashemi, 2008)所定义的。EBDI的形式描述始于一...

2015-11-11 18:02:03

阅读数 740

评论数 0

原创 Spring 定时任务quartz配置及代码示例详解

前段时间做公司项目,有个需求定期清理一些超过时限的文件。 谈到处理定时任务,quartz应该是目前比较成熟,使用较为广泛的java任务调度框架了,功能强大配置灵活,在企业应用中占重要地位。现在就跟大家一起学习下如何在项目中使用quartz。 首先了解下Quartz的背景     Quartz...

2015-11-05 16:47:55

阅读数 1234

评论数 0

原创 开源内存数据库H2 实现单元测试用例的独门独户

背景 部门逐渐规范代码质量,要求单元测试用例代码覆盖率要达到50%,所以最近大家渐渐养成了写单元测试用例的习惯。由于系统功能主要就是增删改查,所以当大家的单元测试用例使用同一个数据库时发生数据冲突,经常造成单元测试不通过的情况,影响了代码进度。所以对于每一个测试用例需要一个独立的数据库,这时候L...

2015-11-03 11:06:33

阅读数 4171

评论数 0

原创 基于WebDriver&TestNG 实现自己的Annotation @TakeScreenshotOnFailure

相信用过Selenium WebDriver 的朋友都应该知道如何使用WebDriver API实现Take Screenshot的功能。 在这篇文章里,我主要来介绍对failed tests实现 take screenshot的功能, 并且我们也高大上一回,做成注解的形式。   ...

2015-10-19 10:21:57

阅读数 1264

评论数 0

翻译 《实体解析与信息质量》 - 4.1.1 介绍

ER通常只是在比较大的基于实体的数据集成(EBDI)流程中的一个中间步骤。EBDI是整合和合理化与等价实体相关的信息集体的过程。每个引用可能只提供关于一个实体的一小部分信息,但是结合其他等价引用中的信息可以合并成一个更加全面的实体数据集。当然,等价引用所提供的一些信息可能是相同的属性,也就是既有正...

2015-10-16 16:57:28

阅读数 666

评论数 0

原创 敏捷/Scrum 之看板初体验

1.   看板简介 看板管理,常作Kanban管理(来自日语“看板”,カンバン,日语罗马拼写:Kanban),是丰田生产模式中的重要概念,指为了达到JIT(Just in Time, 及时生产)方式控制现场生产流程的一种工具。几乎每个学习丰田TPS(Toyota Production Syste...

2015-10-08 16:21:52

阅读数 4984

评论数 0

翻译 《实体解析与信息质量》 - 3. 1.6总结

Fellegi-Sunter模型是第一个基于记录链接的背景来建立关于实体解析的正式理论知识的尝试, 它同时也提供了关于构建和分析模糊匹配规则的实践指导。而SERF模型则是一个更加通用的ER模型,它并未预定义好关于引用是否等价的一系列方法,相应的,该模型将关注点放在为了确保ER系统的唯一输出原则,链...

2015-09-21 11:56:33

阅读数 769

评论数 0

原创 spring security 基础入门(配置详解)

Spring Security 是为Java EE项目提供全面安全服务的框架。支持基于配置文件,JDBC,LADP和自定义的验证方式。能够通过URL路径等途径提供安全服务。本文将介绍通过自定义的验证方式,通过URL拦截来使用springsecurity提供的安全服务。

2015-09-09 17:19:54

阅读数 8592

评论数 0

翻译 《实体解析与信息质量》 - 3.1.5复习题

完成复习题1,2,3需要以下信息:请访问ERIQ实验室站点(ualr.edu/eriq/)并下载数据集ListOne.txt,ListTwo.txt以及TruthFile.txt。 ListOne.txt包含284条记录,每条记录分别有两个字段: ·        字段1为记录号(1 到284)。...

2015-09-01 15:00:01

阅读数 490

评论数 0

原创 Tomcat 启动异常深度剖析

最近在使用tomcat 部署应用是遇到异常如下: Caused by: java.lang.IllegalStateException: Unable to complete the scan for annotations for web application [/xxxx] du...

2015-08-24 10:53:36

阅读数 6240

评论数 0

翻译 《实体解析与信息质量》 - 3.1.4 ENRES 元模型

为了更好的描述ER模型,Malin和Sweeny(2005)发表了一篇关于名为ENRES的语义上的框架的文章,该框架并不算是真正意义上的ER模型。 它是由实体,属性,以及属性值元组(队列)等概念构成。关于实体引用中的元组概念,我们已经在第一章中阐明。 模型中的属性根据语义被划分为以下三类: ·...

2015-08-24 10:13:31

阅读数 926

评论数 0

原创 AngularJS 从入门到精通(过滤器(Filter) )

过滤器(Filter),故名思议,源数据通过特定的规则,转换成需要的数据格式, 这个规则,我们统称为过滤器。 AngularJs 的Filter 功能非常强大,并且使用方便。它能够使得页面分组,查询,排序,以及数据转换等操作变的异常简单,同时还可以自定义过滤器实现更复杂的功能。 格式:{...

2015-08-19 15:03:46

阅读数 2789

评论数 0

原创 【LeetCode-面试算法经典-Java实现】【05-Longest Palindromic Substring(最大回文字符串)】

背景 最近开始研究算法,于是在leetcode上做算法题,第五题Longest Palindromic Substring便是关于回文子串的。 什么是回文字串 回文字符串是指将该字符串前后颠倒之后和该字符串一样的字符串。例如:a,aaaa,aba,abba… 最长回文子串 要求最长回文子...

2015-08-18 09:37:53

阅读数 1336

评论数 0

翻译 《实体解析与信息质量》 - 3.1.3 Algebraic模型

代数模型(AlgebraicModel) 尽管一个ER处理流程的实现存在着一定的复杂性,譬如在Fellegi-Sunter模型和Swoosh算法中所描述的,它的结果可以简单的用术语等价关系来描述,该术语是抽象代数中的基本概念(Rotman,2005)。代数模型首次提出作为一个方法来为实体解析实现...

2015-08-11 10:26:50

阅读数 1168

评论数 0

原创 程序猿(媛)Shell脚本必备技能之一: 在Linux下如何自动备份mysql数据

作者:荀彧(花名) Background:鉴于QAS数据库曾遭到毁灭性损害,极其桑心L。为了避免这种玉石俱焚的状况再度发生,于是我们找出了一种应对方案。这里给大家分享一下如何实现定时备份mysql数据库的脚本。   Target:每天对QAS数据库进行数据及表的备份并且删除掉10天之前的备份文件...

2015-08-10 09:26:08

阅读数 1132

评论数 0

原创 JAVA实现全角半角相互转化 (full2Half & half2Full)

说明: 1.全角:指一个字符占用两个标准字符位置。汉字字符和规定了全角的英文字符及国标GB2312-80中的图形符号和特殊字符都是全角字符。一般的系统命令是不用全角字符的,只是在作文字处理时才会使用全角字符。 2.半角:指一字符占用一个标准的字符位置。通常的英文字母、数字键、符号键都是半角的,半...

2015-08-07 09:45:38

阅读数 9474

评论数 0

原创 技术那么多,你想看看JSON Schema的测试吗?

目录 1. 什么是JSON Schema? 2. 如何定义一个JSON Schema 3. 如何测试JSON Schema a) 使用JSON Schema validator GUI b) 在Java code里使用JSON Schema validator 4.参考文档 ...

2015-08-05 14:06:39

阅读数 2186

评论数 0

翻译 《实体解析与信息质量》 - 3.1.2 SERF模型

斯坦福实体解析框架(SERF)是由HectorGarcia-Molina领导的研究小组(Benjelloun, Garcia-Molina, Kawai, Larson, Menestrina,Su, Thavisomboon, and Widom, 2006)在斯坦福信息实验室开发出来的。S...

2015-07-27 11:26:55

阅读数 923

评论数 0

原创 Spring @Transaction配置示例及发生不回滚原因深度剖析

背景 最近在公司做的一个项目,用的是SpringMVC框架,数据库用的是MySql,刚开始并没有加入事务,其实主要原因是本人没有使用过SpringMVC的事务。 问题的产生和解决 使用事务,直接问百度,我选择的是注解的方式。 在配置文件中配置事务管理器和驱动: ...

2015-07-24 16:13:49

阅读数 2520

评论数 1

原创 AngularJS 基础入门(指令篇)

一、介绍      AngularJS 是google 开发者设计的一个前端开发框架,它是由是由javascript 编写的一个JS框架。通常它是用来在静态网页构建动态应用不足而设计的。     AngularJS特点如下:     REST Client: RestFul 是主流的接口模...

2015-07-23 17:12:28

阅读数 1146

评论数 0

翻译 《实体解析与信息质量》 - 3.1.1 Fellegi-Sunter模型

Fellegi-Sunter模型 从历史上来看,政府人口普查、福利和税收统计计划是第一个解决实体解析问题的组织,他们开始尝试着汇总和总结大量的居民和企业信息。想要收集关于人口的精确数据,那么确定两条在不同的时间或者被不同机构所收集的数据记录是否为同一个实体就显得尤为的重要。1969年,在加拿大统计...

2015-07-20 11:20:41

阅读数 1957

评论数 3

原创 Java生产消费者模式之项目实践

浅谈生产消费者模式在项目中的一次应用案例

2015-07-15 16:01:55

阅读数 1105

评论数 1

原创 玩转单元测试之DBUnit

DBunit 是一种扩展于JUnit的数据库驱动测试框架,它使数据库在测试过程之间处于一种已知状态,如果一个测试用例对数据库造成了破坏性影响,它可以帮助避免造成后面的测试失败或者给出错误结果。

2015-07-14 09:35:53

阅读数 1838

评论数 0

翻译 《实体解析与信息质量》 - 3.1.0 概述

本章将要介绍三种ER模型,这些模型分别涵盖了ER流程的不同层面,相互之间进行补充。第一个也是最先被讨论的模型是Fellegi-Sunter模型,该模型讨论的是如何利用直接匹配进行等价引用链接的方法。为处理概率匹配下的等价匹配问题,Fellegi-Sunter模型还提供了一种特殊的算法。我们要讨论的...

2015-07-13 09:37:22

阅读数 941

评论数 0

原创 AWS之VPC、Subnet与CIDR

什么是CIDR? CIDR是英文Classless Inter-Domain Routing的缩写,中文是无类别域间路由,是一个在Internet上创建附加地址的方法,这些地址提供给服务提供商(ISP), 再由ISP分配给客户。CIDR将路由集中起来,使一个IP地址代表主要骨干提供商服务的几千个I...

2015-07-10 11:13:30

阅读数 5221

评论数 0

原创 Spring MVC原理及实例基础扫盲篇

最近 项目中刚接触了SpringMVC,就把这几天看的跟实践的东西写出来吧。 一、首先,先来了解一下SpringMVC到底是个什么样的框架? Spring Web MVC是一种基于Java的实现了Web MVC设计模式的请求驱动类型的轻量级Web框架,即使用了MVC架构模式的思想,将web层进...

2015-07-09 10:10:56

阅读数 2635

评论数 0

原创 实时竞价(RTB) 介绍(基础篇)

前言: 说到“实时竞价”大家一定都不陌生,那么为何现在实时竞价发展这么迅猛,当然这个主要得益于整体移动互联网环境的成熟,以及中国本地移动广告市场出现爆发式增长。那么究竟什么是实时竞价?这个流程是怎样的呢?下面会从业务角度做一个简单的介绍。   简介:   RTB模式是网络广告行业新型的购买模式,与...

2015-07-08 09:56:16

阅读数 5941

评论数 0

原创 初识ThreadLocal

最近公司在进行Java开发人员的招聘活动,其中有一道面试题是这样的:“请简单描述一下ThreadLocal类的作用。” 结果发现有很多的面试者没有听说过ThreadLocal或者听说过却不知道这个类究竟是用来做什么的。 因此这里写一篇博客来介绍一下ThreadLocal这个类。   在...

2015-07-07 14:15:26

阅读数 658

评论数 0

原创 《实体解析与信息质量》 - 2.2.1 复习题

1.      从财务的角度上如何定义“资产”?信息在哪些角度符合这样的定义?又在哪些角度不符合? 2.      信息质量的度量单位是什么? 3.      举例来说明这样一种情况:同一条信息在它的其中一个应用中具有较高质量,在另一个应用中的质量则较低。 4.      找到一篇关于信息质...

2015-07-06 09:59:48

阅读数 788

评论数 0

转载 java7中的ThreadLocalRandom

本文转载自:http://mabusyao.iteye.com/blog/1362826 今天早上看到一个关于java7中的ThreadLocalRandom的用法的帖子,说是比Math.Random()速度要快一倍,转过来学习一下 :   When I first wrote ...

2015-07-03 16:36:57

阅读数 1392

评论数 0

原创 边走边学Nodejs (基础入门篇)

1.什么是Node.js Nodejs ,或者node, 是一个基于ChromeJavaScript运行时建立的平台,用于方便地搭建响应速度快、易于扩展的网络应用。Node.js 使用事件驱动, 非阻塞I/O 模型而得以轻量和高效,非常适合在分布式设备上运行的数据密集型的实时应用。 Node.js...

2015-07-02 16:23:45

阅读数 1136

评论数 1

原创 获取两个字符串所有公共的子串算法

应用场景: 获取两个字符串所有公共的子串。 思路: 1. 先获取两个子串的交集              2. 遍历交集子串,从最短子串到最长子串 public static List getAllCommonSubStrings(String str1, String str2) ...

2015-07-01 17:38:23

阅读数 2591

评论数 0

提示
确定要删除当前文章?
取消 删除